描述:
小弟近日用 vc 调用word把html转成Txt格式,英文没问题,中文总是不成功,我想可能是语言设置问题,但又不知道如何解决,请高手指点一二。
解决方案1:
用别人的代码改成的一个函数,直接拿去用吧。这么调用:
GetHtmlText("http://www.sohu.com","F:\\11.txt");
BOOL CHtmlDlg::GetHtmlText(CString httpName, CString SavePath)
{
CInternetSession session;
CInternetFile* file = NULL;
try
{
file = (CInternetFile*) session.OpenURL(httpName);
}
catch (CInternetException* m_pException)
{
// 如果有??的?,置文件?空
file = NULL;
m_pException->Delete();
return FALSE;
}
CStdioFile dataStore;
if (file)
{
CString somecode;
BOOL bIsOk = dataStore.Open(SavePath,
CFile::modeCreate
| CFile::modeWrite
| CFile::shareDenyWrite
| CFile::typeText);
if (!bIsOk)
return FALSE;
while (file->ReadString(somecode) != NULL)
{
dataStore.WriteString(somecode);
dataStore.WriteString("\n"); }
file->Close();
delete file;
}
else
{
dataStore.WriteString(_T("Save Failed..."));
return FALSE;
}
return TRUE;
}
把HTML源文件中的"<" 和 ">"内容全部清掉不就是TXT文件吗?