这里就不在多说了。核心部分: 1 std::string HanziTable_impl2::HZsToPYsEx(const std::string &fHanzis, const bool fIsFisrt) 2 { 3 bool m_blnSimaple = false; 4 ... Read More
posted @ 2015-04-27 16:39 仙人球球 Views(916) Comments(0) Diggs(0) Edit
这种方法是使用C++来进行获取的。主要原理:新华字典网站数据采集,使用Qt的网络模块进行处理。准备:网站:http://xh.5156edu.com/pinyi.html工具:Qt5.4.1核心部分源码: 1 bool QMyNetwork::GetHtmlContent1(const QStrin... Read More
posted @ 2015-04-27 16:06 仙人球球 Views(622) Comments(0) Diggs(0) Edit
这种方法主要使用火车头采集工具来进行的。准备:火车头软件:LocoySpider_V8.6_Build20150323.rar(官方下载)网站:http://xh.5156edu.com/安装:安装火车头软件(默认安装)设置采集任务1.分组任务树中添加自定义分组和任务:2.在任务zidian3中进行... Read More
posted @ 2015-04-27 15:52 仙人球球 Views(926) Comments(0) Diggs(1) Edit
需要补充的有三个方面:1.新华字典数据获取方法1: 点击这里2.新华字典数据获取方法2:点击这里3.比较稳定的其它的汉字转拼音的方法:点击这里*注:由于内容较多3个部分分文3篇博客进行分别阐述。 Read More
posted @ 2015-04-27 15:20 仙人球球 Views(432) Comments(0) Diggs(0) Edit
以前写过了3个博文,都是关于汉字转拼音的,后来发现都不是很“完美”的解决方案,第一个和第二个利用的unicode编码的范围进行确定汉字的拼音,但是难免有遗漏,这个在后面的实践中发现的,后来第三个方法是穷举了汉字来获得汉字的拼音,虽然已维护好修改,但是我对于它里面包含的微型字库产生了疑虑,是否将所有汉... Read More
posted @ 2015-04-27 15:01 仙人球球 Views(11286) Comments(0) Diggs(1) Edit