摘要:PS:此文章仅作为个人记录使用,代码属于私密,故无法公开; 以C++类classifier为例,文件保存于百度网盘 https://pan.baidu.com/s/1c2AwhaS(需密码) 系统:Ubuntu 15.04 参考资料: ubuntu源码安装swig 利用swig转换C++接口到Jav
阅读全文
摘要:@ 思路 利用java开源库dom4j解析.xml; dom4j操作xml - 读取xml,生成一个document实例; 获取xml文档的根节点元素,根据需求循环遍历子节点(此处遍历函数获取子节点的名称和值); @ code Github PS: Java的开源库iText中有XmlToTxt函数
阅读全文
摘要:@ 思路 @-@ 简要 根据尖括号将文件分隔成字符串,建立一套判断字符串是否为标签的标准,若不为标签则为文本内容,存入结果文件中; @-@ 详述 0. 建立两个哈希表: 哈希表1 unordered_set<string> - 存放“普通标签名字符串”:html, head, body, table
阅读全文
摘要:Github地址 函数: @ LPCTSTR与char *的转换 参考资料:TCHAR与char的互转 LPCTSTR会根据当前的字符集进行自适应:如果为ANSI,LPCTSTR = const char *;如果为Unicode,LPCTSTR = const wchar_t *; 但LPCTST
阅读全文