摘要: 1、正则 2、正则加规则 3、tokenize + parsing (POS pasing词性标注 + dependence parsing依存句法分析 + semantic role labelling语义角色标注) 4、大语料,有标注数据,可尝试深度学习方法 阅读全文
posted @ 2018-03-16 14:10 lzp的bky 阅读(1487) 评论(0) 推荐(0) 编辑
摘要: 我们知道,在windows环境下直接保存的txt编码不是utf-8,有时候造成很多不便。用python3将文本用utf-8编码方式写入txt文件可以这样写: 阅读全文
posted @ 2018-03-06 10:16 lzp的bky 阅读(3528) 评论(0) 推荐(0) 编辑
摘要: 一个比celery更简单的python异步模块rq 阅读全文
posted @ 2018-01-12 14:59 lzp的bky 阅读(424) 评论(0) 推荐(0) 编辑
摘要: https://jsonlint.com/ 此网站直接黏贴要检测的json到框里,一键检查,定位到错误,非常实用。省去了自己用别的工具检测的麻烦。 阅读全文
posted @ 2018-01-05 18:25 lzp的bky 阅读(1527) 评论(0) 推荐(0) 编辑
摘要: 字符串的替换函数replace有一个坑, a = "123456" a.replace("6","7") print a 结果还是"123456" 看看replace函数的介绍, a = "123456" b = a.replace("6","7") print b 阅读全文
posted @ 2017-12-28 14:34 lzp的bky 阅读(16412) 评论(0) 推荐(1) 编辑
摘要: 今天使用python的os库的remove(path)函数删除文件,一直报错WindowsError: [Error 2],而这个错误是指该文件不存在。反复查看路径和文件名都没错,弄了半个小时都没弄清楚什么原因。后来终于发现没有写文件后缀名,没有后缀名就报错,囧。 阅读全文
posted @ 2017-12-11 12:32 lzp的bky 阅读(2010) 评论(0) 推荐(0) 编辑
摘要: mongodb documents使用的是BSON格式,优点是解析比较快。当我们想将mongodb documengts转换成JSON格式时,bson库有个十分简单的方法。 阅读全文
posted @ 2017-12-07 18:12 lzp的bky 阅读(1379) 评论(0) 推荐(0) 编辑