上一页 1 ··· 4 5 6 7 8 9 10 11 下一页
摘要: 今天我来弄一个简单的关键词提取的代码 文章内容关键词的提取分为三大步: (1) 分词 (2) 去停用词 (3) 关键词提取 分词方法有很多,我这里就选择常用的结巴jieba分词;去停用词,我用了一个停用词表。具体代码如下: 运行结果: 阅读全文
posted @ 2018-06-10 18:06 彩印网 阅读(541) 评论(0) 推荐(0) 编辑
摘要: 主要是为了探究第三行为什么打印出很多提示信息,然后探究了下为什么有第三行这种写法,是因为 这个类中定义了def __getitem__(self, query),这样就可以类似于list那种用法了。但是这个类中并没有发现这个函数,还是在这个类的父类SimilarityABC中发现定义了这个函数。 接 阅读全文
posted @ 2018-04-12 17:45 彩印网 阅读(230) 评论(0) 推荐(0) 编辑
摘要: 整个机器人代码之前都是好好的,今天启动的时候,就报Initialization failed! 的错误,然后想着其他模块应该没有问题。然后单独运行或者叫测试吧,测试了下 search_eng.py,发现报Initialization failed! 错误,很高兴,问题一下子定位到了,但是还不知道是这 阅读全文
posted @ 2018-04-02 15:20 彩印网 阅读(151) 评论(0) 推荐(0) 编辑
摘要: Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。 许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。 编辑距离的算法是首先由俄国科学家Levenshtein提出的,故又叫Levenshtein Distance。 可 阅读全文
posted @ 2018-03-22 13:27 彩印网 阅读(209) 评论(0) 推荐(0) 编辑
摘要: python 计算程序运行耗时的好用的代码: 阅读全文
posted @ 2018-03-02 14:53 彩印网 阅读(293) 评论(0) 推荐(0) 编辑
摘要: 帮宣传下彩印网(www.caiyin.com) 有印刷,广告等等方面的需求就找这个网站吧,没错的。 天气预报在MongoDB中的天气预报的存储方式是: 就是每个地方的未来的七天的天气 这样就在本地存了个json文件了。有三个地区的天气。 接下来我们是从这个json文件读入,变成dict,代码如下 阅读全文
posted @ 2018-02-02 20:34 彩印网 阅读(2982) 评论(0) 推荐(0) 编辑
摘要: 注册了个账号,然后用python接口调用,如下是官方给出的python2的接口调用方式: 返回的数据是json格式:如下所示: 我自己机器是python3.6,所以需要把他的代码进行更改: 程序中的 #url_values = urllib.urlencode(data)url_values = u 阅读全文
posted @ 2018-01-30 17:51 彩印网 阅读(393) 评论(0) 推荐(0) 编辑
摘要: nohup python ChatReq.py 20000 >>log_cronjob.txt 2>&1 & 之前把nohup去掉,发现就算运行python ChatReq.py 20000 & 服务也时不时就over了。所以nohup是不能省略的。 参考: contab每秒执行脚本,然后将把标准错 阅读全文
posted @ 2018-01-29 13:42 彩印网 阅读(486) 评论(0) 推荐(0) 编辑
摘要: 注意 '+ str(jiqiren) + ' 要和r' 靠紧写。 这也验证了,正则表达式也可以写在txt里面,然后一行行读出来和r'配合。我们一起来见证下。之前搞了好久,这次灵感来了,分分钟解决 其中reg.txt的内容是 (你(.*?)(男|女))|(机器(.*?)(男|女))|((.*?)(男的 阅读全文
posted @ 2018-01-17 14:23 彩印网 阅读(4844) 评论(0) 推荐(0) 编辑
摘要: crontab -e 这个 我使用vim编辑,所以选择3,进入到 写了两条,的确隔了一分钟在test.txt文件夹里面会多加一条Good morning进去。而且也会执行dingshi.sh这个shell文件,这个shell文件是我自己写的。 那么/home/student/word2vec_rel 阅读全文
posted @ 2018-01-09 19:51 彩印网 阅读(145) 评论(0) 推荐(0) 编辑
上一页 1 ··· 4 5 6 7 8 9 10 11 下一页