摘要: TF-IDF与余弦相似性的应用(一):自动提取关键词 转自:http://www.ruanyifeng.com/blog/2013/03/cosine_similarity.html 作者: 阮一峰 日期: 2013年3月15日 作者: 阮一峰 日期: 2013年3月15日 这个标题看上去好像很复杂 阅读全文
posted @ 2016-06-05 23:40 linjiaqin 阅读(751) 评论(0) 推荐(0) 编辑
摘要: 错误:'ascii' codec can't encode characters in position 0-1: ordinal not in range(128) 看到网上很多都不清楚,做了一天的实验,终于搞清楚这些原理 如果有错误请指出,谢谢,希望不要一开口就喷。 总结:理解3个概念,代码编码 阅读全文
posted @ 2016-06-05 22:09 linjiaqin 阅读(1661) 评论(0) 推荐(0) 编辑
摘要: 转自:http://www.gowhich.com/blog/147?utm_source=tuicool&utm_medium=referral 源码下载的地址:https://github.com/fxsjy/jieba 演示地址:http://jiebademo.ap01.aws.af.cm/ 阅读全文
posted @ 2016-06-05 21:03 linjiaqin 阅读(1020) 评论(0) 推荐(0) 编辑