2015年10月13日
摘要: 代码本身就是最好的解释,不赘述。文本聚类输出: cluster.py#!/usr/bin/env python# coding=utf-8import jieba,refrom gensim import corpora,modelsfrom sklearn.cluster import KMean... 阅读全文
posted @ 2015-10-13 15:38 星空守望者--jkmiao 阅读(810) 评论(0) 推荐(0)
摘要: 很简单,可是却也折腾了不是时间,走了不少弯路。在此备注记录一下,以供后需。# web_server.py#!/usr/bin/env python# coding=utf-8import os.pathimport tornado.httpserverimport tornado.optionsim... 阅读全文
posted @ 2015-10-13 15:32 星空守望者--jkmiao 阅读(1168) 评论(0) 推荐(0)
摘要: 文本信息提取方法有很多,最简单直接暴力的就是直接使用规则,利用python re模块的强大功能,已经可以满足大部分需求。而后可再逐步深入,利用HMM 或CRF 模型,提高准确率和召回率先上demo:#!/usr/bin/env python# coding=utf-8import jieba,sys... 阅读全文
posted @ 2015-10-13 15:25 星空守望者--jkmiao 阅读(3472) 评论(1) 推荐(1)