摘要:
代码本身就是最好的解释,不赘述。文本聚类输出: cluster.py#!/usr/bin/env python# coding=utf-8import jieba,refrom gensim import corpora,modelsfrom sklearn.cluster import KMean... 阅读全文
posted @ 2015-10-13 15:38
星空守望者--jkmiao
阅读(810)
评论(0)
推荐(0)
摘要:
很简单,可是却也折腾了不是时间,走了不少弯路。在此备注记录一下,以供后需。# web_server.py#!/usr/bin/env python# coding=utf-8import os.pathimport tornado.httpserverimport tornado.optionsim... 阅读全文
posted @ 2015-10-13 15:32
星空守望者--jkmiao
阅读(1168)
评论(0)
推荐(0)
摘要:
文本信息提取方法有很多,最简单直接暴力的就是直接使用规则,利用python re模块的强大功能,已经可以满足大部分需求。而后可再逐步深入,利用HMM 或CRF 模型,提高准确率和召回率先上demo:#!/usr/bin/env python# coding=utf-8import jieba,sys... 阅读全文
posted @ 2015-10-13 15:25
星空守望者--jkmiao
阅读(3472)
评论(1)
推荐(1)
浙公网安备 33010602011771号