会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
梳下鱼
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
下一页
2017年11月14日
工具分享: 中文实体标注工具
摘要: 发现了一款比较方便标注的工具https://github.com/jiesutd/SUTDAnnotator ,使用python2编写的界面,相对比较轻量,适合个人使用。但如果是团体使用的,还是web界面的会比较好。 运行Annotator_backup.py得到如下界面:open导入文件,选中要标
阅读全文
posted @ 2017-11-14 09:04 梳下鱼
阅读(9972)
评论(0)
推荐(1)
2017年10月18日
基于词向量匹配的对话系统 工程实践
摘要: follow:https://github.com/zake7749/Chatbot 这个台湾作者GitHub的代码和开发日志(如https://zake7749.github.io/2016/08/28/word2vec-with-gensim/ )将聊天系统所需的知识储备以及整个系统框架都描述得特别清楚,他的思路核心是:将用户输入的句子断成若干个词,通过词向量匹配预先设定的主题词,模板以及对...
阅读全文
posted @ 2017-10-18 17:41 梳下鱼
阅读(588)
评论(0)
推荐(0)
2017年10月10日
哈工大同义词词林 python 使用范例
摘要: 哈工大的同义词词林,应该是上个世纪的产物,里面的词比较老旧,但好歹也能用同义词词林的作用,跟word2vec的获取相近词函数比较类似,这两者发挥的功效比较,看具体的应用吧1. 首先下载包含同义词的txt,CSDN上有链接:http://download.csdn.net/download/answerme11/7307771 2. 得到txt的内容如下: 每一行由一系列的词条构成...
阅读全文
posted @ 2017-10-10 11:18 梳下鱼
阅读(15076)
评论(0)
推荐(2)
2017年9月21日
PyNLPIR python中文分词工具
摘要: 官网:https://pynlpir.readthedocs.io/en/latest/ github:https://github.com/tsroten/pynlpir NLPIR分词系统前身为2000年发布的ICTCLAS词法分析系统,从2009年开始,为了和以前工作进行大的区隔,并推广NLPIR自然语言处理与信息检索共享平台,调整命名为NLPIR分词系统。 ...
阅读全文
posted @ 2017-09-21 16:09 梳下鱼
阅读(7387)
评论(0)
推荐(0)
2017年9月20日
基于 bi-LSTM和CRF的中文命名实体识别
摘要: follow: https://github.com/zjy-ucas/ChineseNER 这里边主要识别的实体如图所示,其实也就主要识别人名PER,机构ORG和地点LOC: B表示开始的字节,I表示中间的字节,E表示最后的字节,S表示该实体是单字节例子: 实现架构:1. 读取数据集,数据集共三个文件,训练集,交叉测试集和测试集,文件中每一行包含两个元素,字和标识。每一句话间由一个空格隔...
阅读全文
posted @ 2017-09-20 14:12 梳下鱼
阅读(15078)
评论(0)
推荐(1)
2017年9月11日
初识Spacy
摘要: 之所以想接触Spacy,是看到其自称为工业级的应用,所以想尝试下windows下安装Spacy: 直接安装pip install spacy是会报错的 解决方法: 到 http://www.lfd.uci.edu/~gohlke/pythonlibs/ 下载spacy及其相关的包,挨个安装,最后安装spacy即可 安装成功: ...
阅读全文
posted @ 2017-09-11 17:07 梳下鱼
阅读(4076)
评论(0)
推荐(0)
2017年9月7日
Seq2SQL :使用强化学习通过自然语言生成SQL
摘要: 论文: https://einstein.ai/static/images/layouts/research/seq2sql/seq2sql.pdf 数据集:https://github.com/salesforce/WikiSQL Seq2SQL属于natural language interface (NLI)的领域,方便普通用户接入并查询数据库中的内容,即用户不需要了解SQL...
阅读全文
posted @ 2017-09-07 16:24 梳下鱼
阅读(6676)
评论(0)
推荐(0)
2017年8月25日
deep QA 基于生成的chatbot系统
摘要: deep QA: https://github.com/Conchylicultor/DeepQA 基于论文:https://arxiv.org/pdf/1506.05869.pdf 基于生成的chatbot系统,使用的是经典Seq2Seq的结构: 数据集: 数据集默认存储在项目中的data文件夹中, clone项目...
阅读全文
posted @ 2017-08-25 16:00 梳下鱼
阅读(2347)
评论(0)
推荐(0)
2017年7月7日
FAQrobot 聊天机器人笔记
摘要: follow: https://github.com/ofooo/FAQrobot 这是一个简单的基于问词匹配的自动问答,获取与用户问句Q1最匹配的知识库中的问句Q2,Q2的答案就是Q1的答案。首先需要准备一个知识库,在这个例子中,知识库以一个txt的形式存在,且主题是减肥1. 读取知识库 共18个与减肥相关的话题 2. 读取词向量(但是词向量在此处感觉没什么用的样子)3. 用户输入问句 ...
阅读全文
posted @ 2017-07-07 16:12 梳下鱼
阅读(1017)
评论(0)
推荐(0)
2017年5月31日
数据可视化入门之show me the numbers
摘要: 数据的可视化一直是自己瞎玩着学,近来想系统的学数据可视化的东西,于是搜索资料时看到有人推荐《show me the numbers》作为入门。 由于搜不到具体的书籍内容,只能搜到一个128页的PDF,且里面的内容是PPT加注释,倒也讲得蛮清楚的。但是由于此书的定位是给商科学生讲授图表展示,信息如何有
阅读全文
posted @ 2017-05-31 17:04 梳下鱼
阅读(1248)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
下一页
公告