03 2020 档案
学习笔记(39)- 机器阅读理解的数据集和模型
摘要:今天整理了机器阅读理解的数据集和模型。只针对机器阅读理解任务。 资料 https://gluebenchmark.com/tasks https://github.com/CLUEbenchmark/CLUE https://www.cluebenchmarks.com/ https://githu 阅读全文
posted @ 2020-03-27 12:59 宋岳庭 阅读(395) 评论(0) 推荐(0)
学习笔记(38)- 安装SogouMRCToolkit
摘要:因为依赖gpu,机器比较贵,最近开始集中做这个实验。 经历了5次操作系统、显卡驱动、GPU、CUDA、CUDNN的选择,终于安装成功,可以运行了。一把辛酸泪。。。 操作系统 Welcome to Ubuntu 16.04.6 LTS (GNU/Linux 4.4.0 174 generic x86_ 阅读全文
posted @ 2020-03-25 17:32 宋岳庭 阅读(362) 评论(0) 推荐(0)
学习笔记(37)- CrossWOZ和ConvLab2
摘要:本文仅供学习使用 CrossWOZ清华大学CoAI实验室做的任务型中文跨域对话系统数据集,模拟北京游客进行酒店、景点、餐馆、地铁、出租车共5个领域进行对话。 文中详细介绍了多轮对话的NLU、DST、Policy、NLG各个模块。 提供了基准实验,基于ConvLab2和基于规则。 作者解读了自己的论文 阅读全文
posted @ 2020-03-19 08:17 宋岳庭 阅读(1570) 评论(0) 推荐(0)
学习笔记(36)-问答系统DrQA和BiQA
摘要:2019年调研过的问答系统 主要有: DrQA:开放域问答系统 BiQA:生物医疗领域问答系统,偏重机器阅读理解 DialoGPT:预训练语言生成模型 InsuranceQA:保险领域的问答系统,有中文的 BiQA Pre trained Language Model for Biomedical 阅读全文
posted @ 2020-03-10 21:25 宋岳庭 阅读(446) 评论(0) 推荐(0)
学习笔记(32)-对接微信公众号
摘要:几年前做过一次,忘了。 最近又有这方面的安排,再看看。 https://developers.weixin.qq.com/doc/offiaccount/Basic_Information/Access_Overview.html 参考 https://www.cnblogs.com/han108/ 阅读全文
posted @ 2020-03-09 21:44 宋岳庭 阅读(184) 评论(0) 推荐(0)
学习笔记(31)-python访问ElasticSearch
摘要:"阿里云文档" "elastic文档" 创建索引,参考 https://help.aliyun.com/document_detail/155919.html?spm=a2c4g.11186623.6.767.56c513e53sIJNr https://help.aliyun.com/docume 阅读全文
posted @ 2020-03-09 15:47 宋岳庭 阅读(353) 评论(0) 推荐(0)
学习笔记(30)- pandas笔记
摘要:``` import pandas as pd data = pd.read_excel('XX.xls') data.to_csv('words.txt', sep='\t') 第j列 data.iloc[:, j] 第i行 data.iloc[i,:] 赋值 data.iloc[2, 3] = 0.98 ``` 阅读全文
posted @ 2020-03-05 19:58 宋岳庭 阅读(100) 评论(0) 推荐(0)
学习笔记(19)- BioQA
摘要:Pre trained Language Model for Biomedical Question Answering Yoon, W., Lee, J., Kim, D., Jeong, M., & Kang, J. (2019). Pre trained Language Model for 阅读全文
posted @ 2020-03-05 15:50 宋岳庭 阅读(139) 评论(0) 推荐(0)
学习笔记(8)- 语料集:数据驱动的对话
摘要:可用的语料数据集:数据驱动的对话系统 A Survey of Available Corpora for Building Data Driven Dialogue Systems 阅读全文
posted @ 2020-03-05 15:45 宋岳庭 阅读(153) 评论(0) 推荐(0)
学习笔记(29)- 数据集-端到端的对话系统
摘要:只有明确了研究对象、了解目标,才能设计研究思路和方法。 所以我调研了端到端的会话系统的数据集。 A User Simulator for Task Completion Dialogues End to End Optimization of Task Oriented Dialogue Model 阅读全文
posted @ 2020-03-05 15:44 宋岳庭 阅读(562) 评论(0) 推荐(0)
学习笔记(27)- 语义搜索引擎-milvus
摘要:这几天写了代码和资料,博客没有及时更新。 补一个之前的milvus研究。 《基于语义向量的搜索实证》 https://mp.weixin.qq.com/s/nzxCb5I5ya ruoZF_4KzGQ 阅读全文
posted @ 2020-03-05 15:33 宋岳庭 阅读(416) 评论(0) 推荐(0)