上一页 1 2 3 4 5 6 7 ··· 28 下一页
摘要:原文链接:https://zhuanlan.zhihu.com/p/88938220 文本相似度计算方法有2个关键组件 文本表示模型:将文本表示为计算机可以计算的数值向量,也就是提供特征; 相似度度量方法:基于文本表示向量计算文本之间的相似度; 阅读全文
posted @ 2020-07-01 15:01 ZH奶酪 阅读(144) 评论(0) 推荐(0) 编辑
摘要:原文链接:https://mp.weixin.qq.com/s/ETnBeIIkusvdFc3a2J0QAA 以BERT为代表的预训练模型为自然语言处理领域带来了新的春天,在人机对话问题上也不例外。检索式多轮对话任务中,最有名的对话数据集就是Ubuntu Dialogue Corpus了,ACL20 阅读全文
posted @ 2020-06-04 10:03 ZH奶酪 阅读(121) 评论(0) 推荐(0) 编辑
摘要:父亲节:每年6月第三个星期日 #!/usr/bin/env python # -*- coding: utf-8 -*- import calendar month_number = 6 sunday_index = 0 date_value_index = 0 cal = calendar.Cal 阅读全文
posted @ 2020-06-03 10:24 ZH奶酪 阅读(166) 评论(0) 推荐(0) 编辑
摘要:母亲节:五月第二个星期日 #!/usr/bin/env python # -*- coding: utf-8 -*- import calendar month_number = 5 # 五月 sunday_index = 0 # 星期日 date_value_index = 0 cal = cal 阅读全文
posted @ 2020-06-03 10:21 ZH奶酪 阅读(81) 评论(0) 推荐(0) 编辑
摘要:加拿大感恩节是十月第二个星期一。 美国感恩节是十一月第四个星期四。 目前最流行的还是美国的感恩节,下边是计算美国感恩节的代码,改一下参数就可以计算加拿大感恩节了。 #!/usr/bin/env python # -*- coding: utf-8 -*- month = 11 thursday = 阅读全文
posted @ 2020-06-03 10:15 ZH奶酪 阅读(153) 评论(0) 推荐(0) 编辑
摘要:原文链接: https://mp.weixin.qq.com/s/UP1WjoJzDiGTBcMDoYZEUA 很多好文章! 阅读全文
posted @ 2020-05-23 18:37 ZH奶酪 阅读(71) 评论(0) 推荐(0) 编辑
摘要:原文链接:https://mp.weixin.qq.com/s/rf17rA0tBkD9elqF8nHhaw 本文介绍了NER的难点以及相应的解决方案,人机对话系统中的槽位标注也是NER任务,介绍的一些方法还是很有指导意义的。 难点1: 如何命名“命名实体” 何晗在《自然语言处理入门》一书中的总结如 阅读全文
posted @ 2020-05-23 18:34 ZH奶酪 阅读(313) 评论(0) 推荐(0) 编辑
摘要:作者每次部署更新都需要进行下列操作: 于是作者写了一个脚本,可以自动执行ssh以及登陆后的固定操作: 上述代码的关键就是在两个EOF之间,你可以ssh登陆后写自己需要的操作。 阅读全文
posted @ 2020-05-23 18:03 ZH奶酪 阅读(81) 评论(0) 推荐(0) 编辑
摘要:原文链接:https://amitness.com/2020/02/back translation in google sheets/ 基于Google Sheets提供的翻译功能,通过反向翻译来做文本数据增强: GOOGLETRANSLATE(GOOGLETRANSLATE(A2, "en", 阅读全文
posted @ 2020-05-23 17:57 ZH奶酪 阅读(90) 评论(0) 推荐(0) 编辑
摘要:ALBERT论文:https://arxiv.org/pdf/1909.11942.pdf 英文原文:https://amitness.com/2020/02/albert visual summary/ 译文链接:https://www.6aiq.com/article/1589833968655 阅读全文
posted @ 2020-05-23 17:28 ZH奶酪 阅读(162) 评论(0) 推荐(0) 编辑
摘要:原文链接:https://amitness.com/2020/05/data augmentation for nlp/ 译文链接:https://blog.csdn.net/u011984148/article/details/106233312/ semantically invariant t 阅读全文
posted @ 2020-05-23 10:36 ZH奶酪 阅读(453) 评论(1) 推荐(0) 编辑
摘要:原文链接:http://blog.sina.com.cn/s/blog_7ad48fee01019xhg.html 1. 面对问题,解决问题:避免“手里拿着榔头,看什么都像钉子”; 2. 系统的解决问题:切忌成为“没头脑”的工程师; 3. 站在用户的角度看问题:NL2SQL,用户掌握受限的自然语言比 阅读全文
posted @ 2020-05-22 10:26 ZH奶酪 阅读(68) 评论(0) 推荐(0) 编辑
摘要:原文链接:https://mp.weixin.qq.com/s/YkVPtdWQkY 5hyoQW26UPA 如何构建基本的对话系统? 人格化的定义及如何部分实现人格化 Conversation AI主要包括三个方向 第一个方向是Task Completion,这也是业界做的比较多的,包括客服机器人 阅读全文
posted @ 2020-05-10 20:31 ZH奶酪 阅读(138) 评论(0) 推荐(0) 编辑
摘要:原文链接:https://mp.weixin.qq.com/s/n1ASECUOWH7UY73yDiVaUg 口语理解 基于语义解析的口语理解模式,是将用户请求解析为所包含语义信息的结构化表达。其中,最典型的结构化表达是意图(描述用户的核心诉求)+ 词槽(描述意图的关键信息)的模式。常用方法有基于知 阅读全文
posted @ 2020-05-10 19:29 ZH奶酪 阅读(137) 评论(0) 推荐(0) 编辑
摘要:原文链接:https://mp.weixin.qq.com/s/vRsqMgBUI6Nv1ieFDx5jDQ 语言与知识的关系如下图所示。比如一句话可以算作语言,为了理解语言需要依赖大量的知识。 VUI + GUI 是主流。 VUI是IoT时代的主要交互方式。 云知声车载产品出货量 1000w+(2 阅读全文
posted @ 2020-05-10 19:12 ZH奶酪 阅读(253) 评论(0) 推荐(0) 编辑
摘要:这本书从产品、技术、运营多个角度,整体介绍了Chatbot生命周期中需求分析、数据处理、系统搭建、运营反馈等8个阶段以及为提升用户体验应有的多种能力。书中有很多不错的观点,比如: 1. 当前的人工智能更多的是解决系统1的部分,而难以解决系统2的部分。(系统1和系统2即《思考,快与慢》中的概念) 2. 阅读全文
posted @ 2020-04-25 22:25 ZH奶酪 阅读(272) 评论(0) 推荐(0) 编辑
摘要:目录 1. 专利 8 篇 2. 论文 4 篇 3. 获奖 3 项 1. 专利 专利名称:一种对话系统的训练数据选择方法 发明人:张贺;雷欣;李志飞 申请人:出门问问(武汉)信息科技有限公司 申请号:CN201910840420.3 申请日期:20190906 公开号:CN110543636A 公开日 阅读全文
posted @ 2020-04-25 12:12 ZH奶酪 阅读(247) 评论(0) 推荐(0) 编辑
摘要:内存分析 guppy:分析整个程序中每种数据类型占用的内存情况;(https://svenil.github.io/guppy pe/ ,https://smira.ru /wp content/uploads/2011/08/heapy.html) memory_profiler:逐行分析一个函数 阅读全文
posted @ 2020-04-24 20:30 ZH奶酪 阅读(456) 评论(0) 推荐(0) 编辑
摘要:思路:启动max_workers个workers(线程),每个线程处理一份输入数据。 如果自己统计,那还需要对下边的脚本进行扩展。 如果搭配grafana等监控工具使用,那压测脚本只负责疯狂发请求就好了。 阅读全文
posted @ 2020-04-16 16:58 ZH奶酪 阅读(226) 评论(0) 推荐(0) 编辑
摘要:原文:https://zh google styleguide.readthedocs.io/en/latest/google python styleguide/python_style_rules/ comments 分号 不要在行尾加分号, 也不要用分号将两条命令放在同一行. 行长度 每行不超 阅读全文
posted @ 2020-04-03 23:07 ZH奶酪 阅读(144) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 ··· 28 下一页