随笔分类 -  a:NLP

摘要:原文链接:https://amitness.com/2020/02/back translation in google sheets/ 基于Google Sheets提供的翻译功能,通过反向翻译来做文本数据增强: GOOGLETRANSLATE(GOOGLETRANSLATE(A2, "en", 阅读全文
posted @ 2020-05-23 17:57 ZH奶酪 阅读(251) 评论(0) 推荐(0) 编辑
摘要:ALBERT论文:https://arxiv.org/pdf/1909.11942.pdf 英文原文:https://amitness.com/2020/02/albert visual summary/ 译文链接:https://www.6aiq.com/article/1589833968655 阅读全文
posted @ 2020-05-23 17:28 ZH奶酪 阅读(735) 评论(0) 推荐(0) 编辑
摘要:原文链接:https://amitness.com/2020/05/data augmentation for nlp/ 译文链接:https://blog.csdn.net/u011984148/article/details/106233312/ semantically invariant t 阅读全文
posted @ 2020-05-23 10:36 ZH奶酪 阅读(1681) 评论(1) 推荐(0) 编辑
摘要:原文链接:https://yq.aliyun.com/articles/579119 视频链接:https://yq.aliyun.com/video/play/1390 作者:高杰 发布时间:2018 04 10 13:26:49 阿里巴巴机器智能实验室语音交互组大概是在3年前正式成立的,语音交互 阅读全文
posted @ 2019-12-12 14:56 ZH奶酪 阅读(560) 评论(0) 推荐(0) 编辑
摘要:原文链接:https://yq.aliyun.com/articles/431857 作者:海青 发布时间:2018 02 05 15:14:04 生态领域的思考 随着人工智能在全球领域的持续高涨,chatbot人机交互作为其中一个分支在智能助理、智能服务、IOT等领域进了白热化竞争态势,从全球大公 阅读全文
posted @ 2019-12-11 22:52 ZH奶酪 阅读(1151) 评论(0) 推荐(0) 编辑
摘要:原文链接:https://yq.aliyun.com/articles/582193 作者:孙健 发布时间:2018 04 17 10:20:43 本次的分享主要围绕以下四个方面: 1. 传统交互到对话交互的本质改变是什么? 2. 正在发生的变革:AI正在重构B C的关系模式 3. 智能客服在阿里的 阅读全文
posted @ 2019-12-11 17:35 ZH奶酪 阅读(524) 评论(0) 推荐(0) 编辑
摘要:原文链接:https://yq.aliyun.com/articles/144035 作者:孙健/千诀 发布时间:2017 07 26 11:11:15 传统互联网最典型的特征就是连接。 智能设备的快速发展正在改变着人和设备之间的交互方式。 无论是用户的接受度,还是智能设备的快速发展和普及,都在促使 阅读全文
posted @ 2019-12-11 17:06 ZH奶酪 阅读(315) 评论(0) 推荐(0) 编辑
摘要:原文链接:https://yq.aliyun.com/articles/105686 作者:阿里技术 发布时间:2017 06 19 11:23:05 聊天机器人按照产品和服务的类型主要可分为:客服,娱乐,助理,教育,服务等类型。 在2016年的双十一期间,阿里小蜜整体智能服务量达到643万,其中智 阅读全文
posted @ 2019-12-11 16:38 ZH奶酪 阅读(412) 评论(0) 推荐(0) 编辑
摘要:原文链接:https://yq.aliyun.com/articles/8301 作者:李永彬 发布时间:2016 03 17 16:37:47 自然语言理解(Natural Language Understanding,NLU)以语言学为基础,融合逻辑学、心理学和计算机科学等学科,试图解决以下问题 阅读全文
posted @ 2019-12-11 15:51 ZH奶酪 阅读(524) 评论(0) 推荐(0) 编辑
摘要:原文链接:https://yq.aliyun.com/articles/686899 / https://yq.aliyun.com/articles/686727 作者:李永彬 发布时间:2019 01 15 09:32:53 为什么要做一个平台(对话工厂,Dialog Studio)? 生活中存 阅读全文
posted @ 2019-12-11 15:49 ZH奶酪 阅读(404) 评论(0) 推荐(0) 编辑
摘要:原文链接:https://yq.aliyun.com/articles/158691 作者:李永彬 发布时间:2017 08 04 10:53:48 本文主要结合NUI平台中自然语言理解的具体实现,详细的、系统的介绍意图分类和属性抽取两个核心算法。 自然语言理解的难点 语言的多样性 我要听大王叫我来 阅读全文
posted @ 2019-12-11 15:46 ZH奶酪 阅读(795) 评论(0) 推荐(0) 编辑
摘要:Homepage/演示网站:https://pair code.github.io/facets/ Pypi:https://pypi.org/project/facets overview/ Github:https://github.com/PAIR code/facets 1. 什么是Face 阅读全文
posted @ 2019-11-25 22:26 ZH奶酪 阅读(1197) 评论(0) 推荐(1) 编辑
摘要:面试题 https://www.cnblogs.com/CheeseZH/p/11927577.html 其他 大数据相关面试题 https://www.cnblogs.com/CheeseZH/p/5283390.html 最大熵模型源码 维特比算法源码 维特比算法2 softmax/交叉熵/dr 阅读全文
posted @ 2019-11-25 15:44 ZH奶酪 阅读(689) 评论(0) 推荐(0) 编辑
摘要:求职目标:NLP工程师 为什么想换工作? 毕业之后,除了技术相关书籍,我没读过太多其他类型的书,其中有一本内容短但是对我影响特别大的书——《谁动了我的奶酪》。出门问问是我毕业后的第一份工作,无论是工作内容还是团队氛围,我很满意在出门问问的工作,但是考虑到自己已经在出门问问工作了将近3年半,一直在从事 阅读全文
posted @ 2019-11-25 15:33 ZH奶酪 阅读(9069) 评论(5) 推荐(0) 编辑
摘要:如何用textgenrnn处理中文 1. 什么是textgenrnn? textgenrnn是建立在Keras和TensorFlow之上的,可用于生成 和`词级别`文本。网络体系结构使用注意力加权来加速训练过程并提高质量,并允许调整大量超参数,如RNN模型大小、RNN层和双向RNN。对细节感兴趣的读 阅读全文
posted @ 2018-07-22 18:28 ZH奶酪 阅读(2565) 评论(0) 推荐(2) 编辑
摘要:1. 什么是编辑距离? 编辑距离(Edit Distance),又称Levenshtein距离,是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。一般来说,编辑距离越小,两个串的相似度越大。 举个例子,给定 2 个字符 阅读全文
posted @ 2018-04-13 16:45 ZH奶酪 阅读(897) 评论(0) 推荐(0) 编辑
摘要:1. 什么是TF IDF tf idf(英语:term frequency–inverse document frequency)是一种用于信息检索与文本挖掘的常用加权技术。tf idf是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现 阅读全文
posted @ 2018-03-25 15:55 ZH奶酪 阅读(11686) 评论(5) 推荐(3) 编辑
摘要:依存句法分析   依存语法 (Dependency Parsing, DP) 通过分析语言单位内成分之间的依存关系揭示其 。 直观来讲,依存句法分析识别句子中的 这些语法成分,并分析各成分之间的关系。 例如,句子 依存句法分析结果(via "哈工大LTP" ):  &e 阅读全文
posted @ 2016-08-13 17:08 ZH奶酪 阅读(40489) 评论(3) 推荐(3) 编辑
摘要:首先处理大数据的面试题,有些基本概念要清楚: (1)1Gb = 109bytes(1Gb = 10亿字节):1Gb = 1024Mb,1Mb = 1024Kb,1Kb = 1024bytes; (2)基本流程是,分解大问题,解决小问题,从局部最优中选择全局最优;(当然,如果直接放内存里就能解决的话, 阅读全文
posted @ 2016-03-16 14:20 ZH奶酪 阅读(27220) 评论(6) 推荐(2) 编辑
摘要:英文链接:http://scikit-learn.org/stable/auto_examples/applications/topics_extraction_with_nmf_lda.html 这是一个使用NMF和LDA对一个语料集进行话题抽取的例子。 输入分别是是tf-idf矩阵(NMF)和t 阅读全文
posted @ 2016-03-08 14:56 ZH奶酪 阅读(4637) 评论(1) 推荐(0) 编辑