上一页 1 ··· 4 5 6 7 8 9 10 11 下一页
摘要: 遍历字典key值 遍历字典value值 遍历字典项 遍历字典键值 阅读全文
posted @ 2019-09-02 16:40 FromZeroToOne 阅读(202) 评论(0) 推荐(0) 编辑
摘要: 辅导费 阅读全文
posted @ 2019-09-02 09:56 FromZeroToOne 阅读(114) 评论(0) 推荐(0) 编辑
摘要: "深入理解wmd算法" WMD(Word Mover’s Distance) "1" 是2015年提出的一种衡量文本相似度的方法。它具有以下几个优点: 效果出色:充分利用了 "word2vec" 的领域迁移能力 无监督:不依赖标注数据,没有冷启动问题 模型简单:仅需要词向量的结果作为输入,没有任何超 阅读全文
posted @ 2019-08-31 20:39 FromZeroToOne 阅读(5121) 评论(0) 推荐(0) 编辑
摘要: 皮尔逊相关系数 $$ r=\frac{\operatorname{Cov}\left(\operatorname{sim}_{o u t}, \operatorname{sim}_{\text {label}}\right)}{\sqrt{\operatorname{Var}\left(\opera 阅读全文
posted @ 2019-08-29 18:23 FromZeroToOne 阅读(268) 评论(0) 推荐(0) 编辑
摘要: 不理解环境(Model Free RL) Q Learning Sarsa Policy Gradients 理解环境 基于概率 基于价值 阅读全文
posted @ 2019-08-28 19:15 FromZeroToOne 阅读(103) 评论(0) 推荐(0) 编辑
摘要: ```python def change_text(path): with open(path,'r',encoding='utf-8') as f_read: raw_text = f_read.read() ## 删除空格和换行 raw_text = re.sub(u'([\r\n ])','',raw_text) ## ... 阅读全文
posted @ 2019-08-27 17:23 FromZeroToOne 阅读(220) 评论(0) 推荐(0) 编辑
摘要: 挖坑 阅读全文
posted @ 2019-08-27 16:56 FromZeroToOne 阅读(87) 评论(0) 推荐(0) 编辑
摘要: 提取句子中中英文数字 | \u4e00 \u9fa5 | 汉字的unicode范围 | | | | | \u0030 \u0039 | 数字的unicode范围 | | \u0041 \u005a | 大写字母unicode范围 | | \u0061 \u007a | 小写字母unicode范围 | 阅读全文
posted @ 2019-08-27 16:44 FromZeroToOne 阅读(300) 评论(0) 推荐(0) 编辑
摘要: 英文语料 MPRC 二分类 0101 训练集4700条 测试机1700条 中文语料 微众银行 共10000条数据 阅读全文
posted @ 2019-08-25 23:19 FromZeroToOne 阅读(510) 评论(0) 推荐(0) 编辑
摘要: 词嵌入在NLP领域已经很流行了,它可以让我们很简单地计算两个单词的相似度,或者去找到一个目标词最相似的词,然而,我们对两个长的句子或短文本相似度更感兴趣。在这篇博客中,我们比较最流行的方法计算句子相似度,研究他们的表现. "代码链接" 很多NLP应用需要计算短文本在语义层面的相似度。比如搜索引擎,需 阅读全文
posted @ 2019-08-23 20:27 FromZeroToOne 阅读(2687) 评论(0) 推荐(0) 编辑
上一页 1 ··· 4 5 6 7 8 9 10 11 下一页