会员
众包
新闻
博问
AI培训
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Joe's blog
新随笔
联系
管理
上一页
1
···
4
5
6
7
8
9
10
11
下一页
2019年9月2日
遍历字典
摘要: 遍历字典key值 遍历字典value值 遍历字典项 遍历字典键值
阅读全文
posted @ 2019-09-02 16:40 FromZeroToOne
阅读(202)
评论(0)
推荐(0)
编辑
git操作
摘要: 辅导费
阅读全文
posted @ 2019-09-02 09:56 FromZeroToOne
阅读(114)
评论(0)
推荐(0)
编辑
2019年8月31日
深入理解wmd算法
摘要: "深入理解wmd算法" WMD(Word Mover’s Distance) "1" 是2015年提出的一种衡量文本相似度的方法。它具有以下几个优点: 效果出色:充分利用了 "word2vec" 的领域迁移能力 无监督:不依赖标注数据,没有冷启动问题 模型简单:仅需要词向量的结果作为输入,没有任何超
阅读全文
posted @ 2019-08-31 20:39 FromZeroToOne
阅读(5121)
评论(0)
推荐(0)
编辑
2019年8月29日
评价指标
摘要: 皮尔逊相关系数 $$ r=\frac{\operatorname{Cov}\left(\operatorname{sim}_{o u t}, \operatorname{sim}_{\text {label}}\right)}{\sqrt{\operatorname{Var}\left(\opera
阅读全文
posted @ 2019-08-29 18:23 FromZeroToOne
阅读(268)
评论(0)
推荐(0)
编辑
2019年8月28日
强化学习简介
摘要: 不理解环境(Model Free RL) Q Learning Sarsa Policy Gradients 理解环境 基于概率 基于价值
阅读全文
posted @ 2019-08-28 19:15 FromZeroToOne
阅读(103)
评论(0)
推荐(0)
编辑
2019年8月27日
提取中文英文和数字
摘要: ```python def change_text(path): with open(path,'r',encoding='utf-8') as f_read: raw_text = f_read.read() ## 删除空格和换行 raw_text = re.sub(u'([\r\n ])','',raw_text) ## ...
阅读全文
posted @ 2019-08-27 17:23 FromZeroToOne
阅读(220)
评论(0)
推荐(0)
编辑
fastText
摘要: 挖坑
阅读全文
posted @ 2019-08-27 16:56 FromZeroToOne
阅读(87)
评论(0)
推荐(0)
编辑
正则表达式应用
摘要: 提取句子中中英文数字 | \u4e00 \u9fa5 | 汉字的unicode范围 | | | | | \u0030 \u0039 | 数字的unicode范围 | | \u0041 \u005a | 大写字母unicode范围 | | \u0061 \u007a | 小写字母unicode范围 |
阅读全文
posted @ 2019-08-27 16:44 FromZeroToOne
阅读(300)
评论(0)
推荐(0)
编辑
2019年8月25日
常用相似度语料
摘要: 英文语料 MPRC 二分类 0101 训练集4700条 测试机1700条 中文语料 微众银行 共10000条数据
阅读全文
posted @ 2019-08-25 23:19 FromZeroToOne
阅读(510)
评论(0)
推荐(0)
编辑
2019年8月23日
比较句子相似度方法
摘要: 词嵌入在NLP领域已经很流行了,它可以让我们很简单地计算两个单词的相似度,或者去找到一个目标词最相似的词,然而,我们对两个长的句子或短文本相似度更感兴趣。在这篇博客中,我们比较最流行的方法计算句子相似度,研究他们的表现. "代码链接" 很多NLP应用需要计算短文本在语义层面的相似度。比如搜索引擎,需
阅读全文
posted @ 2019-08-23 20:27 FromZeroToOne
阅读(2687)
评论(0)
推荐(0)
编辑
上一页
1
···
4
5
6
7
8
9
10
11
下一页