摘要: important_dic = {'预付卡'}weight = 3 #可以修改,也可以再字典里添加权值k=0for word in set(sent): if word in important_dic: k = weight else: k = 0 if word in dic: index = 阅读全文
posted @ 2018-11-13 17:58 yjy888 阅读(218) 评论(0) 推荐(0)
摘要: 【问题】word2vec训练以后,得到预付卡和购物卡非常接近,可是实际上这两个东西是不一样的,如何区分这两个东西? 解决:建立一个独立词典,这个词典里的词是没有近义词的,独立的词,比如预付卡是很独特的,我们加进词典了,每次遇到这个词,我们就不是取TOPN 为1, 我们取topn为1.2, 这样就会实 阅读全文
posted @ 2018-11-13 16:43 yjy888 阅读(558) 评论(0) 推荐(0)
摘要: 今天在测试相似度算法的过程中,出现了一些问题,比如 ('预付卡怎么设置\n', '预付卡 设置', '预付卡怎么设置\n', '预付卡 设置', 1.029370301661967)('预付卡怎么设置\n', '预付卡 设置', '怎么使用购物卡\n', '使用 购物卡', 0.5975588878 阅读全文
posted @ 2018-11-13 16:14 yjy888 阅读(137) 评论(0) 推荐(0)
摘要: 类名开头大写,驼峰命名 函数名,变量名都小写, 全局常量 如COUNT, 使用全部大写 https://www.cnblogs.com/lytwajue/p/7324724.html 这个是全局变量关于内存位置的解释和声明 Python变量命名规则 变量名只能包含字母、数字和下划线。变量名可以字母或 阅读全文
posted @ 2018-11-13 09:09 yjy888 阅读(194) 评论(0) 推荐(0)