摘要:
已经大半年没有更新博客了。。最近都跑去写分析报告半年没有R 这次记录下关于R循环(百万级以上)死慢死慢的问题,这个问题去年就碰到过,当时也尝试过多线程,but failed......昨天试了下,终于跑通了,而且过程还挺顺利 step1 先查下自己电脑几核的,n核貌似应该选跑n个线程,线程不是越多越 阅读全文
posted @ 2021-12-23 16:04
MRO物料采购服务
阅读(2116)
评论(0)
推荐(0)
摘要:
本次不讲原理,单纯用R语言计算句子相似度。 方式一:机械相似性两个文本内容上的相关程度,比如“你好吗”和“你好”的相似性,纯粹代表着内容上字符是否完全共现。——基于Jaccard相似系数计算句子相似度 Jaccard 系数指:句子A的分词词语与句子B的分词词语交集的大小与句子A的分词词语与句子B的分 阅读全文
posted @ 2021-12-23 15:51
MRO物料采购服务
阅读(1450)
评论(0)
推荐(0)
摘要:
在之前的开篇提到了text2vec,笔者将其定义为R语言文本分析"No.1",她是一个文本分析的生态系统。笔者在学习之后发现开发者简直牛!基于分享精神,将自学笔记记录出来。开篇内容参考: 重磅︱R+NLP:text2vec包——New 文本分析生态系统 No.1(一,简介) R+NLP︱text2v 阅读全文
posted @ 2021-12-23 14:28
MRO物料采购服务
阅读(1036)
评论(0)
推荐(0)

浙公网安备 33010602011771号