04 2017 档案
摘要:在用Pycharm运行Python程序时,出现如下的情况: 由图中可以知道是中文乱码,解决方案如下: 打开file—— setting—— Editor—— File Encodings 设置如下: 点击OK即可。再次运行刚才的程序,可以看到已经不出现乱码了
阅读全文
摘要:1.multiprocessing multiprocessing模块就是跨平台版本的多进程模块。在Windows环境下创建进程可以使用multiprocessing模块。multiprocessing模块提供了一个Process类来代表一个进程对象。 创建子进程时,只需要传入一个执行函数和函数的参
阅读全文
摘要:统计学中,Huber损失是用于鲁棒回归的损失函数,与平方误差损失相比,对数据中的游离点较不敏感。 也有时使用分类的变体。 1.定义 胡伯损失函数描述估计方法F招致的惩罚。Huber(1964)通过分段定义了损失函数。 当a的值较小时,该函数为二次函数,当a的值较大时,该函数为线性函数,当|a|=de
阅读全文
摘要:点互信息PMI(Pointwise Mutual Information)这个指标用来衡量两个事件之间的相关性,公式如下: p(f)和p(e)分别代表事件f和事件e发生的概率,p(f,e)代表时间f和事件e同时发生的概率。 如果f和e不相关则p(f,e)=p(f).p(e)。二者相关性越大,则p(f
阅读全文
摘要:转载:http://blog.chinaunix.net/uid 23028928 id 2567754.html 正确率、召回率和F值是在鱼龙混杂的环境中,选出目标的重要评价指标。 不妨看看这些指标的定义先: 正确率 = 正确识别的个体总数 / 识别出的个体总数 召回率 = 正确识别的个体总数 /
阅读全文
摘要:词典包括情感词典、程度词典、否定词典和连词词典,其中情感词典最为重要,程度词典和否定词典用于识别修饰情感词语的成分,连词词典用于识别句际关系. 1.情感词典 以情感词汇本体为主要资源,结合HowNet情感分析用中文词集、中文褒贬义词典 和学生褒贬义词,经过整合、去重、转换和补充得到含有28567个词
阅读全文
摘要:1.导语 情感分类是情感分析技术的核心问题,其目标是判断评论中的情感取向,按区分情感的粒度可分为两种分类问题: 1)正/负(positive/negative)二分类或者正面/负面/中立(positive/negative/neutral)三分类。 2)多元分类,如对新闻评论进行“乐观”、“悲伤”、
阅读全文

浙公网安备 33010602011771号