Loading

随笔分类 -  B-算法工程

关于机器学习的相关话题
摘要:一、TF-IDF简介 在自然语言处理中,TF-IDF(term frequency–inverse document frequency)常用于挖掘文章中的关键词, 算法以简单高效著称。TF-IDF有两层意思,一层是"词频"(Term Frequency,缩写为TF),另一层是"逆文档频率"(Inv 阅读全文
posted @ 2020-06-28 10:27 selfcs 阅读(929) 评论(0) 推荐(0)
摘要:欧几里得距离 在数学中,欧几里得距离或欧几里得度量是欧几里得空间中两点间“普通”(即直线)距离。使用这个距离,欧氏空间成为度量空间。相关联的范数称为欧几里得范数。较早的文献称之为毕达哥拉斯度量。 计算方式的局限。 比如说计算两个点的距离,点A(10,10000)、点B(1,500),第二个维度对于距 阅读全文
posted @ 2020-04-13 16:42 selfcs 阅读(564) 评论(0) 推荐(1)
摘要:常用的决策树算法有 ID3、C4.5、CART ,它们构建树所使用的启发式函数各是什么?除了构建准则之外,它们之间的区别与联系是什么?首先,我们回顾一下这几种决策树构造时使用的准则。 | 人 | 年龄 | 长相 | 工资 | 写代码 | 类别 | | | | | | | | | 小A | 老 | 帅 阅读全文
posted @ 2020-04-02 21:43 selfcs 阅读(1386) 评论(0) 推荐(0)
摘要:自动文档摘要评价方法大致分为两类: (1) 内部评价方法(Intrinsic Methods) :提供参考摘要,以参考摘要为基准评价系统摘要的质量。系统摘要与参考摘要越吻合, 质量越高。 (2) 外部评价方法(Extrinsic Methods) :不提供参考摘要,利用文档摘要代替原文档执行某个文档 阅读全文
posted @ 2020-04-02 21:36 selfcs 阅读(748) 评论(0) 推荐(0)