摘要: 一、启发式搜索:A算法 1)评价函数的一般形式 : f(n) = g(n) + h(n) g(n):从S0到Sn的实际代价(搜索的横向因子) h(n):从N到目标节点的估计代价,称为启发函数(搜索的纵向因子); 特点: 效率高, 无回溯, 搜索算法 OPEN表 : 存放待扩展的节点. CLOSED表 阅读全文
posted @ 2018-09-23 14:49 J.mg 阅读(5529) 评论(0) 推荐(2) 编辑
摘要: 1、任务简介 本次任务是爬取IJCAI(国际人工智能联合会议)最新2018年的pdf论文文件。 本次编码用到了正则表达式从html里面提取信息,如下对正则表达式匹配规则作简要的介绍。 2、正则表达式规则 \w匹配字母数字及下划线 \W匹配非字母数字及下划线 \s匹配任意空白字符,等价于 [\t\n\ 阅读全文
posted @ 2018-08-07 15:42 J.mg 阅读(2707) 评论(1) 推荐(2) 编辑
摘要: 关键词句和文本集每篇文章相关度计算:假设语料库中有几万篇文章,每篇文章的长度不一,你任意输入关键词或句子,通过代码以tf-idf值为准检索出来相似度高的文章。 1、TF-IDF概述 TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文 阅读全文
posted @ 2018-08-03 08:44 J.mg 阅读(1020) 评论(0) 推荐(0) 编辑
摘要: 1、余弦相似度 余弦距离,也称为余弦相似度,是用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小的度量。余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,这就叫"余弦相似性"。 上图两个向量a,b的夹角很小可以说a向量和b向量有很高的的相似性,极端情况下,a和b向量完全重合。如下 阅读全文
posted @ 2018-08-02 12:18 J.mg 阅读(6241) 评论(3) 推荐(1) 编辑
摘要: 最大匹配法:最大匹配是指以词典为依据,取词典中最长单词为第一个次取字数量的扫描串,在词典中进行扫描(为提升扫描效率,还可以跟据字数多少设计多个字典,然后根据字数分别从不同字典中进行扫描)。例如:词典中最长词为“中华人民共和国”共7个汉字,则最大匹配起始字数为7个汉字。然后逐字递减,在对应的词典中进行 阅读全文
posted @ 2018-08-01 18:58 J.mg 阅读(15155) 评论(2) 推荐(2) 编辑
摘要: 一、题目描述 黄金点游戏是一个数字小游戏,其游戏规则是: N个同学(N通常大于10),每人写一个0-100之间的有理数 (不包括0或100),交给裁判,裁判算出所有数字的平均值,然后乘以0.618(所谓黄金分割常数),得到G值。提交的数字最靠近G(取绝对值)的同学得到N分,离G最远的同学得到-2分, 阅读全文
posted @ 2016-10-15 19:38 J.mg 阅读(254) 评论(2) 推荐(0) 编辑
摘要: 做java开发的朋友,都应该有一个适合自己的开发环境,而eclipse就是这么一个适合java开发的集成环境,完全免费,是java开发人员的必备平台。在安装eclipse之前需要安装JDK, JDK是 Java 语言的软件开发工具包,主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个ja 阅读全文
posted @ 2016-10-04 19:43 J.mg 阅读(230) 评论(0) 推荐(0) 编辑