摘要: {1}朋友学校发生了爆炸事故。她们化学系隔壁一栋楼的某个实验室因为氢气泄露还是什么原因爆炸,导致1个博士后死亡。我们立马群里呼叫她,还好不是她实验室所在的建筑,真是万幸。后来看到新闻,还是感觉不安,于是给她打电话过去。逐渐长大,反而越来越不会安慰人,可能原因是自己越来越自私吧。相隔几千公里,电话里也... 阅读全文
posted @ 2015-12-21 11:25 hanahana 阅读(85) 评论(0) 推荐(0)
摘要: 1.1 一个例子在基于四种特征(体重、翼展、脚蹼、后背颜色)鸟类物种分类这个例子中,数据包含6个训练样本,每个样本有4种特征,1个目标变量。目标变量是机器学习算法的预测结果,在分类算法中目标变量的类型通常是离散型,而在回归算法中通常是连续型的。训练样本集必须确定知道目标变量的值,以便机器学习算法可以... 阅读全文
posted @ 2015-09-20 00:27 hanahana 阅读(143) 评论(0) 推荐(0)
摘要: tf-idf模型的主要思想是:如果词w在一篇文档d中出现的频率高,并且在其他文档中很少出现,则认为词w具有很好的区分能力,适合用来把文章d和其他文章区分开来。该模型主要包含了两个因素:1) 词w在文档d中的词频tf (Term Frequency),即词w在文档d中出现次数count(w, d)和文... 阅读全文
posted @ 2015-09-18 15:25 hanahana 阅读(1451) 评论(0) 推荐(0)