12 2015 档案

摘要:(一)SVM的背景简介支持向量机(Support Vector Machine)是Cortes和Vapnik于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中[10]。支持向量机方法是建立在统计学习理论的VC 维理论和结构... 阅读全文
posted @ 2015-12-30 10:27 白开水加糖 阅读(750) 评论(1) 推荐(0)
摘要:自己的专业方向是机器学习、数据挖掘,就业意向是互联网行业与本专业相关的工作岗位。各个企业对这类岗位的命名可能有所不同,比如数据挖掘/自然语言处理/机器学习算法工程师,或简称算法工程师,还有的称为搜索/推荐算法工程师,甚至有的并入后台工程师的范畴,视岗位具体要求而定。机器学习、大数据相关岗位的职责自己... 阅读全文
posted @ 2015-12-30 10:11 白开水加糖 阅读(1055) 评论(0) 推荐(0)
摘要:GBDT(GradientBoostingDecisionTree)又叫MART(MultipleAdditiveRegressionTree),是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论累加起来做最终答案。它在被提出之初就和SVM一起被认为是泛化能力(generalizati... 阅读全文
posted @ 2015-12-29 16:19 白开水加糖 阅读(73205) 评论(6) 推荐(10)
摘要:交叉验证(Cross validation),有时亦称循环估计, 是一种统计学上将数据样本切割成较小子集的实用方法。于是可以先在一个子集上做分析, 而其它子集则用来做后续对此分析的确认及验证。 一开始的子集被称为训练集。而其它的子集则被称为验证集或测试集。交叉验证是一种评估统计分析、机器学习算法对独... 阅读全文
posted @ 2015-12-28 10:46 白开水加糖 阅读(930) 评论(0) 推荐(0)
摘要:一、roc曲线1、roc曲线:接收者操作特征(receiveroperating characteristic),roc曲线上每个点反映着对同一信号刺激的感受性。横轴:负正类率(false postive rate FPR)特异度,划分实例中所有负例占所有负例的比例;(1-Specificity)纵... 阅读全文
posted @ 2015-12-28 09:28 白开水加糖 阅读(36472) 评论(0) 推荐(8)
摘要:EdgeRank 是今年 Facebook 在 F8 开发者大会上提出的对 fb 新鲜事 (Feeds) 排序的新算法, 用于区别默认的按时间逆序的 timeline. 不像 PageRank 还有很多论文或学术界的资料,目前没有什么官方资料讨论 EdgeRank, 搜到的资料大部分来自在线广告代理... 阅读全文
posted @ 2015-12-07 21:59 白开水加糖 阅读(1176) 评论(0) 推荐(0)