会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
嘟嘟_猪
博客园
首页
新随笔
联系
管理
订阅
上一页
1
2
3
4
5
6
7
下一页
2016年10月22日
PageRank理论与实践及用户评分应用PeopleRank算法
摘要: PageRank,网页排名,又称网页级别、Google左侧排名或佩奇排名,是一种由根据网页之间相互的超链接计算的技术,而作为网页排名的要素之一. Google用它来体现网页的相关性和重要性,在搜索引擎优化操作中是经常被用来评估网页优化的成效因素之一.PageRank适用于任何图或网络在任何域.因此,
阅读全文
posted @ 2016-10-22 11:00 白鹭倾城
阅读(2493)
评论(0)
推荐(0)
2016年10月20日
反作弊基本概念与机器学习的应用(1)
摘要: 反作弊主要业务流程: 常见作弊方式: 机器作弊:机器刷量、任务分发、流量劫持 人为作弊:QQ群/水军、直接人工、诱导 常见作弊手段: 电商:刷单,刷信誉,刷好评,职业差评师 支付平台:洗钱,诈骗 广告:数据造假、刷流量 (引流—广告展示—广告点击—转化) 自媒体、社交软件:刷粉丝、刷点击、阅读量 搜
阅读全文
posted @ 2016-10-20 22:17 白鹭倾城
阅读(11604)
评论(2)
推荐(3)
2016年10月10日
adaboost原理与实践
摘要: Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。其算法本身是通过改变数据分布来实现的,它根据每次训练集之中每个样本的分类是否正确,以及上次的总体分类的准确率,来确定每个样本的权值。将修改过权值
阅读全文
posted @ 2016-10-10 22:00 白鹭倾城
阅读(4362)
评论(0)
推荐(0)
ID3、C4.5、CART、RandomForest的原理
摘要: 决策树意义: 分类决策树模型是表示基于特征对实例进行分类的树形结构.决策树可以转换为一个if_then规则的集合,也可以看作是定义在特征空间划分上的类的条件概率分布. 它着眼于从一组无次序、无规则的样本数据(概念)中推理出决策树表示形式的分类规则.假设这里的样本数据应该能够用“属性—结论”.决策树学
阅读全文
posted @ 2016-10-10 21:30 白鹭倾城
阅读(2254)
评论(0)
推荐(0)
C4.5,CART,randomforest的实践
摘要: #################################Weka-J48(C4.5)################################# ##############################R语言:C4.5###############################
阅读全文
posted @ 2016-10-10 18:01 白鹭倾城
阅读(1697)
评论(2)
推荐(0)
logistic原理与实践
摘要: 逻辑回归模型是一种将影响概率的不同因素结合在一起的指数模型,得到的是0~1之间的概率分布.自变量范围是,值域范围限制在0~1之间.在搜索广告、信息处理和生物统计中有广泛的应用.例如搜索广告的点击率预估,将影响概率预测的各种信息作为变量,比如广告的位置、广告和搜索词的相关性、广告展示的时间(比如晚上广
阅读全文
posted @ 2016-10-10 17:54 白鹭倾城
阅读(824)
评论(0)
推荐(0)
knn原理与实践
摘要: knn法是一种基本分类与回归方法 应用:knn算法不仅可以用于分类,还可以用于回归.. 1、文本分类:文本分类主要应用于信息检索,机器翻译,自动文摘,信息过滤,邮件分类等任务. 2、可以使用knn算法做到比较通用的现有用户产品推荐,基于用户的最近邻(长得最像的用户)买了什么产品来推荐是种介于电子商务
阅读全文
posted @ 2016-10-10 17:16 白鹭倾城
阅读(2035)
评论(0)
推荐(0)
Naive Bayes理论与实践
摘要: Naive Bayes: 简单有效的常用分类算法,典型用途:垃圾邮件分类 假设:给定目标值时属性之间相互条件独立 同样,先验概率的贝叶斯估计是 优点: 1、 无监督学习的一种,实现简单,没有迭代,学习效率高,在大样本量下会有较好的表现. 2、 对分类器的学习情况有着比较简单的解释,可以简单的通过查询
阅读全文
posted @ 2016-10-10 17:09 白鹭倾城
阅读(853)
评论(0)
推荐(0)
2016年10月9日
Apriori原理与实践
摘要: Apriori: 其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集。经典的关联规则数据挖掘算法Apriori 算法广泛应用于各种领域,通过对数据的关联性进行了分析和挖掘,挖掘出的这些信息在决策制定过程中具有重要的参考价值。 Apriori算法广泛应用于商业中,应用于消费市场价格分
阅读全文
posted @ 2016-10-09 12:15 白鹭倾城
阅读(749)
评论(0)
推荐(0)
2016年10月8日
数据科学家应了解的内容
摘要: 1、数据挖掘 变量规约、随机森林、生存分析、两阶段建模、序列分析、关联规则、k折交叉验证、自组织映射、支持向量机、层次聚类、情感分析、协同过滤、神经网络、k均值聚类、k近邻、朴素贝叶斯、Boosting、决策树、过拟合、Lift、预测算法、分类算法、训练验证测试集、变量角色、无监督学习、有监督学习、
阅读全文
posted @ 2016-10-08 20:36 白鹭倾城
阅读(326)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
下一页
公告