kobeshow - 博客园

2013年9月27日

摘要：阅读全文

posted @ 2013-09-27 08:48 kobeshow 阅读(154) 评论(0) 推荐(0)

摘要：阅读全文

posted @ 2013-09-27 08:47 kobeshow 阅读(230) 评论(0) 推荐(1)

摘要：【菜鸟读财报，如何从上市公司财报中挖情报？】❶财务数据重点看主营业务收入而不是利润。❷收入、利益要按不同业务类型分别加以分析。❸现金周转情况、折旧情况、年终拥有现金数量等指标同样值得关注。❹纵向、横向比较。❺特殊收益和支出应分析其利弊。阅读全文

posted @ 2013-09-27 08:44 kobeshow 阅读(330) 评论(0) 推荐(0)

因子分析-转载新浪微博

摘要：【数据分析注意点】1、要注意每种统计分析方法的适用范围；2、使用不同的数据分析方法对同一问题进行解释，来互相验证结论的真伪，多次尝试；3、结果要使用通俗易懂的语言或图表进行描述；4、需要耐心和细致，不能出现任何疏漏，别一个老鼠害一锅汤；5、高级数据分析不一定是最好的，简单有效才是最好阅读全文

posted @ 2013-09-27 08:36 kobeshow 阅读(255) 评论(0) 推荐(0)

2013年9月26日

产品经理干货-微博转载

摘要：阅读全文

posted @ 2013-09-26 15:07 kobeshow 阅读(144) 评论(0) 推荐(0)

Machine Learning in Action(4) Logistic Regression

摘要：从这节算是开始进入“正规”的机器学习了吧，之所以“正规”因为它开始要建立价值函数（cost function），接着优化价值函数求出权重，然后测试验证。这整套的流程是机器学习必经环节。今天要学习的话题是逻辑回归，逻辑回归也是一种有监督学习方法（supervised machine learning）。逻辑回归一般用来做预测，也可以用来做分类，预测是某个类别^.^！线性回归想比大家都不陌生了，y=kx+b,给定一堆数据点，拟合出k和b的值就行了，下次给定X时，就可以计算出y,这就是回归。而逻辑回归跟这个有点区别，它是一种非线性函数，拟合功能颇为强大，而且它是连续函数，可以对其求导，这点很重要，. 阅读全文

posted @ 2013-09-26 10:00 kobeshow 阅读(791) 评论(0) 推荐(0)

2013年9月25日

R in Action(1) 基本数据结构

摘要：一数据类型R的数据类型包括数值型、字符型、逻辑型(布尔)、复数型和原生型，同时R有好多存储数据的对象类型，包括标量、向量、矩阵、数组、数据框和列表，如下图所示下图(图的版权神马的归原作者跟原出版社所有，赶紧避嫌，呵呵)1、向量操作1 a y y 3 [,1] [,2] 4 [1,] 1 6 5 [2,] 2 7 6 [3,] 3 8 7 [4,] 4 9 8 [5,] 5 10 9 > y y11 [,1] [,2]12 [1,] 1 213 [2,] 3 414 [3,] 5 ... 阅读全文

posted @ 2013-09-25 21:26 kobeshow 阅读(663) 评论(0) 推荐(0)

R in Action(0) 开篇

摘要：这几年数据挖掘的火热，也越来越多的人把R作为数据挖掘的一个辅助工具，据国际性组织kkguter统计有60%的人在挖掘过程中用到R工具，可见这个工具是多么的流行，对于数据统计、筛选以及画图绝对是神器。尽管之前在学校的时候也“断断续续”的用过它画画图，算算多次实验结果的mean、sd，也用过它来参加过Kaggle上面的比赛，但是都是拿来就用(off-the-shelf)，没有系统的记录R的学习过程，借着R in Action一书来温习一下R的艺术编程。网上有好多关于R的资料，当然官网上的是最全，最系统的，除了官网外，http://tryr.codeschool.com/，http://www.. 阅读全文

posted @ 2013-09-25 12:47 kobeshow 阅读(227) 评论(0) 推荐(0)

2013年9月24日

Machine Learning in Action(3) 朴素贝叶斯算法

摘要：贝叶斯决策一直很有争议，今年是贝叶斯250周年，历经沉浮，今天它的应用又开始逐渐活跃，有兴趣的可以看看斯坦福Brad Efron大师对其的反思，两篇文章：“Bayes'Theorem in the 21st Century”和“A250-YEAR ARGUMENT:BELIEF, BEHAVIOR, AND THE BOOTSTRAP”。俺就不参合这事了，下面来看看朴素贝叶斯分类器。有时我们想知道给定一个样本时，它属于每个类别的概率是多少,即P(Ci|X),Ci表示类别，X表示测试样本，有了概率后我们可以选择最大的概率的类别。要求这个概率要用经典贝叶斯公式，如（公式一）所示：（公式一阅读全文

posted @ 2013-09-24 19:39 kobeshow 阅读(387) 评论(0) 推荐(0)

Machine Learning in Action(2) 决策树算法

摘要：决策树也是有监督机器学习方法。电影《无耻混蛋》里有一幕游戏，在德军小酒馆里有几个人在玩20问题游戏，游戏规则是一个设迷者在纸牌中抽出一个目标（可以是人，也可以是物），而猜谜者可以提问题，设迷者只能回答是或者不是，在几个问题（最多二十个问题）之后，猜谜者通过逐步缩小范围就准确的找到了答案。这就类似于决策树的工作原理。（图一）是一个判断邮件类别的工作方式，可以看出判别方法很简单，基本都是阈值判断，关键是如何构建决策树，也就是如何训练一个决策树。（图一）构建决策树的伪代码如下：Check if every item in the dataset is in the same class: If.. 阅读全文

posted @ 2013-09-24 18:15 kobeshow 阅读(579) 评论(0) 推荐(0)

YYGamer->QQSearcher

机器学习、搜索、数据分析、广告、产品、运营

公告