会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
我不是小鲁班
自律才能自由。
博客园
首页
新随笔
联系
管理
订阅
05 2018 档案
pd库dataframe基本操作
摘要:一、查看数据(查看对象的方法对于Series来说同样适用) 1.查看DataFrame前xx行或后xx行 a=DataFrame(data); a.head(6)表示显示前6行数据,若head()中不带参数则会显示全部数据。 a.tail(6)表示显示后6行数据,若tail()中不带参数则也会显示全
阅读全文
posted @
2018-05-31 16:22
我不是小鲁班
阅读(30653)
评论(0)
推荐(1)
3—决策树
摘要:这个监督式学习算法通常被用于分类问题。令人惊奇的是,它同时适用于分类变量和连续因变量。在这个算法中,我们将总体分成两个或更多的同类群。这是根据最重要的属性或者自变量来分成尽可能不同的组别。想要知道更多,可以阅读:简化决策树。
阅读全文
posted @
2018-05-24 16:02
我不是小鲁班
阅读(157)
评论(0)
推荐(0)
2—线性、逻辑回归
摘要:线性回归 线性回归通常用于根据连续变量估计实际数值(房价、呼叫次数、总销售额等)。我们通过拟合最佳直线来建立自变量和因变量的关系。这条最佳直线叫做回归线,并且用 Y= a *X + b 这条线性等式来表示。 在这个等式中: Y:因变量 a:斜率 x:自变量 b :截距 系数 a 和 b 可以通过最小
阅读全文
posted @
2018-05-24 10:12
我不是小鲁班
阅读(356)
评论(0)
推荐(0)
1—概述
摘要:广义来说,有三种机器学习算法 1、 监督式学习 工作机制:这个算法由一个目标变量或结果变量(或因变量)组成。这些变量由已知的一系列预示变量(自变量)预测而来。利用这一系列变量,我们生成一个将输入值映射到期望输出值的函数。这个训练过程会一直持续,直到模型在训练数据上获得期望的精确度。监督式学习的例子有
阅读全文
posted @
2018-05-24 09:53
我不是小鲁班
阅读(169)
评论(0)
推荐(0)
win 7 系统过期处理办法
摘要:超级尴尬,刚装的win7 系统居然过期了。下次再也不装盗版了,吼吼吼 处理方法就是下载oem7F7 软件安装,不用再怎么操作就好了。 就是这么简单,并不用像网上那样找什么激活码。
阅读全文
posted @
2018-05-23 15:05
我不是小鲁班
阅读(1117)
评论(0)
推荐(0)
Python数据处理(持续更新)
摘要:#打开txt文件 数据合并 数据聚合 csv数据合并: 读取片段: 按照列名读取 要把第三列数据中的0值删除,今天弄了好几个小时,写了个循环,还是不行,最后发现,只要选择数据中大于0的就可以了 另一种思路,是把该列中数据为0的值挑出来,然后给赋值成nan,再用下面代码将nan值删除 字符串数据转换成
阅读全文
posted @
2018-05-14 17:28
我不是小鲁班
阅读(1797)
评论(0)
推荐(0)
GBDT梯度提升树算法及官方案例
摘要:梯度提升树是一种决策树的集成算法。它通过反复迭代训练决策树来最小化损失函数。决策树类似,梯度提升树具有可处理类别特征、易扩展到多分类问题、不需特征缩放等性质。Spark.ml通过使用现有decision tree工具来实现。 梯度提升树依次迭代训练一系列的决策树。在一次迭代中,算法使用现有的集成来对
阅读全文
posted @
2018-05-09 10:32
我不是小鲁班
阅读(2499)
评论(0)
推荐(0)
广告数据线性回归分析
摘要:线性回归 线性回归是最基础的机器学习算法,它是用一条直线去拟合数据,适用于线性数据。 线性回归包括一元线性回归和多元线性回归,一元的是只有一个x和一个y。多元的是指有多个x和一个y。 (一元) (多元) 我们希望这些点尽量离这条直线近一点。即去找每个点和直线的距离 最小的那条线,为了简单起见,将绝对
阅读全文
posted @
2018-05-08 15:50
我不是小鲁班
阅读(2482)
评论(0)
推荐(0)
python txt文件批处理
摘要:首先,切换文件路径到所在文件夹 然后,将txt文件内容按行读取,写入到all.txt #读取为DataFrame格式
阅读全文
posted @
2018-05-07 21:20
我不是小鲁班
阅读(1706)
评论(0)
推荐(0)
Python数据可视化
摘要:https://blog.csdn.net/suzyu12345/article/details/69029106一篇很详细的博客 这里只画了不同特征之间关系的图,即用pairpoint函数,用到的数据是电影数据,上篇博客当中有下载链接,结果如下: 代码如下: 数据分布直方图
阅读全文
posted @
2018-05-03 16:31
我不是小鲁班
阅读(577)
评论(0)
推荐(1)
公告