2018年4月18日

pd.read_csv的header用法

摘要: 默认Header = 0: header=0,表示第一行为标题行 时,即指明原始文件数据没有列索引,这样 read_csv会自动加上列索引 ,除非你给定列索引的名字。 更多参考: 1. https://blog.csdn.net/ly_ysys629/article/details/55107237 阅读全文

posted @ 2018-04-18 11:10 星辰之衍 阅读(17938) 评论(0) 推荐(2) 编辑

2018年4月16日

groupby和agg的使用

摘要: 先来看一段代码: 分析下 和 的联合使用: 表示重新设置索引 agg传进来的统计特征: 按照 这一列作聚合, 这一列作统计 注意: 中,表示按照A这一列来做聚合,C这一列来做统计。 重新设置列表: 补充: 用法 以一个例子说明,先是以'X'列排序,再以‘Y’列排序,过程是按升序排序。 阅读全文

posted @ 2018-04-16 19:54 星辰之衍 阅读(7384) 评论(0) 推荐(0) 编辑

2018年4月15日

Pandas的 loc iloc ix 区别

摘要: __先看代码:__ 1. loc——通过行标签索引行数据 1.2 loc['d']表示索引的是第’d’行(index 是字符) 1.3 如果想索引列数据,像这样做会报错 1.4 loc可以获取多行数据 1.5 loc扩展——索引某行某列 1.6 loc扩展——索引某列 当然获取某列数据最直接的方式是 阅读全文

posted @ 2018-04-15 22:49 星辰之衍 阅读(685) 评论(0) 推荐(2) 编辑

Python的文件读写与存储

摘要: 文件读写与存储 7.2. 读写文件 open()返回一个文件对象,最常见的用法带有两个参数:open(filename, mode)。 第一个参数是一个包含文件名的字符串。第二个参数是另一个包含几个字符的字符串,用于描述文件的使用方式。mode为 时表示只是读取文件;w表示只是写入文件(已经存在的同 阅读全文

posted @ 2018-04-15 11:12 星辰之衍 阅读(3585) 评论(0) 推荐(0) 编辑

2018年4月11日

数据分析学习笔记

摘要: 数据归一化和两种常用的归一化方法 数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行 阅读全文

posted @ 2018-04-11 18:40 星辰之衍 阅读(588) 评论(0) 推荐(0) 编辑

2018年4月7日

Python的format函数

摘要: Python的format函数 自python2.6开始,新增了一种格式化字符串的函数str.format(),此函数可以快速处理各种字符串。 语法 它通过 和 来代替 。 请看下面的示例,基本上总结了format函数在python的中所有用法: 阅读全文

posted @ 2018-04-07 16:00 星辰之衍 阅读(379) 评论(0) 推荐(0) 编辑

2018年4月5日

k-近邻算法 标签分类

摘要: k 近邻算法根据特征比较,然后提取样本集中特征最相似数据(最邻近)的分类标签。那么,如何进行比较呢? 怎么判断红色圆点标记的电影所属的类别呢? 如下图所示。 答:距离度量。这个电影分类的例子有2个特征,也就是在2维实数向量空间,可以使用两点距离公式计算距离,如图所示。 __k 近邻算法步骤如下:__ 阅读全文

posted @ 2018-04-05 20:40 星辰之衍 阅读(747) 评论(0) 推荐(0) 编辑

2018年4月4日

梯度算法之梯度上升和梯度下降

摘要: 梯度算法之梯度上升和梯度下降 __方向导数__ 当讨论函数沿任意方向的变化率时,也就引出了方向导数的定义,即:某一点在某一趋近方向上的导数值。 导数和偏导数的定义中,均是沿坐标轴正方向讨论函数的变化率。那么当讨论函数沿任意方向的变化率时,也就引出了方向导数的定义,即:某一点在某一趋近方向上的导数值。 阅读全文

posted @ 2018-04-04 19:46 星辰之衍 阅读(10455) 评论(0) 推荐(2) 编辑

2018年4月2日

如何用hexo+github搭建个人博客

摘要: 搭建环境 1、安装 Node.js: https://nodejs.org/en/ windows下点击链接,下载安装即可;Linux下更加简单,在终端下输入sudo apt get install nodejs即可。 2、安装 Git: https://github.com/waylau/git 阅读全文

posted @ 2018-04-02 23:17 星辰之衍 阅读(451) 评论(0) 推荐(0) 编辑

2018年3月29日

《机器学习实战-KNN》—如何在cmd命令提示符下运行numpy和matplotlib

摘要: 问题背景:好吧,文章标题是瞎取得。平常用cmd运行python代码问题不大,我在学习《机器学习实战》这本书时,发现cmd无法运行 以及 这条语句,原因是没有安装numpy和matplotlib。虽然用Anaconda的prompt以及Spyder等都可以成功运行,但如何在cmd环境下使用代码中含有n 阅读全文

posted @ 2018-03-29 17:08 星辰之衍 阅读(1170) 评论(0) 推荐(0) 编辑

2018年3月20日

Python的operator.itemgetter函数和sorted函数

摘要: 写这篇文章的目的是之前在《机器学习实战》用Python3实现KNN算法时用到的operator.itemgetter函数和sorted函数不太懂,在这里做一个详细介绍 阅读全文

posted @ 2018-03-20 21:58 星辰之衍 阅读(1397) 评论(0) 推荐(0) 编辑

2018年2月2日

源代码中直接package edu.princeton.cs.algs4还是import edu.princeton.cs.algs4问题

摘要: __对于前者这个问题,直接在src目录下命名一个包: __ 即创建了文件: ,然后把所有的代码放到最里层algs4中就可以了 __如果想通过后者方法 __ 如BinarySearch在 包中,需要调用其他包( )中的东西 需要在你自己的Java工程文件(如Algorithms) 中右键鼠标 — — 阅读全文

posted @ 2018-02-02 17:44 星辰之衍 阅读(3275) 评论(0) 推荐(0) 编辑

2018年2月1日

关于在windows命令提示符cmd下运行Java程序的问题

摘要: 1. win+R出现cmd运行窗口,输入Java源码文件名运行时, 错误: 找不到或无法加载主类... 问题背景: 我已经配置好了Java环境(安装路径PATH,JAVA_HOME已装好,cmd运行java,javac,java version也没问题) 例如以下Java代码: 文件名为 : 在cm 阅读全文

posted @ 2018-02-01 22:06 星辰之衍 阅读(9526) 评论(0) 推荐(0) 编辑

2018年1月30日

Windows10下用Anaconda3安装TensorFlow教程

摘要: 本文经过整理,详述了Windows10下用Anaconda3来安装TensorFlow的cpu版本,限于篇幅,gpu版本没有介绍。 阅读全文

posted @ 2018-01-30 22:33 星辰之衍 阅读(127373) 评论(18) 推荐(13) 编辑

如何理解假设空间与版本空间?

摘要: 周志华的《机器学习》书第1章讲到“版本空间”概念,但是什么是版本空间?假设空间与版本空间有什么区别?看了一些博客后,我这里以书上一道题目为例作为理解。如有错误,还望指正! 阅读全文

posted @ 2018-01-30 13:13 星辰之衍 阅读(14047) 评论(2) 推荐(3) 编辑

2018年1月28日

在windows64位Anaconda3环境下安装XGBoost

摘要: 安装步骤参考的是: “Installing XGBoost For Anaconda on Windows”:https://www.ibm.com/developerworks/community/blogs/jfp/entry/Installing_XGBoost_For_Anaconda_on 阅读全文

posted @ 2018-01-28 19:54 星辰之衍 阅读(3406) 评论(0) 推荐(0) 编辑

导航