2018年4月1日

anaconda下安装xgboost

摘要: 1、下载whl文件 网址:https://www.lfd.uci.edu/~gohlke/pythonlibs/#xgboost 选择合适自己的环境的下载,比如python3.6还是3.5的,64位机子还是32位机子。 我下载的是xgboost‑0.7‑cp36‑cp36m‑win_amd64.wh 阅读全文

posted @ 2018-04-01 09:48 吱吱了了 阅读(5527) 评论(0) 推荐(0) 编辑

2018年3月30日

数据分析例子-------CTR1

摘要: 1、CTR: (1)几个概念: impression(展示):用户看到该广告的次数。也就是一个广告被显示了多少次,它就计数多少。比如:打开网站的一个页面,网站上的所有广告就被显示了一次,每个广告增加1个,如果刷新就再增加一个。 click(点击):用户点击该广告的次数 CTR:click throu 阅读全文

posted @ 2018-03-30 19:04 吱吱了了 阅读(1078) 评论(0) 推荐(0) 编辑

Python数据分析5-----数据规约

摘要: 1、数据规约概念和目的 数据规约是产生更小且保留数据完整性的新数据集。 意义:降低无效错误数据的影响、更有效率、降低存储成本。 2、属性规约 (1)属性合并(降维):比如PCA (2)删除不相关属性 3、数值规约:离散化也算是数值规约 阅读全文

posted @ 2018-03-30 13:33 吱吱了了 阅读(1142) 评论(0) 推荐(0) 编辑

2018年3月29日

Python数据分析4------------数据变换

摘要: 1、简单变换: 开方、平方、对数等 2、数据规范化: (1)离差标准化(最小最大标准化):消除量纲(单位)影响以及变异大小因素的影响。 x1=(x-min)/(max-min) 代码:data1=(data-min())/(data.max()-data.min()) (2)标准差标准化(0-均值标 阅读全文

posted @ 2018-03-29 19:36 吱吱了了 阅读(2430) 评论(0) 推荐(0) 编辑

Python数据分析3------数据预处理

摘要: 一、数据清洗 这一个步骤可以和数据探索并行。 (1)标签分类数据处理:LabelEncoder【将分类数据变成0-n的值】 (2)one-hot编码 2、数据集成 (1)概念 数据挖掘往往分布在不同的数据源中,进行数据分析时需要将多个不同的数据源整合到同一个数据存储(如数据仓库)中。但是来自不同地方 阅读全文

posted @ 2018-03-29 14:21 吱吱了了 阅读(565) 评论(0) 推荐(0) 编辑

2018年3月28日

Python数据分析2------数据探索

摘要: 一、数据探索 数据探索的目的:及早发现数据的一些简单规律或特征 数据清洗的目的:留下可靠数据,避免脏数据的干扰。 两者没有严格的先后顺序,经常在一个阶段进行。 分为: (1)数据质量分析(跟数据清洗密切联系):缺失值分析、异常值分析、一致性分析、重复数据或含有特殊符号的数据分析 (2)数据特征分析( 阅读全文

posted @ 2018-03-28 16:45 吱吱了了 阅读(1861) 评论(0) 推荐(0) 编辑

Mysql5.7安装过程----win10

摘要: 恢复内容开始 1、Mysql官网:https://www.mysql.com/downloads/ 有两种下载方式:msi和zip压缩包 2、我下载的是zip压缩包,选择mysql community server 64位5.7.21版本。 3、将下载的压缩包解压到合适的路径并可以修改文件名。E:\ 阅读全文

posted @ 2018-03-28 14:12 吱吱了了 阅读(247) 评论(0) 推荐(0) 编辑

数据分析常用函数(1)

摘要: 参考链接:https://blog.csdn.net/qq_16234613/article/details/64217337 1、describe():该函数主要对数据进行一个基本的统计,输出数据的总数量(count)、平均值(mean)、标准差(std)、最小值和最大值(min、max)、分位数 阅读全文

posted @ 2018-03-28 10:54 吱吱了了 阅读(374) 评论(0) 推荐(0) 编辑

数据分析相关模块

摘要: 1、简介: (1)numpy:(科学计算)高效处理数据,提供数组支持,很多模块都依赖它,是一个基础。 (2)pandas:数据探索和数据分析(两个重要的数据结构series 和dataframe) (3)matplotlib:作图模块,可视化 (4)scipy:主要进行数值计算,支持矩阵计算,高等数 阅读全文

posted @ 2018-03-28 10:11 吱吱了了 阅读(348) 评论(0) 推荐(0) 编辑

2018年3月27日

Python笔记18-----函数收集参数

摘要: 1、收集参数(参数前面加*): def test1(param1,*params): print(param1) print(params) 调用:test1(1,2,3,4) 结果:1 (2,3,4) 2、收集参数的逆过程 def test2(x,y): return x+y 调用:params= 阅读全文

posted @ 2018-03-27 19:34 吱吱了了 阅读(174) 评论(0) 推荐(0) 编辑

导航