随笔分类 - python数据分析与挖掘学习笔记
摘要:1、python库下载安装慢;用清华镜像 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple --trusted-host pypi.tuna.tsinghua.edu.cn pyqt5==5.12.3,pyqt5==5.12.3是库名及版
阅读全文
摘要:首先先安装要用到的包:sklearn,顾名思义机器学习包 通过训练数据集进行预测
阅读全文
摘要:python地图可视化可用python包Basemap;本篇总结用到百度的Echars,http://echarts.baidu.com/;Echarts 是百度开源的一个数据可视化 JS 库。 安装pyecharts库; 运行后,在代码文件所在目录生成一个render的html文件,用浏览器打开,
阅读全文
摘要:数据如何清晰、准确、交互的展现,通过数据可视化,将实现这些效果。 python可视化需要用到的库:pandas,matplotlib 参考官方教程:http://matplotlib.org/index.html 散点图: 绘图函数:plot(x,y,'.',color(r,g,b)) x、y,x轴
阅读全文
摘要:根据收集到的数据,接下来要考虑的问题是数据是否满足我们模型构建的要求,数据质量是否过关?数据间的关联性如何?趋势和规律怎么样的? 通过数据的处理和探索,用统计手段通过制图等描绘数据,对数据进行初步的探索。 数据质量分析: 1、缺失值;2、异常值;3、不一致的值;4、重复数据且含有非法字符。 1、缺失
阅读全文
摘要:1、导入数据的方式: 从:csv,txt,exce文件,数据库:mysql等。 read_csv(file,encoding)导入数据,file是文件路径。 read_table(file,names=[列名1,列名2,…】,sep=“”,encoding,…) read _excel(fileNa
阅读全文
摘要:一、数据类型: 定义:按照python规定的格式,把数据的类型告知python; 赋值:定义好的数据,传递给变量的过程; 变量:数据赋值的对象,通过变量去操作数据; 变量名命名规则: 1、a-z,A-Z,数字,下划线,首字母不能为数字和下划线; 2、大小写敏感; 3、变量名不能为python中的保留
阅读全文

浙公网安备 33010602011771号