随笔分类 - 数据分析
摘要:第一章 1.1 1.1.2数据化运营是什么? 是指通过数据化的工具和技术,方法,对运营过程中的各个环节进行科学分析引导和应用,从而达到优化运营效果和效率,降低成本,提高效率的目的。 1.数据化运营的意义: 提高运营决策效率 提高运营决策正确性 优化运营执行过程 提升投资回报 2.数据化运营的2种方式
阅读全文
摘要:.... 具体代码: https://github.com/mysteriousKiller/jingdong
阅读全文
摘要:具体代码:https://github.com/mysteriousKiller/tubatu
阅读全文
摘要:import matplotlib.pyplot as plt import numpy as np from scipy.io import wavfile rate_h,hstrain=wavfile.read(r'H1_Strain.wav','rb') rate_l,lstrain=wavfile.read(r'L1_Strain.wav','rb') reftime,ref_H1 =...
阅读全文
摘要:ndarray数组的创建方法 1.从python中的列表,元组等类型创建ndarray数组 x = np.array(list/tuple) x = np.array(list/tuple,dtype=np.float32) 当np.array() 不指定dtype时,Numpy 将根据数据情况关联
阅读全文
摘要:import numpy as np Numpy 一元函数 对ndarray中的数据执行元素级运算的函数 np.abs(x) np.fabs(x) 计算数组各元素的绝对值 np.sqrt(x) 计算数组各元素的平方根 np.square(x) 计算数组各元素的的平方 np.log(x) np.log
阅读全文
摘要:主题思想 摘要:有损地去数据特征的过程 基本统计(含排序) 分步/累计统计 数据特征 相关性,周期性等 数据挖掘(形成知识) IPython的%魔术命令 %magic 显示所有魔术命令 %hist IPython命令的输入历史 %db 异常发生后自动进入调试器 %reset 删除当前命名空间中的全部
阅读全文
摘要:pandas 统计描述 一个强大的分析结构化数据额的工具集 基础是Numpy,提供了高性能矩阵的运算 应用数据挖掘,数据分析 如,学生成绩分析,股票数据分析等 提供数据清洗功能 Series 类似一维数组的对象 通过list构建Series import pandas as pdser_obj =
阅读全文
摘要:Matplotlib 库的使用 Matplotlib 库有各种可视化类构成,内部结构复杂,受Matlab启发 matplotlib.pyplot是绘制个类可视化图形的命令子库相当于快捷方式 pyplot的绘图区域 plt.subplot(nrows,ncols,plot_number) 例:plt.
阅读全文
摘要:Matplotlib库 pyplot的plot()函数 plt.plot(x,y,fomat_sting,**kwargs) x:X轴数据,列表或数组,可选 y:Y轴数据,列表或数组 fomat_sting:控制曲线的格式字符串,可选 由颜色字符,风格字符和标记字符组成 颜色字符 说明 颜色字符 说
阅读全文
摘要:Matplotlib 用于 创建出版质量图标的绘图工具库 目的是为python构建一个 Matlab 式的绘图接口 import matplotlib.pyplot as plt pyplot 模块包含了常用的 matplotlib API 函数 figure Matplotlib 的图像均位于 f
阅读全文