随笔分类 - py数据分析
摘要:pandas相关链接 1 第十六篇 Py数据分析(基本操作&连结数据库) 2 14种方式,34个案例:对比SQL,学习Pandas操作 3 Pandas聚合统计 4 Py数据分析-txt笔记 ....
阅读全文
摘要:字典-列表 >DataFrame # 方式一: # 单个字典(eg:a={'name': 'hw', 'age': 16})转换为DataFrame data =pd.DataFrame() a =dict(name="hw",age=16) if data.empty: data =pd.Data
阅读全文
摘要:%matplotlib notebook import datetime dt = datetime.datetime(year=2017,month=11,day=24,hour=10,minute=30) dt datetime.datetime(2017, 11, 24, 10, 30) pr
阅读全文
摘要:import numpy as np import pandas as pd from pandas import DataFrame,Series import matplotlib.pyplot as plt #CDNOW_master.txt 第一部分:数据类型处理 数据加载 字段含义: us
阅读全文
摘要:20个常用的函数方法 1.读取数据 marketing = pd.read_csv("DirectMarketing.csv") groceries = pd.read_csv("Groceries_dataset.csv") df = pd.read_csv("Churn_Modelling.cs
阅读全文
摘要:Py 数据分析目录 1 numpy 2 Series&Pandas 3 Pandas实战-股票分析 4 Pandas--重复值&nan值 清洗 5 dataframe级联与合并操作 6 pandas人口分析案例 7 Pandas-替换,映射,分组,透视表 8 pandas实战-美国大选数据分析 9
阅读全文
摘要:matplotlib 参考:https://matplotlib.org/index.html In [1]: import matplotlib.pyplot as plt import numpy as np plt.plot()绘制线性图¶ 绘制单条线形图 绘制多条线形图 设置坐标系的比例pl
阅读全文
摘要:import numpy as np import pandas as pd #方便大家操作,将月份和参选人以及所在政党进行定义: months = {'JAN' : 1, 'FEB' : 2, 'MAR' : 3, 'APR' : 4, 'MAY' : 5, 'JUN' : 6, 'JUL' :
阅读全文
摘要:import numpy as np import pandas as pd from pandas import DataFrame 替换操作 替换操作可以同步作用于Series和DataFrame中 单值替换 普通替换: 替换所有符合要求的元素:to_replace=15,value='e' 按
阅读全文
摘要:需求: 导入文件,查看原始数据 将人口数据和各州简称数据进行合并 将合并的数据中重复的abbreviation列进行删除 查看存在缺失数据的列 找到有哪些state/region使得state的值为NaN,进行去重操作 为找到的这些state/region的state项补上正确的值,从而去除掉sta
阅读全文
摘要:import pandas as pd import numpy as np 级联操作 pd.concat, pd.append pandas使用pd.concat函数,与np.concatenate函数类似,只是多了一些参数: objs axis=0 keys join='outer' / 'in
阅读全文
摘要:import pandas as pd from pandas import DataFrame import numpy as np 处理丢失数据 有两种丢失数据: None np.nan(NaN) 两种丢失数据的区别 type(None) NoneType type(np.nan) float
阅读全文
摘要:需求:股票分析 使用tushare包获取某股票的历史行情数据。 输出该股票所有收盘比开盘上涨3%以上的日期。 输出该股票所有开盘比前日收盘跌幅超过2%的日期。 假如我从2010年1月1日开始,每月第一个交易日买入1手股票,每年最后一个交易日卖出所有股票,到今天为止,我的收益如何? tushare财经
阅读全文
摘要:为什么学习pandas numpy已经可以帮助我们进行数据的处理了,那么学习pandas的目的是什么呢? numpy能够帮助我们处理的是数值型的数据,当然在数据分析中除了数值型的数据还有好多其他类型的数据(字符串,时间序列),那么pandas就可以帮我们很好的处理除了数值型的其他数据! 什么是pan
阅读全文
摘要:什么是数据分析 是把隐藏在一些看似杂乱无章的数据背后的信息提炼出来,总结出所研究对象的内在规律 使得数据的价值最大化 分析用户的消费行为 制定促销活动的方案 制定促销时间和粒度 计算用户的活跃度 分析产品的回购力度 分析广告点击率 决定投放时间 制定广告定向人群方案 决定相关平台的投放 ......
阅读全文
摘要:概要 1 常用pandas操作方法 2 pandas操作数据库 1 常用pandas操作方法: 创建DataFrame数据 查看数据相关信息 查看头尾文件 花样取数 切片取数 常见函数使用 首先,导入包 import pandas as pd import numpy as np # 01 创建Da
阅读全文
摘要:Pandas聚合统计 链接:https://mp.weixin.qq.com/s/vKsx3nJDxCfqwCaPTWkzpA 导读:Pandas是当前Python数据分析中最为重要的工具,其提供了功能强大且灵活多样的API,可以满足使用者在数据分析和处理中的多种选择和实现方式。今天本文以Panda
阅读全文
摘要:pandas 相关笔记 入门Pandas不可不知的技巧 https://mp.weixin.qq.com/s/tOyVJJYuh7RInHbIeKOMnw 如果你用 Python 做数据分析,必然会绕不过 Pandas 的使用,实际上, Python 也是由于 numpy、pandas 等数据科学库
阅读全文
浙公网安备 33010602011771号