随笔分类 -  大数据

摘要:import tushare as ts import pandas as pd df = ts.day_cinema() #取上一日全国影院票房排行数据 #df = ts.day_cinema('2015-12-24') #取指定日期的数据 pd.set_option('display.unicode.ambiguous_as_wide', True)#设置列名对齐 pd.set_option( 阅读全文
posted @ 2019-10-31 13:05 疯陈演义 阅读(1835) 评论(0) 推荐(0)
摘要:股票数据的获取目前有如下两种方法可以获取:1. http/javascript接口取数据2. web-service接口1.http/javascript接口取数据1.1Sina股票数据接口以大秦铁路(股票代码:601006)为例,如果要获取它的最新行情,只需访问新浪的股票数据接口:http://h 阅读全文
posted @ 2017-03-31 12:09 疯陈演义 阅读(4941) 评论(0) 推荐(1)
摘要:#http://q.stock.sohu.com/cn/000078/lshq.shtml 阅读全文
posted @ 2017-03-31 10:36 疯陈演义 阅读(790) 评论(0) 推荐(0)
摘要:import os import pandas as pd stock_data = pd.read_csv('stock data/sh600898.csv',parse_dates=[1]) #设定转换周期period_type 转换为周是'W',月'M',季度线'Q',五分钟'5min',12天'12D' period_type = 'W' #将[date]设定为 index ... 阅读全文
posted @ 2016-11-18 08:47 疯陈演义 阅读(5554) 评论(0) 推荐(1)
摘要:import os import pandas as pd stock_code_list = [] for root,dirs,files in os.walk('stock data'): if files: for f in files: if '.csv' in f: stock_code_list.ap... 阅读全文
posted @ 2016-11-14 15:10 疯陈演义 阅读(1280) 评论(0) 推荐(0)
摘要:import pandas as pd import numpy as np df = pd.read_csv('000917.csv',encoding='gbk') df = df[df['涨跌幅']!='None'] df['涨跌幅'] = df['涨跌幅'].astype(np.float64) print(df[df['涨跌幅']>5]) 阅读全文
posted @ 2016-11-11 11:22 疯陈演义 阅读(17694) 评论(0) 推荐(0)
摘要:500w.py pyCyp.py 阅读全文
posted @ 2016-11-11 08:51 疯陈演义 阅读(3338) 评论(0) 推荐(0)
摘要:1、导入两个数据分析重要的模块import numpy as npimport pandas as pd2、创建一个时间索引,所谓的索引(index)就是每一行数据的id,可以标识每一行的唯一值dates = pd.date_range('20161024',periods=6)3、创建一个6X4的 阅读全文
posted @ 2016-10-24 10:56 疯陈演义 阅读(755) 评论(0) 推荐(0)