随笔分类 -  python数据分析

摘要:df = DataFrame(np.random.randn(7,3)) df.ix[:5,1] = NA# 报错 AttributeError: 'DataFrame' object has no attribute 'ix'# 改为 df.iloc[:5,1] = NA 阅读全文
posted @ 2021-02-13 22:06 OTAKU_nicole 阅读(6515) 评论(0) 推荐(0)
摘要:from pandas import Series,DataFrame import pandas as pd obj = Series(['c','a','d','a','a','b','b','c','c']) print(obj.unique()) # 唯一值 ''' ['c' 'a' 'd' 阅读全文
posted @ 2021-02-13 21:12 OTAKU_nicole 阅读(385) 评论(0) 推荐(0)
摘要:from pandas import DataFrame from pandas_datareader import data as web all_data = {} for ticker in ['AAPL','IBM','MSFT','GOOG']: all_data[ticker] = we 阅读全文
posted @ 2021-02-13 13:06 OTAKU_nicole 阅读(364) 评论(0) 推荐(0)
摘要:import pandas.io.data as web报错ModuleNotFoundError: No module named 'pandas.io.data'安装pandas_datareader后改为 from pandas_datareader import data as web 阅读全文
posted @ 2021-02-13 12:28 OTAKU_nicole 阅读(1157) 评论(0) 推荐(0)
摘要:Python3.5中:iteritems变为items 阅读全文
posted @ 2020-10-15 11:54 OTAKU_nicole 阅读(635) 评论(0) 推荐(0)
摘要:from pandas import DataFrame, Series import numpy as np df = DataFrame([[1.4,np.nan],[7.1,-4.5], [np.nan,np.nan],[0.75,-1.3]], index=['a','b','c','d'] 阅读全文
posted @ 2020-10-14 17:10 OTAKU_nicole 阅读(102) 评论(0) 推荐(0)
摘要:重新索引 from pandas import Series,DataFrame # Series重新索引 obj = Series([4.5,7.2,-5.3,3.6],index=['d','b','a','c']) print(obj) ''' d 4.5 b 7.2 a -5.3 c 3.6 阅读全文
posted @ 2020-10-14 16:26 OTAKU_nicole 阅读(70) 评论(0) 推荐(0)
摘要:Series DataFrame 索引对象 Index的方法和属性 阅读全文
posted @ 2020-05-25 15:47 OTAKU_nicole 阅读(190) 评论(0) 推荐(0)
摘要:import random import numpy as np import matplotlib.pyplot as plt position = 0 walk = [position] steps = 100 x = [] y = [] for i in range(steps): step 阅读全文
posted @ 2020-05-22 18:43 OTAKU_nicole 阅读(180) 评论(0) 推荐(0)
摘要:import numpy as np # 确定随机数生成器的种子 # seed()用于指定随机数生成时所用算法开始的整数值,如果使用相同的seed值,则每次生成的随即数都相同 np.random.seed(3) print(np.random.rand(4)) # [0.5507979 0.7081 阅读全文
posted @ 2020-05-22 18:15 OTAKU_nicole 阅读(361) 评论(0) 推荐(0)
摘要:import numpy as np from numpy.linalg import inv, qr, eig, det, pinv, svd, lstsq, solve from numpy.matlib import randn, trace x = np.array([[1,2,3],[4, 阅读全文
posted @ 2020-05-22 17:07 OTAKU_nicole 阅读(235) 评论(0) 推荐(0)
摘要:将数组以二进制格式保存到磁盘 import numpy as np # np.save和np.load是读写磁盘数组数据的两个主要函数。默认情况下是以未压缩的原始二进制格式保存在扩展名为.npy的文件中 arr = np.arange(10) np.save('some_array',arr) lo 阅读全文
posted @ 2020-05-22 16:10 OTAKU_nicole 阅读(155) 评论(0) 推荐(0)
摘要:通用函数 一元ufunc abs、fabs:计算整数、浮点数或复数的绝对值。对于非复数值,可以使用更快的fabs sqrt:计算各元素的平方根。相当于arr**0.5 square:计算各元素的平方。相当于arr**2 exp:计算各元素的指数 log、log10、log2、log1p:分别对自然对 阅读全文
posted @ 2020-05-22 16:00 OTAKU_nicole 阅读(375) 评论(0) 推荐(0)
摘要:创建ndarray array:将输入数据转换为ndarry arange:类似于range,返回一个ndarray ones、ones_like:根据指定形状和dtype创建一个全1数组。ones_like以另一个数组为参照,根据其形状和dtype创建一个全1数组 zeros、zeros_like 阅读全文
posted @ 2020-05-21 17:59 OTAKU_nicole 阅读(204) 评论(0) 推荐(0)
摘要:pip install wordcloud 安装出现报错,提示需要先安装Microsoft Visual C++ Build Tools error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ B 阅读全文
posted @ 2020-05-20 10:39 OTAKU_nicole 阅读(862) 评论(0) 推荐(0)