随笔分类 -  数据处理

摘要:介绍Apache Spark is a fast and general-purpose cluster computing system. It provides high-level APIs in Java, Scala, Python and R, and an optimi... 阅读全文
posted @ 2017-08-19 17:22 codie 阅读(115) 评论(0) 推荐(0)
摘要:1 Prepare the Dataimport numpy as npx=np.linspace(0,10,100)y=np.cos(x)z=np.sin(x)Data or Imagesnarray mgridimagesdata = 2 * np.random.random((... 阅读全文
posted @ 2017-06-22 22:43 codie 阅读(347) 评论(0) 推荐(0)
摘要:二项分布n次独立随机试验,成功概率p,定义变量X,表示成功的次数k(κ∈[0,n]),则分布P(X=k): p(k)=(nk)pkpn−k 特别的例子就是,抛硬币.做100次抛硬币试h验(抛10次硬币)你会发现这一百次的试验,所记录的k次成功,k有高,有低,(0,10)之间.直觉告诉... 阅读全文
posted @ 2017-06-21 13:05 codie 阅读(180) 评论(0) 推荐(0)
摘要:# Interactions and ANOVANote: This script is based heavily on Jonathan Taylor’s class notes http://www.stanford.edu/class/stats191/interactio... 阅读全文
posted @ 2017-06-18 22:20 codie 阅读(694) 评论(0) 推荐(0)
摘要:Python数据分析 《利用Python进行数据分析》数据处理的例子:JSON格式文本Created with Raphaël 2.1.0开始元素为字典的列表panas的Dataframe生成Frame数据结构Frame获取数据生成Series对象value_counts等数据处理... 阅读全文
posted @ 2017-01-15 17:49 codie 阅读(299) 评论(0) 推荐(0)