随笔分类 - 数据处理
摘要:介绍Apache Spark is a fast and general-purpose cluster computing system. It provides high-level APIs in Java, Scala, Python and R, and an optimi...
阅读全文
摘要:1 Prepare the Dataimport numpy as npx=np.linspace(0,10,100)y=np.cos(x)z=np.sin(x)Data or Imagesnarray mgridimagesdata = 2 * np.random.random((...
阅读全文
摘要:二项分布n次独立随机试验,成功概率p,定义变量X,表示成功的次数k(κ∈[0,n]),则分布P(X=k): p(k)=(nk)pkpn−k 特别的例子就是,抛硬币.做100次抛硬币试h验(抛10次硬币)你会发现这一百次的试验,所记录的k次成功,k有高,有低,(0,10)之间.直觉告诉...
阅读全文
摘要:# Interactions and ANOVANote: This script is based heavily on Jonathan Taylor’s class notes http://www.stanford.edu/class/stats191/interactio...
阅读全文
摘要:Python数据分析 《利用Python进行数据分析》数据处理的例子:JSON格式文本Created with Raphaël 2.1.0开始元素为字典的列表panas的Dataframe生成Frame数据结构Frame获取数据生成Series对象value_counts等数据处理...
阅读全文

浙公网安备 33010602011771号