摘要:
通常R语言运行都是在CPU单个核上的单线程程序。有时我们会有需求对一个向量里的元素应用相同的函数,最终再将结果合并,并行计算可以大幅节约时间。 为了支持R的并行运算, parallel包已经被纳入了R的BASE库中,可以被直接调用,来实现在同一个CPU上利用多个核Core同时运算相同的函数。 版本一 阅读全文
阅读排行榜
pandas dataframe 满足条件的样本提取
2017-08-05 10:43 by xplorerthik, 13940 阅读, 收藏,
摘要:
pandas 的dataframe 对 数据查询可以通过3种方式 。 预备知识: 1. pandas 的索引和label都是从0开始的计数的 2. 时间切片都是左闭右开的。 [5:6,:] 只会输出index =5的那一行值。 pd.dataframe的3种方式实现数据查询 1. 取其中的一个元素 阅读全文
置信区间,置信水平/置信度
2017-07-24 12:39 by xplorerthik, 8821 阅读, 收藏,
摘要:
置信度又称显著性水平,意义阶段,信任系数等,是指估计总体参数落在某一区间时,可能犯错误的概率,用符号α表示 统计分析中一般规定:正确估计的概率,也即置信水平为0.95或0.99,那么显著性水平则为0.05或0.01,这是依据0.05或0.01属于小概率事件,而小概率事件在一次抽样中是不可能出现的原理 阅读全文
GridSearchCV scoring 参考
2017-07-04 14:36 by xplorerthik, 7490 阅读, 收藏,
摘要:
http://scikit-learn.org/stable/modules/model_evaluation.html Scoring parameter: Model-evaluation tools using cross-validation (such as model_selection 阅读全文
pandas sort_values 排序后, index 也发生了改变,不改变的情况下需要 reset_index(drop = True)
2018-02-06 12:17 by xplorerthik, 4502 阅读, 收藏,
摘要:
shenpi.sort_values(by=['apply_date'],ascending=True,inplace=True)shenpi.reset_index(drop = True) 阅读全文
浙公网安备 33010602011771号