随笔分类 - sklearn-xgboost
sklearn preprocessing 数据预处理(OneHotEncoder)
摘要:1. one hot encodersklearn.preprocessing.OneHotEncoderone hot encoder 不仅对 label 可以进行编码,还可对 categorical feature 进行编码:>>> from sklearn.pr...
阅读全文
sklearn 特征降维利器 —— PCA & TSNE
摘要:同为降维工具,二者的主要区别在于,所在的包不同(也即机制和原理不同) from sklearn.decomposition import PCAfrom sklearn.manifold import TSNE因为原理不同,导致,tsne 保留下的属性信息,更具代表性...
阅读全文
数据竞赛利器 —— xgboost 学习清单
摘要:1. 入门大全xgboost 作者给出的一份完备的使用 xgboost 进行数据分析的完整示例代码:A walk through python example for UCI Mushroom dataset is provided.2. 参数调优Complete G...
阅读全文
ubuntu 下 caffe 的安装
摘要:官方下载说明:Caffe | Installation: Ubuntu在 ubuntu 的一些较新版本中(14.04 以上),caffe 的所有依赖包都可以使用 apt-get 大法搞定。1. 依赖项的安装如果没有使用 root 账号,则每个命令前需要加 sudosu...
阅读全文
sklearn 文本处理
摘要:from sklearn.feature_extraction.text import **1. 向量的统计、tf-idf 的计算考虑如下预料,三行 ⇒ 三个文档,不重复的单词共有 8 个,corpus = ['I love you', 'You love ...
阅读全文
sklearn 下的流行学习(Manifold Learning)—— sklearn.manifold
摘要:1. t-SNEfrom sklearn.manifold import TSNEX_proj = TSNE(random_state=123).fit_transform(X)2. t_sne_joint_probabilities_joint_probabilit...
阅读全文
sklearn 下距离的度量 —— sklearn.metrics
摘要:1. pairwisefrom sklearm.metrics.pairwise import pairwise_distance计算一个样本集内部样本之间的距离:D = np.array([np.linalg.norm(r1-r2) for r1 in X] for...
阅读全文
浙公网安备 33010602011771号