04 2017 档案

机器学习评价指标大汇总
摘要:出处:http://www.zhaokv.com/2016/03/ml-metric.html 更详细的官方文档:http://scikit-learn.org/stable/modules/model_evaluation.html#the-scoring-parameter-defining-m 阅读全文

posted @ 2017-04-28 14:22 易然~ 阅读(776) 评论(0) 推荐(0)

preprocessing
摘要:二、标准化(Standardization),或者去除均值和方差进行缩放 公式为:(X-X_mean)/X_std 计算时对每个属性/每列分别进行. 将数据按其属性(按列进行)减去其均值,然后除以其方差。最后得到的结果是,对每个属性/每列来说所有数据都聚集在0附近,方差值为1。 首先说明下sklea 阅读全文

posted @ 2017-04-26 19:33 易然~ 阅读(796) 评论(0) 推荐(0)

hist
摘要:转载:python中plt.hist参数详解 x : (n,) array or sequence of (n,) arrays 这个参数是指定每个bin(箱子)分布的数据,对应x轴 bins : integer or array_like, optional 这个参数指定bin(箱子)的个数,也就 阅读全文

posted @ 2017-04-26 14:45 易然~ 阅读(599) 评论(0) 推荐(0)

feature selection&feature abstraction降维
摘要:LLE:http://www.cnblogs.com/pinard/p/6266408.html 其他降维http://www.tuicool.com/articles/AnAF3uF PCA:http://blog.csdn.net/shizhixin/article/details/511813 阅读全文

posted @ 2017-04-25 09:55 易然~ 阅读(136) 评论(0) 推荐(0)

拿到样本简单的清洗操作
摘要:http://www.cnblogs.com/zzhzhao/p/5269217.html 阅读全文

posted @ 2017-04-24 20:13 易然~ 阅读(258) 评论(0) 推荐(0)

使用sklearn做单机特征工程
摘要:转:http://www.cnblogs.com/jasonfreak/p/5448385.html 目录 1 特征工程是什么?2 数据预处理 2.1 无量纲化 2.1.1 标准化 2.1.2 区间缩放法 2.1.3 标准化与归一化的区别 2.2 对定量特征二值化 2.3 对定性特征哑编码 2.4 阅读全文

posted @ 2017-04-20 18:50 易然~ 阅读(192) 评论(0) 推荐(0)

tensorflow安装
摘要:第三步:检测python是否安装,环境配置是否成功 cmd 》》》python 验证是否安装成功: 第四步:TensorFlow安装(我安装的是cpu版本) 以管理员身份运行cmd cd到这个地址: 1 输入: 1 补充信息: 一键安装(CPU版): 1 (GPU版) 1 第五步:测试 在cmd输入 阅读全文

posted @ 2017-04-20 12:05 易然~ 阅读(349) 评论(0) 推荐(0)

PCA数学角度解析
摘要:转:http://blog.csdn.net/passball/article/details/24037593 主成分分析(PCA)是多元统计分析中用来分析数据的一种方法,它是用一种较少数量的特征对样本进行描述以达到降低特征空间维数的方法,它的本质实际上是K-L变换。PCA方法最著名的应用应该是在 阅读全文

posted @ 2017-04-19 12:22 易然~ 阅读(1980) 评论(0) 推荐(0)

使用Python进行描述性统计【解决了实习初期的燃眉之急】
摘要:目录 1 描述性统计是什么?2 使用NumPy和SciPy进行数值分析 2.1 基本概念 2.2 中心位置(均值、中位数、众数) 2.3 发散程度(极差,方差、标准差、变异系数) 2.4 偏差程度(z-分数) 2.5 相关程度(协方差,相关系数) 2.6 回顾3 使用Matplotlib进行图分析 阅读全文

posted @ 2017-04-18 16:59 易然~ 阅读(411) 评论(0) 推荐(0)

类、对象、属性、方法、类的成员
摘要:类:具有同种属性的对象称为类,是个抽象的概念。比如说:汽车、人、狗、神;对象:日常生活中的所有东西都是对象,是类的实例化。比如说:推土车是汽车的实例化;姚明是人的实例化;小白(狗的名字)是狗的实例化;二郎神是神的实例化;属性:用来描述具体某个对象的特征的是属性,是静态的。比如:姚明身高2.6米多;小 阅读全文

posted @ 2017-04-18 15:08 易然~ 阅读(280) 评论(0) 推荐(0)

Python格式化输出
摘要:转:http://www.cnblogs.com/plwang1990/p/3757549.html Python格式化输出 今天写程序又记不清格式化输出细节了……= =索性整理一下。 python print格式化输出。 1. 打印字符串 print ("His name is %s"%("Avi 阅读全文

posted @ 2017-04-13 10:25 易然~ 阅读(197) 评论(0) 推荐(0)

分类算法之朴素贝叶斯Naive Bayesian classification
摘要:转:http://www.cnblogs.com/leoo2sk/archive/2010/09/17/naive-bayesian-classifier.html#!comments 1.1、摘要 贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。本文作为分类算法的 阅读全文

posted @ 2017-04-07 15:51 易然~ 阅读(254) 评论(0) 推荐(0)

利用python进行数据分析2[pandas]
摘要:1.Series obj=Series([2,3,4,-1]) obj.values , obj.index obj2=Series([12,5,4,-1],index=['d','a','b','c']) 可以通过索引选取单个或一组值 numpy数组运算 也可以通过字典创建Series obj3= 阅读全文

posted @ 2017-04-06 19:28 易然~ 阅读(116) 评论(0) 推荐(0)

利用python进行数据分析1【numpy】
摘要:1.高维向量转置 Q: A: 2.其他函数 3.np.where(cond,xarr,yarr) cond是条件,xarr,yarr可以是数组,也可以是标量值 1~ 2~ 4. axis=1,水平方向,0~垂直方向 5.sort()排序 arr.sort() , sorted() 5. 6.线性代数 阅读全文

posted @ 2017-04-06 18:19 易然~ 阅读(161) 评论(0) 推荐(0)

python-mysql
摘要:1.MySQLdb的安装,下了一个安装包(MySQL-python-1.2.3.win-amd64-py2.7),直接按提示就好,然后cmd进入python,敲python setup.py install,结束。可以检查一下,import MySQLdb~ 但是之前改过python的path,不知 阅读全文

posted @ 2017-04-01 16:22 易然~ 阅读(3674) 评论(0) 推荐(0)

愚人节作业
摘要:1.X轴的分割,用了cut,groupby函数,这个cut可以做成任意多份,得到近似的函数分布2.作plot(x,y)与hist直方图,可以看到图像还是很接近的3.用KL散度刻画两个分布的差异,并以list形式输出4.对list中按从大到小排列,可以得到feature的差异性,也就是统计量角度的重要 阅读全文

posted @ 2017-04-01 15:11 易然~ 阅读(208) 评论(0) 推荐(0)

导航