08 2016 档案

摘要:#备份源repo 43 mkdir /etc/yum.repos.d/repobak # 44 cd /etc/yum.repos.d/ 46 mv *.repo repobak/ #编辑repo 54 vim base.repo # 60 yum clean all #测试 61 yum install vim 72 yu... 阅读全文
posted @ 2016-08-24 15:46 iAthena 阅读(1036) 评论(0) 推荐(0) 编辑
摘要:Linux升级Python提示Tkinter模块找不到解决Python 2013-04-12 python,升级,tkinter一、安装tkinter在Linux中python默认是不安装Tkinter模块,123456789[root@li250-193 ~]# pythonPython 2.6.6 (r266:84292, Feb 22 2013, 00:00:18) [GCC 4.4.7 2... 阅读全文
posted @ 2016-08-24 15:03 iAthena 阅读(958) 评论(0) 推荐(0) 编辑
摘要:CDH通过rpm包安装author:wangxing http://note.youdao.com/md/preview/preview.html?file=%2Fyws%2Fapi%2Fpersonal%2Ffile%2F5B26A5BCF92E43519F13F322CD83F6A9%3Fmethod%3Ddownload%26read%3Dtrue%26shareKey%3Da91edbb3... 阅读全文
posted @ 2016-08-10 18:19 iAthena 阅读(2164) 评论(0) 推荐(0) 编辑
摘要:1. 标准化 (Standardization) 变换后各维特征有0均值,单位方差。也叫z-score规范化(零均值规范化)。计算方式是将特征值减去均值,除以标准差。 sklearn.preprocessing.scale(X) 一般会把train和test集放在一起做标准化,或者在train集上做标准化后,用同样的标准化器去标准化test集,如下: scaler = s... 阅读全文
posted @ 2016-08-03 16:41 iAthena 阅读(574) 评论(0) 推荐(0) 编辑
摘要:本文作者:Charlotte77出处:http://www.cnblogs.com/charlotte77/ 在真实数据中,我们拿到的数据可能包含了大量的缺失值,可能包含大量的噪音,也可能因为人工录入错误导致有异常点存在,对我们挖据出有效信息造成了一定的困扰,所以我们需要通过一些方法,尽量提高数据的质量。数据清洗一般包括以下几个步骤:一.分析数据二.缺失值处理三.异常值处理四.去重处理五.噪音... 阅读全文
posted @ 2016-08-02 18:23 iAthena 阅读(1319) 评论(0) 推荐(0) 编辑