代码改变世界

随笔分类 - 2.3.├─ Python

Linux下安装whl文件

2018-10-22 11:26 by 猎手家园, 34542 阅读, 收藏, 编辑
摘要: 直接使用pip安装: 阅读全文

Linux下安装Gensim

2018-10-22 10:59 by 猎手家园, 2328 阅读, 收藏, 编辑
摘要: 依赖软件包:numpy 直接使用pip安装: 安装gensim的时候会遇到下面的一系列错误: 意思是: 安装gensim的时候需要numpy更高的版本,而自带的numpy版本较低,版本有问题但是numpy已经安装过了,无法进行直接卸载。解决办法:强行安装更新更高的版本。 其它软件同理。 阅读全文

Linux下安装jieba

2018-10-22 10:52 by 猎手家园, 4495 阅读, 收藏, 编辑
摘要: Jieba代码对 Python 2/3 均兼容 * 全自动安装:`easy_install jieba` 或者 `pip install jieba` / `pip3 install jieba` * 半自动安装:先下载 http://pypi.python.org/pypi/jieba/ ,解压后 阅读全文

Linux下安装pymysql

2018-10-22 10:28 by 猎手家园, 8693 阅读, 收藏, 编辑
摘要: 直接使用pip进行安装: 阅读全文

python安装simplejson

2018-10-16 09:53 by 猎手家园, 7619 阅读, 收藏, 编辑
摘要: import simplejson 报错:ImportError: No module named simplejson simplejson是ansible一个很重要的依赖,经测试在python 2.4.3及以上版本都可以用python setup.py install 安装成功。 安装方法一: 阅读全文

CentOS6.5安装pip

2018-09-11 12:08 by 猎手家园, 3291 阅读, 收藏, 编辑
摘要: 首先重要的事情说三遍,因为可能有程序依赖目前的python2环境,比如yum: 不要动现有的python2环境! 不要动现有的python2环境! 不要动现有的python2环境! 如果你动了,yum报错了,请参考:https://www.cnblogs.com/hunttown/p/9625662 阅读全文

CentOS6.5安装python3.7

2018-09-10 17:21 by 猎手家园, 5746 阅读, 收藏, 编辑
摘要: 1、下载python3 2、解压 先建一个编译目录: Python3.7版本需要一个新的包libffi-devel,安装此包之后再次进行编译安装即可。 然后编译、安装: 建立软链接: 查看版本: 安装结束! 阅读全文

Python的Pandas库简述

2017-06-28 15:25 by 猎手家园, 1938 阅读, 收藏, 编辑
摘要: pandas 是 python 的数据分析处理库import pandas as pd 1、读取CSV、TXT文件 2、查看前N条、后N条信息 3、查看数据框的格式,是DataFrame还是ndarray 4、查看有哪些列 5、查看有几行几列 6、打印某一行、某几行数据 7、打印某一列、某几列数据 阅读全文

Python的Numpy库简述

2017-06-28 15:18 by 猎手家园, 3135 阅读, 收藏, 编辑
摘要: numpy 是 python 的科学计算库import numpy as np 1、使用numpy读取txt文件 2、ayyay数组,数据类型是必须相同。 3、numpy的数据类型,一般用到四种数据类型 bool、 int32/64、 float32/64、 string 4、获取第1行的第4个数 阅读全文

Python的Matplotlib库简述

2017-06-28 15:07 by 猎手家园, 1262 阅读, 收藏, 编辑
摘要: Matplotlib 库是 python 的数据可视化库import matplotlib.pyplot as plt 1、字符串转化为日期 2、拆线图 3、多图拼切 4、一图多线 5、一图多线 - 自动跑代码(带图例) 6、条形图 7、条形图 - 横向 8、散点图 9、直方图 10、多图 11、四 阅读全文

随机森林算法原理剖析

2017-06-01 10:59 by 猎手家园, 13055 阅读, 收藏, 编辑
摘要: 随机森林算法 集成学习有两个流派,一个是boosting派系,它的特点是各个弱学习器之间有依赖关系。另一种是bagging流派,它的特点是各个弱学习器之间没有依赖关系,可以并行拟合。 随机森林是集成学习中可以和梯度提升树GBDT分庭抗礼的算法,尤其是它可以很方便的并行训练,在如今大数据大样本的的时代 阅读全文

利用python脚本(xpath)抓取数据

2017-04-13 14:32 by 猎手家园, 6405 阅读, 收藏, 编辑
摘要: 有人会问re和xpath是什么关系?如果你了解js与jquery,那么这个就很好理解了。 上一篇:利用python脚本(re)抓取美空mm图片 阅读全文

利用python脚本(re)抓取美空mm图片

2017-04-13 14:30 by 猎手家园, 1360 阅读, 收藏, 编辑
摘要: 很久没有写博客了,这段时间一直在搞风控的东西,过段时间我把风控的内容整理整理发出来大家一起研究研究。 这两天抽空写了两个python爬虫脚本,一个使用re,一个使用xpath。 直接上代码——基于re: spider.py tool.py 阅读全文

在Hadoop平台跑python脚本

2016-08-26 11:08 by 猎手家园, 4906 阅读, 收藏, 编辑
摘要: 1、开发IDE,我使用的是PyCharm。 2、运行原理 使用python写MapReduce的“诀窍”是利用Hadoop流的API,通过STDIN(标准输入)、STDOUT(标准输出)在Map函数和Reduce函数之间传递数据。我们唯一需要做的是利用Python的sys.stdin读取输入数据,并 阅读全文