随笔分类 -  02_数据分析_python

数据分析
摘要:最后的2行错误信息是 1 2 发现是six出现了问题,用pip更新一下six,问题并没有解决,原因是并没有真正更新six的文件。在python下输入: 1 2 /System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/py 阅读全文
posted @ 2017-11-06 10:57 cphmvp 阅读(548) 评论(0) 推荐(0)
摘要:安装: https://jupyter.readthedocs.io/en/latest/install.html#install 配置 Ubuntu 16.04 LTS 配置 Jupyter notebook 为服务器 原材料: Ubuntu 16.04 LTS 64bit 已经配置好 IPyth 阅读全文
posted @ 2017-08-03 19:35 cphmvp 阅读(672) 评论(0) 推荐(0)
摘要:import numpy as npimport pylab as pldates=['20170314','20170315','20170316','20170317','20170318','20170319']x = range(len(dates))y = [1974786,3502609 阅读全文
posted @ 2017-03-20 17:10 cphmvp 阅读(358) 评论(0) 推荐(0)
摘要:1: 使用方法 sh sync.sh code_dir 代码 2: 添加定时任务 每30s触发一次 阅读全文
posted @ 2016-08-18 15:51 cphmvp 阅读(1437) 评论(0) 推荐(0)
摘要:1、基础环境安装https://pypi.python.org/packages/source/b/backports.ssl_match_hostname/backports.ssl_match_hostname-3.4.0.2.tar.gz# tar xvzf backports.ssl_mat 阅读全文
posted @ 2016-08-10 18:04 cphmvp 阅读(740) 评论(1) 推荐(0)
摘要:验证python-mysql是否安装 1:python 2: import MySQLdb 安装步骤: 1、sudo apt-get install python-setuptools 2、sudo apt-get install libmysqld-dev 3、sudo apt-get insta 阅读全文
posted @ 2016-07-21 16:17 cphmvp 阅读(405) 评论(0) 推荐(0)
摘要:python的正则表达式模块是re,替换相关的方法是sub。 例如我们要做如下的替换将所有的 替换为空格,可以通过下面代码实现: 如果要做分组替换需要在替换的字符串中指定分组\1, 反斜杠+数字表示替换第n个分组 例如假定我要把abc此处在&nbsp和;之间的字符串需要保留。这样就需要分组替换了,正 阅读全文
posted @ 2016-07-21 15:49 cphmvp 阅读(487) 评论(0) 推荐(0)
摘要:做爬虫经常会有这样的引用场景 ,原始网页存储格式为 url+\t+ html php 有个explode的 拆分文本行方法,比较方便直接接收列值 与之对应的python写法 下面的是备忘 阅读全文
posted @ 2016-07-21 15:34 cphmvp 阅读(345) 评论(0) 推荐(0)
摘要:前言: 从事网络爬虫三年有余,近期工作稍微有所调整 ,开始倾向于数据分析。之前零零散散的做过些简要的分析【电商数据分析,社交媒体状态分析】。而至于数据分析也算新手,没有系统的学过 。 计划这个方式掌控学习: 为生产环境快速实现case【code by python】--> 补充理论知识【书,下列有书... 阅读全文
posted @ 2015-10-20 17:31 cphmvp 阅读(226) 评论(0) 推荐(0)

爬虫在线测试小工具: http://tool.haoshuju.cn/