随笔分类 -  python

摘要:1、模块 模块尽量使用小写命名,首字母保持小写,尽量不要用下划线(除非多个单词,且数量不多的情况) 1 # 正确的模块名 2 import decoder 3 import html_parser 4 5 # 不推荐的模块名 6 import Decoder 2、类名 类名使用驼峰(CamelCas 阅读全文
posted @ 2019-11-02 14:37 阿锋佬 阅读(2176) 评论(0) 推荐(0)
摘要:已经安装过python3.5 1、安装flask: pip install flask 2、安装apache: Apache是开源软件,针对windows环境,它不直接提供编译版本。可以在http://www.apachelounge.com/download/ 下载适合自己环境的版本。 根据我自己 阅读全文
posted @ 2018-06-24 16:53 阿锋佬 阅读(560) 评论(0) 推荐(0)
摘要:PHP主要用在服务器端做网站后台开发,有些功能用PHP来实现有点费劲或者无法实现,现在在学习python,同样是脚本语言,感觉python能做的事情PHP不一定能胜任。但是现在大部分的网站后台也是用PHP写的,虽然python可以作为WEB开发(flask,这个看了一段时间感觉既然网站用PHP开发好 阅读全文
posted @ 2018-06-21 23:00 阿锋佬 阅读(13063) 评论(0) 推荐(0)
摘要:一.pyinstaller简介 Python是一个脚本语言,被解释器解释执行。它的发布方式: .py文件:对于开源项目或者源码没那么重要的,直接提供源码,需要使用者自行安装Python并且安装依赖的各种库。(Python官方的各种安装包就是这样做的) .pyc文件:有些公司或个人因为机密或者各种原因 阅读全文
posted @ 2018-06-21 22:55 阿锋佬 阅读(1832) 评论(0) 推荐(0)
摘要:百度目前提供自动提交链接和手动提交链接两种方式,其中自动提交又分为主动推送、自动推送和sitemap三种形式,按百度的说法,主动推送的效果最好,百度站长平台后台也提供了curl、php、ruby的推送示例代码但没有提供python代码,网上很少有现成的python版本主动推送代码(仅有的也有点小问题 阅读全文
posted @ 2017-01-06 09:39 阿锋佬 阅读(3966) 评论(0) 推荐(0)
摘要:在使用pyquery时发现一些问题, 1.爬取的html中如果有较多的错误时,不能很好的补全。 2.如果要获取某个class中的内容时,如果内容太多不能取完整!只能取一部分。 这个在现在的最新版本中还没有很好的解决吧! 所以我就换回beautifulsoup,就没有这两个问题了! 使用lxml HT 阅读全文
posted @ 2016-11-26 16:53 阿锋佬 阅读(246) 评论(0) 推荐(0)
摘要:python 3和2很大区别就是python本身改为默认用unicode编码。 字符串不再区分"abc"和u"abc", 字符串"abc"默认就是unicode,不再代表本地编码、 由于有这种内部编码,像c#和java类似,再没有必要在语言环境内做类似设置编码,比如“sys.setdefaulten 阅读全文
posted @ 2016-09-17 09:13 阿锋佬 阅读(312) 评论(0) 推荐(0)
摘要:1、linux下安装python3 a、 准备编译环境(环境如果不对的话,可能遇到各种问题,比如wget无法下载https链接的文件) 2 下载 Python3.5代码包 在安装包中有一个README的文件,里面有写如何安装 做软链: 安装成功了! 如果提示:Ignoring ensurepip f 阅读全文
posted @ 2016-09-08 23:25 阿锋佬 阅读(122424) 评论(0) 推荐(11)
摘要:今天写了个tool,目的是把csv中的数据插入到数据库中去。其中有一部分,是需要分别向两张表中插入两条数据,如果第二张表中的数据已经存在,那么第一张表中的数据也不需要插入。 然后通过百度查找发现,其实MySQLdb库,自带了事务处理的功能,pymysql库也是一样。 conn = MySQLdb.c 阅读全文
posted @ 2016-09-05 14:36 阿锋佬 阅读(11687) 评论(0) 推荐(0)
摘要:urllib是python的一个获取url(Uniform Resource Locators,统一资源定址器)了,我们可以利用它来抓取远程的数据进行保存哦,下面整理了一些关于urllib使用中的一些关于header,代理,超时,认证,异常处理处理方法,下面一起来看看。 python3 抓取网页资源 阅读全文
posted @ 2016-08-08 13:55 阿锋佬 阅读(8232) 评论(1) 推荐(2)
摘要:requests是python的一个HTTP客户端库,跟urllib,urllib2类似,那为什么要用requests而不用urllib2呢?官方文档中是这样说明的: python的标准库urllib2提供了大部分需要的HTTP功能,但是API太逆天了,一个简单的功能就需要一大堆代码。 我也看了下r 阅读全文
posted @ 2016-07-27 17:13 阿锋佬 阅读(520) 评论(0) 推荐(0)
摘要:你是否觉得 XPath 的用法多少有点晦涩难记呢? 你是否觉得 BeautifulSoup 的语法多少有些悭吝难懂呢? 你是否甚至还在苦苦研究正则表达式却因为少些了一个点而抓狂呢? 你是否已经有了一些前端基础了解选择器却与另外一些奇怪的选择器语法混淆了呢? 嗯,那么,前端大大们的福音来了,PyQue 阅读全文
posted @ 2016-07-18 11:16 阿锋佬 阅读(931) 评论(0) 推荐(0)
摘要:官方文档上说的比较简单: pip install pyspider 但是实际安装时还是有些问题导致无法成功。 windows下安装 先安装PhantomJS 可以依照自己的开发平台选择不同的包进行下载 http://phantomjs.org/download.html windows下直接下载安装 阅读全文
posted @ 2016-07-14 13:56 阿锋佬 阅读(321) 评论(0) 推荐(0)
摘要:笔记之Python网络数据采集 非原创即采集 一念清净, 烈焰成池, 一念觉醒, 方登彼岸 网络数据采集, 无非就是写一个自动化程序向网络服务器请求数据, 再对数据进行解析, 提取需要的信息 通常, 有api可用, api会比写网络爬虫程序来获取数据更加方便. Part1 创建爬虫 Chapter1 阅读全文
posted @ 2016-07-08 09:13 阿锋佬 阅读(14849) 评论(0) 推荐(5)
摘要:从网上抓了一些字节流,想打印出来结果发生了一下错误: UnicodeEncodeError: 'gbk' codec can't encode character '\xbb' in position 8530: illegal multibyte sequence 代码 错误信息让人很困惑,为什么 阅读全文
posted @ 2016-07-06 15:03 阿锋佬 阅读(70158) 评论(5) 推荐(23)
摘要:前言 crontab是Unix和Linux用于设置周期性被执行的指令,是互联网很常用的技术,很多任务都会设置在crontab循环执行,如果不使用crontab,那么任务就是常驻程序,这对你的程序要求比较高,一个要求你的程序是24X7小时不宕机,一个是要求你的调度程序比较可靠,实际工作中,90%的程序 阅读全文
posted @ 2016-06-03 17:29 阿锋佬 阅读(4323) 评论(0) 推荐(0)