摘要: Virtualenv、Git、Pythonanywhere Virtualenv,虚拟环境,用于分隔Python版本,以保持版本的纯净度。在Pythonanywhere上搭建服务器,需要另外创建Virtualenv,而不是把本地的Virtualenv目录传到Github去。 Git,今天被它搞得很头 阅读全文
posted @ 2019-11-19 15:39 壹欧壹 阅读(159) 评论(0) 推荐(0)
摘要: 开始学Django 2019年10月29日,第0天,在Github怎么创建分支的问题上,琢磨了挺久的,一度以为是不懂英语的问题,第二天发现是操作错误了,要先上传一个问题才能创建分支的。 2019年10月30日,第一天,在Anaconda3的Python3版本和原生Python3版本的选择上耽误了一些 阅读全文
posted @ 2019-10-31 12:14 壹欧壹 阅读(224) 评论(0) 推荐(0)
摘要: 这个做SEO的时候非常需要,以前从DEDECMS转战PHPCMS,最痛苦的就是设置伪静态,一直想设置 栏目名/文章ID.html 这样的规则,但是显然PHPCMS默认不提供,只提供最原始的 list-1-1.html ,show-1-1.html,这种URL对搜索引擎和用户都是不友好的(不符合百度搜 阅读全文
posted @ 2017-09-14 18:25 壹欧壹 阅读(2425) 评论(0) 推荐(0)
摘要: 朋友说他的站挂了,想知道被收录的页面有多少是死链,于是我就想了一下流程,从Site获得收录数量当然是不精准的,不过也没有更好的地了,真实的收录只有搜索引擎数据库里面才有。。。 查询被收录页面的状态码,流程:获取收录网址 > 解析真实URL > 获取状态码 不过执行起来比较慢,不知道是Beautifu 阅读全文
posted @ 2016-06-14 10:28 壹欧壹 阅读(279) 评论(0) 推荐(0)
摘要: 素闻BeautifulSoup提取效率低,艾玛,第一印象果然是很要命的,反正比Re 和 Lxml 是要慢的,不过就无奈Re的正则折腾来折腾去,没写出来,Lxml 的 Xpath 又用得不好。 不过就这三个模版来看,BeautifulSoup的表现还是不错的,够简单,顺便测试了一下时间,抓10个列表页 阅读全文
posted @ 2016-06-01 22:26 壹欧壹 阅读(214) 评论(0) 推荐(0)
摘要: 这篇文章主要介绍了Python BeautifulSoup中文乱码问题的2种解决方法,需要的朋友可以参考下 解决方法一: 使用python的BeautifulSoup来抓取网页然后输出网页标题,但是输出的总是乱码,找了好久找到解决办法,下面分享给大家 首先是代码 复制代码 代码如下: 在刚开始测试的 阅读全文
posted @ 2016-05-20 15:37 壹欧壹 阅读(3326) 评论(0) 推荐(0)
摘要: 转载:http://blog.csdn.net/janronehoo/article/details/25207825 叨叨 短评:这篇文章感觉是比较全面解决Mac MySQLdb模块安装问题的文章了,特别转载一下 安装过程主要是mysql_config not found错误,这个错误通常卡住很多 阅读全文
posted @ 2016-05-16 23:47 壹欧壹 阅读(1640) 评论(0) 推荐(0)
摘要: import pycurl,StringIO,json,time,re,sys,urllib2 from lxml import etree # headers = { # "Accept":"text/html,application/xhtml+xml,application/xml;q=0.9 阅读全文
posted @ 2016-05-10 16:35 壹欧壹 阅读(601) 评论(0) 推荐(0)
摘要: 主要为了装个B,统计栏目页面数量时候用的,多线程基本照抄 http://www.cnblogs.com/fnng/p/3670789.html 关于对SEO有什么用处。。。我觉得。。。仅对本人有用,Python对SEO还是特殊的个性需求 阅读全文
posted @ 2016-05-04 14:56 壹欧壹 阅读(209) 评论(0) 推荐(0)