2017 年 8月随笔档案 - 笑面浮屠

摘要：编译环境： Windows7+Ecliplse+Django 解决方法就是在<th>外面加<tr>. 阅读全文

posted @ 2017-08-30 22:37 笑面浮屠阅读(1056) 评论(0) 推荐(0)

摘要：一. From: http://www.sharejs.com/codes/Python/8309 1.在Scrapy工程下新建“middlewares.py” 2.在项目配置文件里(./project_name/settings.py)添加只要两步，现在请求就是通过代理的了。测试一下^_^ 二. 阅读全文

posted @ 2017-08-28 14:10 笑面浮屠阅读(7838) 评论(0) 推荐(0)

输入一个图片URL显示 {"error":"imagemogr2:File too large,please use pfop service"}

摘要：{"error":"imagemogr2:File too large,please use pfop service"} ex: http://img5.mtime.cn/pi/u/2017/05/04/201118.78502982_1000X1000.jpg 待解。。。阅读全文

posted @ 2017-08-28 01:32 笑面浮屠阅读(1389) 评论(0) 推荐(0)

为何大量网站不能抓取?爬虫突破封禁的6种常见方法 - 转载

摘要：传送门：http://www.cnblogs.com/junrong624/p/5533655.html 在互联网上进行自动数据采集（抓取）这件事和互联网存在的时间差不多一样长。今天大众好像更倾向于用“网络数据采集”，有时会把网络数据采集程序称为网络机器人（bots）。最常用的方法是写一个自动化程序阅读全文

posted @ 2017-08-28 01:14 笑面浮屠阅读(1522) 评论(0) 推荐(0)

Scrapy在 setting.py 文件中设置日志记录等级

摘要：在 setting.py 文件中设置日志记录等级 LOG_LEVEL= 'DEBUG' LOG_FILE ='log.txt' 阅读全文

posted @ 2017-08-28 01:07 笑面浮屠阅读(3603) 评论(0) 推荐(0)

urllib2.HTTPError: HTTP Error 400: Bad Request

摘要：用urllib2抓取图片的时候，部分request报HTTP Error 400: Bad Request 参照：https://stackoverflow.com/questions/8840303/urllib2-http-error-400-bad-request?answertab=acti 阅读全文

posted @ 2017-08-26 21:18 笑面浮屠阅读(9941) 评论(0) 推荐(0)

python中os路径相关的函数 os.mkdir和os.makedirs

摘要：传送门：http://blog.csdn.net/shennongzhaizhu/article/details/51455063 在Python中可以使用os.mkdir()函数创建目录（创建一级目录）。 os.mkdir(path) 例如要在D盘下创建hello的目录 >>> import os 阅读全文

posted @ 2017-08-26 18:06 笑面浮屠阅读(944) 评论(0) 推荐(0)

scrapy 爬网站显示 Filtered offsite request to 错误 - allow_domains设置

摘要：传送门：http://blog.csdn.net/feifly329/article/details/49702063 爬取网站图片时,无法抓取. 在 setting.py 文件中设置日志记录等级 LOG_LEVEL= 'DEBUG' LOG_FILE ='log.txt' 查看日志发现报阅读全文

posted @ 2017-08-26 15:25 笑面浮屠阅读(829) 评论(1) 推荐(0)

Eclipse+Pydev创建Django工程-没有manage.py文件

摘要：创建Django项目的时候项目名第一位不能是数字，否则创建的项目文件不全。阅读全文

posted @ 2017-08-26 00:40 笑面浮屠阅读(868) 评论(0) 推荐(0)

Scrapy中对xpath使用re

摘要：Scrapy中使用xpath时，根据xpath的语法不一定能得到想要的。如下面的html源码：要得到img_1000后面picture的source路径，通过xpath的语法我没有得到直接取到的方法，折中办法参考：http://www.cnblogs.com/Garvey/p/6697162.h 阅读全文

posted @ 2017-08-20 08:43 笑面浮屠阅读(2173) 评论(0) 推荐(0)

urllib2.HTTPError: HTTP Error 403: Forbidden 解决方法 & requests get 403 error

摘要：参考： https://stackoverflow.com/questions/13303449/urllib2-httperror-http-error-403-forbidden https://segmentfault.com/q/1010000000470724 通过测试应该是request 阅读全文

posted @ 2017-08-20 08:27 笑面浮屠阅读(1364) 评论(0) 推荐(0)

xpath笔记-转

摘要：来自Xavier的笔记：https://segmentfault.com/u/lihanx and https://segmentfault.com/q/1010000008883941 菜鸟Xpath教程：http://www.runoob.com/xpath/xpath-tutorial.htm 阅读全文

posted @ 2017-08-20 04:06 笑面浮屠阅读(159) 评论(0) 推荐(0)

如何在eclipse+pydev运行scrapy项目

摘要：参考链接:https://www.zhihu.com/question/28565716（eclipse+pydev配置）参考链接:http://www.cnblogs.com/kongzhagen/p/6549053.html（scrapy爬虫简单实例） 1. 通过eclipse+pydev新建阅读全文

posted @ 2017-08-19 05:55 笑面浮屠阅读(2288) 评论(0) 推荐(0)

QT下发布APP 文件（Mac）

摘要：/Users/it-0003005/QT5.6.0/5.6/clang_64/bin/macdeployqt /Users/it-0003005/Desktop/QTBook/program/Myxxx/0803DUIForDryRunReport.app 如果没有配置过QT环境，就需要到QT的安装阅读全文

posted @ 2017-08-07 04:05 笑面浮屠阅读(428) 评论(0) 推荐(0)

QT调用python脚本

摘要：abc脚本：也能运行python脚本阅读全文

posted @ 2017-08-07 03:36 笑面浮屠阅读(5130) 评论(0) 推荐(0)

QT获取当前app路径和工作路径

该文被密码保护。

posted @ 2017-08-07 03:31 笑面浮屠阅读(1) 评论(0) 推荐(0)

笑面浮屠

08 2017 档案

公告