上一页 1 ··· 80 81 82 83 84 85 86 87 88 ··· 125 下一页
摘要: 1.接口地址 https://www.instagram.com/p/shortcode/?__a=1 如何获取shortcode 比如说文章地址是https://www.instagram.com/p/BhxqnqtH9Ws/?taken-by=lanlan521425 那么其shortcode就 阅读全文
posted @ 2018-06-06 17:02 公众号python学习开发 阅读(887) 评论(0) 推荐(0)
摘要: package main import( "fmt" "io/ioutil" "net/http" ) func gethtml(url string) (r *http.Response, e error){ resp,err := http.Get(url) if err != nil { fmt.Print("error") ... 阅读全文
posted @ 2018-06-05 20:35 公众号python学习开发 阅读(485) 评论(0) 推荐(0)
摘要: 初级 开大括号不能放在单独的一行 未使用的变量 未使用的Imports 简式的变量声明仅可以在函数内部使用 使用简式声明重复声明变量 偶然的变量隐藏Accidental Variable Shadowing 不使用显式类型,无法使用“nil”来初始化变量 使用“nil” Slices and Map 阅读全文
posted @ 2018-06-05 19:12 公众号python学习开发 阅读(440) 评论(0) 推荐(0)
摘要: 打开shell然后输入查看哪个程序占用了apt-get进程 然后给kill掉。使用下面命令查看 ps -aux ,列出所有的进程,但是内容太多了而我们只需要找到apt-get进程就可以 所以我们使用管道符号 grep加上需要查找的关键字即可。 然后根据进程所在id杀死进程,像我的id就是3445 阅读全文
posted @ 2018-06-05 18:01 公众号python学习开发 阅读(269) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2018-06-05 09:33 公众号python学习开发 阅读(199) 评论(0) 推荐(0)
摘要: Referer是浏览器在页面跳转时带入的HTTP头,指示用户上一个页面的URL, 一般来说,网站90%以上的流量应该带有Referer头, 在一些常见的反爬策略中, 大量的不带Referer头的源IP请求会触发"要求输入验证码"策略。 User-Agent 是一个古老的HTTP头,指示用户浏览器的版 阅读全文
posted @ 2018-06-04 16:26 公众号python学习开发 阅读(344) 评论(0) 推荐(0)
摘要: import requests import re import os from fontTools.ttLib import TTFont class MaoYan(object): def __init__(self): self.url = 'http://maoyan.com/films/1 阅读全文
posted @ 2018-06-04 15:39 公众号python学习开发 阅读(895) 评论(0) 推荐(0)
摘要: web_font的一些基本原理 https://blog.csdn.net/fdipzone/article/details/68166388 实例1 猫眼电影 http://www.cnblogs.com/my8100/p/js_maoyandianying.html 实战反爬虫解析-字体替换(天 阅读全文
posted @ 2018-06-04 15:32 公众号python学习开发 阅读(515) 评论(0) 推荐(0)
摘要: 替换函数后面的表达式,一般是去掉eval之后的 点我解密 阅读全文
posted @ 2018-06-04 15:20 公众号python学习开发 阅读(3111) 评论(0) 推荐(0)
摘要: 前言: “去重”是日常工作中会经常用到的一项技能,在爬虫领域更是常用,并且规模一般都比较大。去重需要考虑两个点:去重的数据量、去重速度。为了保持较快的去重速度,一般选择在内存中进行去重。 数据量不大时,可以直接放在内存里面进行去重,例如python可以使用set()进行去重。 当去重数据需要持久化时 阅读全文
posted @ 2018-06-04 11:38 公众号python学习开发 阅读(391) 评论(0) 推荐(0)
上一页 1 ··· 80 81 82 83 84 85 86 87 88 ··· 125 下一页