77真的很菜

2020年1月10日

摘要：知乎爬虫过程详解（附完整代码） https://blog.csdn.net/maybeforever/article/details/97292261 Python爬虫爬取动态网页:全国中小企业股份转让系统完整模拟了发POST请求。 https://blog.csdn.net/guanmaonin 阅读全文

posted @ 2020-01-10 14:33 77真的很菜阅读(237) 评论(0) 推荐(0)

2020年1月9日

Linux 操作集合

摘要： ps -aux：https://www.cnblogs.com/dion-90/articles/9048627.html 阅读全文

posted @ 2020-01-09 11:25 77真的很菜阅读(101) 评论(0) 推荐(0)

2020年1月8日

猫眼电影top100爬虫

摘要： Excel版本 from urllib import request,parse from bs4 import BeautifulSoup import csv class CatEye(): def __init__(self): self.url='https://maoyan.com/boa 阅读全文

posted @ 2020-01-08 16:21 77真的很菜阅读(319) 评论(0) 推荐(1)

2020年1月3日

ubuntu 软件安装链接汇总

摘要：安装caj文件阅读器： https://blog.csdn.net/mr__le/article/details/91345644 Ubuntu18.04 配置S-had0w-*s0cks： https://www.imzzj.com/post-549.html Vmware Ubuntu安装详细过阅读全文

posted @ 2020-01-03 09:42 77真的很菜阅读(188) 评论(0) 推荐(0)

2019年12月11日

百度百科基础爬虫

摘要：出处：Python爬虫开发与系项目实战作者：范传辉基础爬虫框架爬虫调度器：统筹别的四个模块 URL管理器：维护已经爬取了的url集合和获得新的未爬取的url链接 HTML下载器：从URL管理器中，获取url，并下载html网页 HTML解析器：从下载器中，截取有效数据数据存储器：将有效数据进阅读全文

posted @ 2019-12-11 10:02 77真的很菜阅读(536) 评论(2) 推荐(0)

豆瓣Top250

摘要： 1 """ 2 爬取豆瓣电影TOP250 - 完整示例代码 3 """ 4 5 import codecs 6 7 import requests 8 from bs4 import BeautifulSoup 9 10 DOWNLOAD_URL = 'http://movie.douban.com 阅读全文

posted @ 2019-12-11 09:57 77真的很菜阅读(414) 评论(0) 推荐(0)

2019年12月9日

Hello!

摘要：每日更新当天笔记！！冲鸭！！！阅读全文

posted @ 2019-12-09 10:04 77真的很菜阅读(153) 评论(0) 推荐(0)

公告