随笔档案「2019年8月」 - FishMan552

python实战项目 — 爬取妹子图网，保存图片到本地

摘要：重点： 1. 用def函数 2. 使用 os.path.dirname("路径保存") ，实现每组图片保存在独立的文件夹中方法1： import requests from lxml import etree import os import time start = time.time() d 阅读全文

posted @ 2019-08-20 15:15 FishMan552 阅读(913) 评论(0) 推荐(1)

python实战项目 — 爬取校花网图片

摘要：重点： 1. 指定路径创建文件夹，判断是否存在 2. 保存图片文件 # 获得校花网的地址，图片的链接 import re import requests import time import os start = time.time() num = 0 # 为了记录爬的照片的次数 # 设置路径 pa 阅读全文

posted @ 2019-08-19 14:39 FishMan552 阅读(461) 评论(0) 推荐(1)

python基础 — 链接 Mysql 创建数据库和创表

摘要：重点：１.　链接服务器的数据库２.　创建表和格式３.　插入多行数据 import pymysql try: host='xxx' user='xxx' passwd='xxx' db='test01' port=3306 Table_name='kaka5' # 链接到服务器 db = pym 阅读全文

posted @ 2019-08-09 15:02 FishMan552 阅读(487) 评论(0) 推荐(0)

python基础 — CSV 数据处理

摘要：什么是csv 逗号分隔值（Comma-Separated Values，CSV，有时也称为字符分隔值，因为分隔字符也可以不是逗号），其文件以纯文本形式存储表格数据（数字和文本）编码： encode 解码：decode 写读追加状态 'r'：读'w'：写'a'：追加'r+' == r+w（可读可写，阅读全文

posted @ 2019-08-07 16:48 FishMan552 阅读(744) 评论(0) 推荐(0)

python技巧 — Chrome浏览器中的 XPath Helper

摘要：用于XPath 爬取网页结构的时候使用，安装后快捷键调用左边 ctrl+ shift+x 启动安装流程： 1. 打开chrome浏览器，扩展程序。搜索 XPath Helper 下载安装（前提需要梯子，因为这个是属于goolge商店应用）有这个显示就是安装成功了 2. 点击详情，勾选隐身阅读全文

posted @ 2019-08-07 10:55 FishMan552 阅读(1131) 评论(0) 推荐(0)

python实战项目 — 爬取中国票房网年度电影信息并保存在csv

摘要：import pandas as pd import requests from bs4 import BeautifulSoup import time def spider(url, headers): print("正在抓取url: " + url) datas = requests.get( 阅读全文

posted @ 2019-08-06 16:56 FishMan552 阅读(1431) 评论(0) 推荐(0)

羊肉串552

12346

08 2019 档案

公告