随笔分类 - python网络爬虫
摘要:1、安装Beautiful Soup库: 2、导入bs4库: 3、创建BeautifulSoup对象: ①、根据html文本创建对象: ②、根据html文件创建对象: 4、格式化输出html文本: 5、获取tag对象: 6、获取标签的属性: 7、获取标签的文本: 8、遍历节点: (1)直接子节点:
阅读全文
摘要:#!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2017/7/11 18:57 # @Author : 李振华 # 多线程快速抓取某个网页全部图片 import lxml import threading import requests import queue from bs4 import BeautifulSoup...
阅读全文

浙公网安备 33010602011771号