随笔分类 -  python网络爬虫

摘要:1、安装Beautiful Soup库: 2、导入bs4库: 3、创建BeautifulSoup对象: ①、根据html文本创建对象: ②、根据html文件创建对象: 4、格式化输出html文本: 5、获取tag对象: 6、获取标签的属性: 7、获取标签的文本: 8、遍历节点: (1)直接子节点: 阅读全文
posted @ 2017-07-11 23:14 还是原来那个我 阅读(155) 评论(0) 推荐(0)
摘要:#!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2017/7/11 18:57 # @Author : 李振华 # 多线程快速抓取某个网页全部图片 import lxml import threading import requests import queue from bs4 import BeautifulSoup... 阅读全文
posted @ 2017-07-11 18:52 还是原来那个我 阅读(239) 评论(0) 推荐(0)