2017 年 10月 28 日随笔档案 - Michael2397 - 博客园

2017年10月28日

三、爬动态数据

摘要：该网站动态表现在不知道页码有多少个，页面往下翻，页面就会自动加载上来阅读全文

posted @ 2017-10-28 21:18 Michael2397 阅读(150) 评论(0) 推荐(0)

二、抓取网络上的资源信息

摘要：一、获取到网络上的网页二、获取想要的数据但不是所有的，使用下面的方式获取所有二、伪造登陆三、爬取多个网页四、应对js-爬取手机端阅读全文

posted @ 2017-10-28 21:04 Michael2397 阅读(313) 评论(0) 推荐(0)

一、使用 BeautifulSoup抓取网页信息信息

摘要：一、解析网页信息二、获取要爬取元素的位置浏览器右键-》审查元素-》copy-》seletor 修改成：这时候能获取到一个获取到了所有图片获取到了其他信息三、获取标签中的文本信息（get_text()）及属性（get()）封装成字典：因为cates有多个属性，需要上升到父节点四、完整阅读全文

posted @ 2017-10-28 16:15 Michael2397 阅读(1370) 评论(0) 推荐(0)

导航

公告