2017年10月28日

三、爬动态数据

摘要: 该网站动态表现在不知道页码有多少个,页面往下翻,页面就会自动加载上来 阅读全文

posted @ 2017-10-28 21:18 Michael2397 阅读(150) 评论(0) 推荐(0)

二、抓取网络上的资源信息

摘要: 一、获取到网络上的网页 二、获取想要的数据 但不是所有的,使用下面的方式获取所有 二、伪造登陆 三、爬取多个网页 四、应对js-爬取手机端 阅读全文

posted @ 2017-10-28 21:04 Michael2397 阅读(313) 评论(0) 推荐(0)

一、使用 BeautifulSoup抓取网页信息信息

摘要: 一、解析网页信息 二、获取要爬取元素的位置 浏览器右键-》审查元素-》copy-》seletor 修改成: 这时候能获取到一个 获取到了所有图片 获取到了其他信息 三、获取标签中的文本信息(get_text())及属性(get()) 封装成字典: 因为cates有多个属性,需要上升到父节点 四、完整 阅读全文

posted @ 2017-10-28 16:15 Michael2397 阅读(1370) 评论(0) 推荐(0)

导航