2017 年 9月 8 日随笔档案 - 佳星辰

2017年9月8日

摘要：这次的主要的目的是从淘宝的搜索页面获取商品的信息。其实分析页面找到信息很容易，页面信息的存放都是以静态的方式直接嵌套的页面上的，很容易找到。主要困难是将信息从HTML源码中剥离出来，数据和网页源码结合的很紧密，剥离数据有一定的难度。然后将获取的信息写入excel表格保存起来，这次只爬取了前面10页阅读全文

posted @ 2017-09-08 13:36 佳星辰阅读(36334) 评论(15) 推荐(1)

佳星辰

公告