摘要: ### 簡單的爬蟲 二 ಥ_ಥ 爬一爬 一個博客的每篇文件的標題;> 這裏我是通過該博客的首頁裏面的列表進行的,判斷下一頁的標籤是否存在來把這個博客的文> 章都爬出來;不是通過博客的文章分類開始爬的,雖然代碼差不多,但是我這個是簡單的;> 複雜的我不會 ಥ_ಥ_* 判斷是否下一頁的標籤是否有效,來進... 阅读全文
posted @ 2015-04-24 19:00 ทดสอบ 阅读(141) 评论(0) 推荐(0)
摘要: ##Crawler and nodejs### 簡單的爬蟲 一 ಥ_ಥ(就是一個頁面)>* 需要cheerio來過濾加載到內容;先安裝cheerio;>* $('.postTitle a') 過濾該頁面的 .postTitle 類下的 a便籤;>* 通過writeFileSync把過濾好的內容寫... 阅读全文
posted @ 2015-04-24 18:52 ทดสอบ 阅读(229) 评论(0) 推荐(0)