2018 年 3月 28 日随笔档案 - 阿丹丹酱

2018年3月28日

网络爬虫基本练习

摘要： 0.可以新建一个用于练习的html文件，在浏览器中打开。 1.利用requests.get(url)获取网页页面的html文件 2.利用BeautifulSoup的HTML解析器，生成结构树 3.练习：取出h1标签的文本取出a标签的链接取出所有li标签的所有内容取出第2个li标签的a标签的第阅读全文

posted @ 2018-03-28 22:36 阿丹丹酱阅读(135) 评论(0) 推荐(0) 编辑

摘要： f=open("C:/Users/ZD/PycharmProjects/test/test.txt",'r',encoding='utf8') str=f.read() f.close() import jieba wordList=jieba.cut(str) wordList=list(jieba.cut(str)) wordDic={} for i in set(wordList): ... 阅读全文

posted @ 2018-03-28 15:20 阿丹丹酱阅读(227) 评论(0) 推荐(0) 编辑

阿丹丹酱

网络爬虫基本练习

统计中文文章词频

导航

公告