03 2019 档案
摘要:1、简单说明爬虫原理 请求网站并提取数据的自动化程序 2. 理解爬虫开发过程 1).简要说明浏览器工作原理; 浏览器的主要功能就是向服务器发出请求,在浏览器窗口中展示您想要访问的网络资源。 2).使用 requests 库抓取网站数据 3).了解网页 写一个简单的html文件,包含多个标签,类,id
阅读全文
摘要:红楼梦高频词: 红楼梦整篇小说: 成功排序出高频词: 生成词云如下:
阅读全文
摘要:列表,元组,字典,集合分别如何增删改查及遍历。 列表是有序的,我们可以用之前学过的for循环遍历它,然后输出列表中的每一个值。元组属于特殊的列表 S=(,,,),其内部元素不可以编辑,只可以S[0]方式查询。字典是python中唯一的映射类型,采用键值对的形式存储数据。 总结列表,元组,字典,集合的
阅读全文
摘要:凯撒密码编码与解码: 网址观察与批量生成: 2.英文词频统计预处理 下载一首英文的歌词或文章或小说,保存为utf8文件。 从文件读出字符串。 将所有大写转换为小写 将所有其他做分隔符(,.?!)替换为空格 分隔出一个一个的单词 并统计单词出现的次数。 text="Mr. Johnson had ne
阅读全文