03 2018 档案

摘要:0.可以新建一个用于练习的html文件,在浏览器中打开。 1.利用requests.get(url)获取网页页面的html文件 2.利用BeautifulSoup的HTML解析器,生成结构树 3.找出特定标签的html元素 4.取得含有特定CSS属性的元素 5.练习: 取出h1标签的文本 取出a标签 阅读全文
posted @ 2018-03-30 19:24 229曾颖鑫 阅读(105) 评论(0) 推荐(0)
摘要:1.英文词频统 下载一首英文的歌词或文章 将所有,.?!’:等分隔符全部替换为空格 将所有大写转换为小写 生成单词列表 生成词频统计 排序 排除语法型词汇,代词、冠词、连词 输出词频最大TOP20 将分析对象存为utf-8编码的文件,通过文件读取的方式获得词频分析内容 2.中文词频统计 下载一长篇中 阅读全文
posted @ 2018-03-28 19:52 229曾颖鑫 阅读(105) 评论(0) 推荐(0)
摘要:字符串: 列表: 元组: 集合: 列表,元组,字典,集合的联系与区别:列表是用[]括起来,元组是用()括起来的,字典集合都是用{}括起来。列表是可变序列,可以索引查找元素进行增删,而元组是只读列表,数据不可修改。字典由一对对键值对组成,键唯一值不唯一,集合是由无序且不重复的数据组成。 阅读全文
posted @ 2018-03-22 22:23 229曾颖鑫 阅读(70) 评论(0) 推荐(0)
摘要:综合练习:画一面五星红旗,将代码与运行截图发布博客交作业。 字符串练习: http://news.gzcc.cn/html/2017/xiaoyuanxinwen_1027/8443.html 取得校园新闻的编号 https://docs.python.org/3/library/turtle.ht 阅读全文
posted @ 2018-03-21 20:41 229曾颖鑫 阅读(134) 评论(0) 推荐(0)
摘要:cd命令:切换目录 (1)切换到目录 /usr/local cd/user/local (2)去到目前的上层目录 cd .. (3)回到自己的主文件夹 cd~ ls命令:查看文件与目录 (4)查看目录/usr下所有的文件 ls -a/usr mkdir命令:新建新目录 (5)进入/tmp目录,创建一 阅读全文
posted @ 2018-03-13 16:56 229曾颖鑫 阅读(97) 评论(0) 推荐(0)
摘要:1、试述大数据对思维方式的重要影响。 答:在《大数据时代:工作、生活与思维的大变革》一书中明确指出,大数据时代最大的转变就是思维方式的3种转变:全面而非抽样、效率而非精确、相关而非因果。一.全样而非抽样:大数据技术的核心就是海量的数据的存储和处理,分布式文件系统和分布式数据库技术提供了理论上近乎无限 阅读全文
posted @ 2018-03-06 16:56 229曾颖鑫 阅读(405) 评论(0) 推荐(0)