03 2018 档案

 
网络爬虫基础练习
摘要:1.利用requests.get(url)获取网页页面的html文件 import requests newsurl='http://news.gzcc.cn/html/xiaoyuanxinwen/' res = requests.get(newsurl) #返回response对象 res.en 阅读全文
posted @ 2018-03-30 13:07 101陈瑾 阅读(186) 评论(0) 推荐(0)
综合练习:词频统计
摘要:综合练习 词频统计预处理 下载一首英文的歌词或文章 将所有,.?!’:等分隔符全部替换为空格 将所有大写转换为小写 生成单词列表 生成词频统计 排序 排除语法型词汇,代词、冠词、连词 输出词频最大TOP20 将分析对象存为utf-8编码的文件,通过文件读取的方式获得词频分析内容。 阅读全文
posted @ 2018-03-26 20:32 101陈瑾 阅读(146) 评论(0) 推荐(0)
组合数据类型练习
摘要:组合数据类型练习: 分别定义字符串,列表,元组,字典,集合,并进行遍历。 总结列表,元组,字典,集合的联系与区别: (1)列表是任意对象的序列。列表用方括号表示。 (2)将一组值打包到一个对象中,称为元组。元组用圆括号表示。元组和列表的大部分操作相同。但是,列表是不固定的,可以随时插入,删除;而元组 阅读全文
posted @ 2018-03-22 20:35 101陈瑾 阅读(121) 评论(0) 推荐(0)
Python基础综合练习
摘要:Pycharm开发环境设置与熟悉。 练习基本输入输出: print('你好,{}.'.format(name)) print(sys.argv) 库的使用方法: import ... from ... import ... 条件语句: if (abs(pos()))<1: break 循环语句: f 阅读全文
posted @ 2018-03-19 20:58 101陈瑾 阅读(139) 评论(0) 推荐(0)
linux基本命令
摘要:请按要求上机实践如下linux基本命令。 cd命令:切换目录 切换到目录 /usr/local cd/ cd /usr cd /usr/local 去到目前的上层目录 cd .. (3)回到自己的主文件夹 cd ~ ls命令:查看文件与目录 (4)查看目录/usr下所有的文件 cd /usr ls 阅读全文
posted @ 2018-03-12 21:29 101陈瑾 阅读(134) 评论(0) 推荐(0)
大数据概述
摘要:1.试述大数据对思维方式的重要影响。 大数据又称为巨量数据、海量数据,是由数量巨大、结构复杂、类型众多数据构成的数据集合,是基于云计算的数据处理与应用模式,通过数据的集成共享,交叉复用形成的智力资源和知识服务能力。与传统数据相比,大数据具有来源广、规模大,更容易发现事物之间的关联性,实现对未来的合理 阅读全文
posted @ 2018-03-05 10:53 101陈瑾 阅读(337) 评论(0) 推荐(0)