摘要: 1.选一个自己感兴趣的主题。 2.网络上爬取相关的数据。 3.进行文本分析,生成词云。 4.对文本分析结果解释说明。 5.写一篇完整的博客,附上源代码、数据爬取及分析结果,形成一个可展示的成果。 阅读全文
posted @ 2017-11-02 20:23 12-张振勋 阅读(239) 评论(0) 推荐(0) 编辑
摘要: 1.结构化: 单条新闻的详情字典:news 一个列表页所有单条新闻汇总列表:newsls.append(news) 所有列表页的所有新闻汇总列表:newstotal.extend(newsls) 2.转换成pandas的数据结构DataFrame 3.从DataFrame保存到excel 4.从Da 阅读全文
posted @ 2017-10-18 20:59 12-张振勋 阅读(199) 评论(0) 推荐(0) 编辑
摘要: 获取单条新闻的#标题#链接#时间#来源#内容 #点击次数,并包装成一个函数。 import requests from bs4 import BeautifulSoup import re url_main="http://news.gzcc.cn/html/xiaoyuanxinwen/" res 阅读全文
posted @ 2017-10-11 21:12 12-张振勋 阅读(310) 评论(0) 推荐(0) 编辑
摘要: 用requests库和BeautifulSoup4库,爬取校园新闻列表的时间、标题、链接、来源。 选一个自己感兴趣的主题,做类似的操作,为“爬取网络数据并进行文本分析”做准备。 阅读全文
posted @ 2017-09-27 21:40 12-张振勋 阅读(338) 评论(0) 推荐(0) 编辑
摘要: 中软国际华南区技术总监曾老师还会来上两次课,同学们希望曾老师讲些什么内容?(认真想一想回答) 希望老师讲一下python技术在哪些地方、哪些项目部分有所应用,可以的话展示一下部分的实际项目。 中文分词 下载一中文长篇小说,并转换成UTF-8编码。 使用jieba库,进行中文词频统计,输出TOP20的 阅读全文
posted @ 2017-09-25 16:31 12-张振勋 阅读(853) 评论(0) 推荐(0) 编辑
摘要: 列表实例:由字符串创建一个作业评分列表,做增删改查询统计遍历操作。例如,查询第一个3分的下标,统计1分的同学有多少个,3分的同学有多少个等。 字典实例:建立学生学号成绩字典,做增删改查遍历操作。 列表,元组,字典,集合的遍历。 总结列表,元组,字典,集合的联系与区别。 列表:有序,可做增删改查操作, 阅读全文
posted @ 2017-09-20 17:42 12-张振勋 阅读(308) 评论(0) 推荐(0) 编辑
摘要: 实例:输出12个星座符号,以反斜线分隔。 输出结果: 实例:恺撒密码的编码 输出结果: 输入姓名,格式输出:占4位、居中、不足4字的以空格填充。 输出结果: 格式化输出:中华人民共和国国内生产总值(GDP)689,136.89亿元(2015年)(千分位、2位小数,浮点数) 输出结果: 实例:打出99 阅读全文
posted @ 2017-09-18 16:42 12-张振勋 阅读(337) 评论(0) 推荐(0) 编辑
摘要: 用循环画五角星 用循环画同心圆 用while循环画太阳花 用函数定义画五个五角星 用函数定义画钻石花瓣的太阳花 输入学号,识别年级、专业、序号 输入1-7的数字,输出对应的“星期几”。 识别身份证号中的省市区、年龄、性别。 识别身份证号中的省市区、年龄、性别。 阅读全文
posted @ 2017-09-13 21:51 12-张振勋 阅读(433) 评论(0) 推荐(0) 编辑
摘要: 输出“hello world” 运行结果: 简单交互(交互式,文件式):简单的人名对话 运行结果: 用户输入两个数字,计算并输出两个数字之和: 运行结果: 用户输入三角形三边长度,并计算三角形的面积:(海伦公式) 1 a=float(input("请输入第一条边长:")) 2 b=float(inp 阅读全文
posted @ 2017-09-06 21:29 12-张振勋 阅读(8192) 评论(0) 推荐(0) 编辑
摘要: 下图为对于“华为”关键词进行百度搜索的搜索指数图,在2017年8月初至9月初这30天中,在关于“华为”这一关键词的搜索量出现几个较为大的搜索峰值。根据几个峰值与对应日期进行分析,出现这几个峰值的主要原因是华为公司进行的新品发布以及网上对华为手机的各种评测,导致了人们对华为的关注量与搜索量的上升。 如 阅读全文
posted @ 2017-09-04 19:03 12-张振勋 阅读(2476) 评论(1) 推荐(0) 编辑