摘要: 1.选一个自己感兴趣的主题。 2.网络上爬取相关的数据。 3.进行文本分析,生成词云。 4.对文本分析结果解释说明。 5.写一篇完整的博客,附上源代码、数据爬取及分析结果,形成一个可展示的成果。 1我选的是新浪新闻网 2爬取的数据 3全部代码 4结果 阅读全文
posted @ 2017-10-18 22:20 五号小黄 阅读(196) 评论(0) 推荐(0) 编辑
摘要: 1.结构化: 单条新闻的详情字典:news 一个列表页所有单条新闻汇总列表:newsls.append(news) 所有列表页的所有新闻汇总列表:newstotal.extend(newsls) 2.转换成pandas的数据结构DataFrame 3.从DataFrame保存到excel 4.从Da 阅读全文
posted @ 2017-10-18 21:38 五号小黄 阅读(165) 评论(0) 推荐(0) 编辑
摘要: 获取单条新闻的#标题#链接#时间#来源#内容 #点击次数,并包装成一个函数。 获取一个新闻列表页的所有新闻的上述详情,并包装成一个函数。 获取所有新闻列表页的网址,调用上述函数。 完成所有校园新闻的爬取工作。 完成自己所选其他主题相应数据的爬取工作。 import requests import re from bs4 import BeautifulSoup from datetime... 阅读全文
posted @ 2017-10-11 21:57 五号小黄 阅读(183) 评论(0) 推荐(0) 编辑
摘要: 用requests库和BeautifulSoup4库,爬取校园新闻列表的时间、标题、链接、来源。 选一个自己感兴趣的主题,做类似的操作,为“爬取网络数据并进行文本分析”做准备。 阅读全文
posted @ 2017-09-27 11:36 五号小黄 阅读(238) 评论(0) 推荐(0) 编辑
摘要: 中软国际华南区技术总监曾老师还会来上两次课,同学们希望曾老师讲些什么内容?(认真想一想回答) Python有什么用,能应用在生活中的哪些方面 使用jieba库,进行中文词频统计,输出TOP20的词及出现次数。 **排除一些无意义词、合并同一词。 **使用wordcloud库绘制一个词云。 阅读全文
posted @ 2017-09-25 10:07 五号小黄 阅读(200) 评论(0) 推荐(0) 编辑
摘要: 字典实例:建立学生学号成绩字典,做增删改查遍历操作。 >>> d{'05': '80', '14': '78', '02': '90'} 列表,元组,字典,集合的遍历。 总结列表,元组,字典,集合的联系与区别。 1.列表,元组,字典是有顺序的,而集合是没顺序的 2.列表是以方括号形式表示,元组是以圆 阅读全文
posted @ 2017-09-20 09:09 五号小黄 阅读(152) 评论(0) 推荐(0) 编辑
摘要: 1、凯撒密码 2、星座符号 4、输入姓名,格式输出:占4位、居中、不足4字的以空格填充。 5、格式化输出:中华人民共和国国内生产总值(GDP)689,136.89亿元(2015年)(千分位、2位小数,浮点数) 6、实例:打出99乘法表 7、实例: 下载一首英文的歌词或文章,统计单词出现的次数,将所有 阅读全文
posted @ 2017-09-18 11:26 五号小黄 阅读(166) 评论(0) 推荐(0) 编辑
摘要: 注意标准库的两种导入与使用方式,建议大家采用<库名>.<函数名>的方式。 对前面的代码进行优化,用for,while,if,def实现: ①、用循环画五角星 ②、用循环画同心圆 ③、用while循环画太阳花 ④、用函数定义画五个五角星 方法一 import turtle #turtle.setup( 阅读全文
posted @ 2017-09-13 09:55 五号小黄 阅读(219) 评论(0) 推荐(0) 编辑
摘要: 1.Hello World! 简单交互(交互式,文件式)教材P19 用户输入两个数字,计算并输出两个数字之和: 用户输入三角形三边长度,并计算三角形的面积:(海伦公式) 输入半径,计算圆的面积。 画一组同切圆 画一个五角星 画一个全黄色的五角星 阅读全文
posted @ 2017-09-06 11:48 五号小黄 阅读(409) 评论(0) 推荐(0) 编辑
摘要: 一、背景 “百雀羚”是上海百雀羚日用化学有限公司(英文缩写:SPDC)旗下品牌,2008年曾获“中国驰名商标”称号此前“百雀羚”已连续两次获“上海市著名商标”。 百雀羚创立于1931年,是国内屈指可数的历史悠久的著名化妆品厂商。悠久的历史,承载着光辉的业绩,成就了百雀羚品质如金的美誉。品牌曾被多次评 阅读全文
posted @ 2017-09-04 14:33 五号小黄 阅读(4213) 评论(0) 推荐(0) 编辑