摘要: 1.选一个自己感兴趣的主题。 2.网络上爬取相关的数据。 3.进行文本分析,生成词云。 4.对文本分析结果解释说明。 5.写一篇完整的博客,附上源代码、数据爬取及分析结果,形成一个可展示的成果。 网站:80电影天堂网站(http://www.80dyy.cc/80kehuan/index.html) 阅读全文
posted @ 2017-11-01 15:37 410陈锐锦 阅读(4920) 评论(0) 推荐(0) 编辑
摘要: 首先在自己电脑安装pandas库: 还有安装openpyxl库。 1.结构化: 单条新闻的详情字典:news 一个列表页所有单条新闻汇总列表:newsls.append(news) 所有列表页的所有新闻汇总列表:newstotal.extend(newsls) 2.转换成pandas的数据结构Dat 阅读全文
posted @ 2017-10-19 17:22 410陈锐锦 阅读(321) 评论(0) 推荐(0) 编辑
摘要: 获取单条新闻的#标题#链接#时间#来源#内容 #点击次数,并包装成一个函数。 点击次数: 结果: 后面函数: 完成自己所选其他主题相应数据的爬取工作。 阅读全文
posted @ 2017-10-12 19:36 410陈锐锦 阅读(210) 评论(0) 推荐(0) 编辑
摘要: 画图显示: 结果: 用requests库和BeautifulSoup4库,爬取校园新闻列表的时间、标题、链接、来源、详细内容 爬虫,网页信息 结果: 加上时间: 效果: 将其中的时间str转换成datetime类型。 将取得详细内容的代码包装成函数。 结果: 选一个自己感兴趣的主题,做类似的操作,为 阅读全文
posted @ 2017-09-28 16:01 410陈锐锦 阅读(241) 评论(0) 推荐(0) 编辑
摘要: 代码部分: 结果: 最重要的词是“大队”,也符合小说剧情 阅读全文
posted @ 2017-09-25 21:36 410陈锐锦 阅读(129) 评论(0) 推荐(0) 编辑
摘要: 排除语法型词汇,代词、冠词、连词 1、列表实例:由字符串创建一个作业评分列表,做增删改查询统计遍历操作。例如,查询第一个3分的下标,统计1分的同学有多少个,3分的同学有多少个 2、字典实例:建立学生学号成绩字典,做增删改查遍历操作。 3、总结列表,元组,字典,集合的联系与区别 列表/元组/集合/字典 阅读全文
posted @ 2017-09-21 21:17 410陈锐锦 阅读(241) 评论(0) 推荐(0) 编辑
摘要: 运行结果: 运行结果: 运行结果: 运行结果: 阅读全文
posted @ 2017-09-18 18:01 410陈锐锦 阅读(127) 评论(0) 推荐(0) 编辑
摘要: 用循环画五角星: 效果图: 用循环画同心圆: 代码: 效果图: 画太阳花: while循环画: 代码: 效果图: 函数定义画: 效果图: 字符串: 阅读全文
posted @ 2017-09-15 19:02 410陈锐锦 阅读(205) 评论(0) 推荐(0) 编辑
摘要: 题目: 1:输出Hello World! 2:简单交互 效果: 交互式: 3:两个数字相加 一行代码实现: 4:用户输入三角形三边长度,并计算三角形的面积:(海伦公式) 结果: 5:输入半径,计算圆的面积 效果: 6:画一个同切圆 效果: 7画一个五角星 效果: 8:画一个有颜色填充的五角星 效果: 阅读全文
posted @ 2017-09-07 17:07 410陈锐锦 阅读(402) 评论(0) 推荐(0) 编辑
摘要: 神偷奶爸3的大数据情况 阅读全文
posted @ 2017-09-04 18:32 410陈锐锦 阅读(140) 评论(0) 推荐(0) 编辑