摘要:
1.选一个自己感兴趣的主题。 2.网络上爬取相关的数据。 3.进行文本分析,生成词云。 4.对文本分析结果解释说明。 5.写一篇完整的博客,附上源代码、数据爬取及分析结果,形成一个可展示的成果。 结果如下图所示: 由于未知原因,词云出现乱码。 阅读全文
摘要:
1.结构化: 单条新闻的详情字典:news 一个列表页所有单条新闻汇总列表:newsls.append(news) 所有列表页的所有新闻汇总列表:newstotal.extend(newsls) 2.转换成pandas的数据结构DataFrame 3.从DataFrame保存到excel 4.从Da 阅读全文
摘要:
获取单条新闻的#标题#链接#时间#来源#内容 #点击次数,并包装成一个函数。 获取一个新闻列表页的所有新闻的上述详情,并包装成一个函数。 获取所有新闻列表页的网址,调用上述函数。 完成所有校园新闻的爬取工作。 import requests import re from bs4 import BeautifulSoup url='http://news.gzcc.cn/html/xiaoyua... 阅读全文
摘要:
用requests库和BeautifulSoup4库,爬取校园新闻列表的时间、标题、链接、来源。 import requests from bs4 import BeautifulSoup url='http://news.gzcc.cn/html/xiaoyuanxinwen/' res=requ 阅读全文
摘要:
1.中软国际华南区技术总监曾老师还会来上两次课,同学们希望曾老师讲些什么内容?(认真想一想回答) 希望能讲一些大数据相关内容,深入了解一下。 2.中文分词 (**两项选做,此次作业要求不能雷同。) 阅读全文
摘要:
列表实例:由字符串创建一个作业评分列表,做增删改查询统计遍历操作。例如,查询第一个3分的下标,统计1分的同学有多少个,3分的同学有多少个等。 score=list('112233345611') print('分数为:') print(score) score.sort() print('排列后:') print(score) print('计数1:') print(score.count('... 阅读全文
摘要:
实例:输出12个星座符号,以反斜线分隔。 for i in range(12): print(chr(9800+i),end='/') 实例:恺撒密码的编码 m = input("请输入加密字符:") q=ord('a') p=ord('z') print("加密结果为") for i in m: if q<=ord(i)<=p: print(chr(q+... 阅读全文
摘要:
注意标准库的两种导入与使用方式,建议大家采用.的方式。 对前面的代码进行优化,用for,while,if,def实现: 用循环画五角星 import turtle turtle.color("yellow") turtle.fillcolor("yellow") turtle.speed(8) turtle.begin_fill() for i in range(5): turtle.fo... 阅读全文
摘要:
Hello World! print("Hello World!!") 简单交互(交互式,文件式)教材P19 name=input("what is your name?\n") where=input("where are you now?\n") age=input("how old are y 阅读全文
摘要:
Steam是一个整合游戏下载平台。2002年,Steam系统与CS1.4 Beta一起问世。至目前为止,Steam的运作十分成功广泛,无数游戏发行公司的游戏在此平台上发行、更新。 根据百度数据显示,steam在2012年开始慢慢被国内玩家所了解,慢慢被使用。 网民搜索steam的数量在2017年的7 阅读全文