23江瑜斌 - 博客园

2017年11月2日

摘要： 1.选一个自己感兴趣的主题。 2.网络上爬取相关的数据。 3.进行文本分析，生成词云。 4.对文本分析结果解释说明。 5.写一篇完整的博客，附上源代码、数据爬取及分析结果，形成一个可展示的成果。结果如下图所示：由于未知原因，词云出现乱码。阅读全文

posted @ 2017-11-02 11:26 23江瑜斌阅读(154) 评论(0) 推荐(0)

2017年10月18日

数据结构化与保存

摘要： 1.结构化：单条新闻的详情字典：news 一个列表页所有单条新闻汇总列表：newsls.append(news) 所有列表页的所有新闻汇总列表：newstotal.extend(newsls) 2.转换成pandas的数据结构DataFrame 3.从DataFrame保存到excel 4.从Da 阅读全文

posted @ 2017-10-18 20:15 23江瑜斌阅读(169) 评论(0) 推荐(0)

2017年10月11日

爬取新闻列表

摘要：获取单条新闻的#标题#链接#时间#来源#内容 #点击次数，并包装成一个函数。获取一个新闻列表页的所有新闻的上述详情，并包装成一个函数。获取所有新闻列表页的网址，调用上述函数。完成所有校园新闻的爬取工作。 import requests import re from bs4 import BeautifulSoup url='http://news.gzcc.cn/html/xiaoyua... 阅读全文

posted @ 2017-10-11 17:07 23江瑜斌阅读(181) 评论(0) 推荐(0)

2017年9月27日

用requests库和BeautifulSoup4库爬取新闻列表

摘要：用requests库和BeautifulSoup4库，爬取校园新闻列表的时间、标题、链接、来源。 import requests from bs4 import BeautifulSoup url='http://news.gzcc.cn/html/xiaoyuanxinwen/' res=requ 阅读全文

posted @ 2017-09-27 10:43 23江瑜斌阅读(148) 评论(0) 推荐(0)

2017年9月25日

中文词频统计及词云制作

摘要： 1.中软国际华南区技术总监曾老师还会来上两次课，同学们希望曾老师讲些什么内容？（认真想一想回答）希望能讲一些大数据相关内容，深入了解一下。 2.中文分词（**两项选做，此次作业要求不能雷同。）阅读全文

posted @ 2017-09-25 11:21 23江瑜斌阅读(161) 评论(1) 推荐(0)

2017年9月20日

9/20

摘要：列表实例：由字符串创建一个作业评分列表，做增删改查询统计遍历操作。例如，查询第一个3分的下标，统计1分的同学有多少个，3分的同学有多少个等。 score=list('112233345611') print('分数为：') print(score) score.sort() print('排列后：') print(score) print('计数1：') print(score.count('... 阅读全文

posted @ 2017-09-20 11:41 23江瑜斌阅读(282) 评论(0) 推荐(0)

2017年9月18日

字符串操作练习：星座、凯撒密码、99乘法表、词频统计预处理

摘要：实例：输出12个星座符号，以反斜线分隔。 for i in range(12): print(chr(9800+i),end='/') 实例：恺撒密码的编码 m = input("请输入加密字符：") q=ord('a') p=ord('z') print("加密结果为") for i in m: if q<=ord(i)<=p: print(chr(q+... 阅读全文

posted @ 2017-09-18 11:33 23江瑜斌阅读(239) 评论(0) 推荐(0)

2017年9月13日

条件、循环、函数练习

摘要：注意标准库的两种导入与使用方式，建议大家采用.的方式。对前面的代码进行优化，用for,while,if,def实现：用循环画五角星 import turtle turtle.color("yellow") turtle.fillcolor("yellow") turtle.speed(8) turtle.begin_fill() for i in range(5): turtle.fo... 阅读全文

posted @ 2017-09-13 17:30 23江瑜斌阅读(164) 评论(0) 推荐(0)

2017年9月6日

Python输入输出练习，运算练习，turtle初步练习

摘要： Hello World！ print("Hello World!!") 简单交互（交互式，文件式）教材P19 name=input("what is your name?\n") where=input("where are you now?\n") age=input("how old are y 阅读全文

posted @ 2017-09-06 11:38 23江瑜斌阅读(1102) 评论(0) 推荐(0)

2017年9月4日

steam游戏平台的数据分析

摘要： Steam是一个整合游戏下载平台。2002年，Steam系统与CS1.4 Beta一起问世。至目前为止，Steam的运作十分成功广泛，无数游戏发行公司的游戏在此平台上发行、更新。根据百度数据显示，steam在2012年开始慢慢被国内玩家所了解，慢慢被使用。网民搜索steam的数量在2017年的7 阅读全文

posted @ 2017-09-04 19:28 23江瑜斌阅读(844) 评论(0) 推荐(0)

公告