2017年10月31日

一个完整的大作业

摘要: 1.选一个自己感兴趣的主题。 2.网络上爬取相关的数据。 3.进行文本分析,生成词云。 4.对文本分析结果解释说明。 5.写一篇完整的博客,附上源代码、数据爬取及分析结果,形成一个可展示的成果。 要爬取一个网站的内容首先我们要选择一个要浏览的网站,本次实验选取的是http://news.ycwb.c 阅读全文

posted @ 2017-10-31 22:10 ohh咔咔咔 阅读(193) 评论(0) 推荐(0) 编辑

2017年10月19日

数据结构化与保存

摘要: 1.结构化: 单条新闻的详情字典:news 一个列表页所有单条新闻汇总列表:newsls.append(news) 所有列表页的所有新闻汇总列表:newstotal.extend(newsls) 2.转换成pandas的数据结构DataFrame 3.从DataFrame保存到excel 4.从Da 阅读全文

posted @ 2017-10-19 19:05 ohh咔咔咔 阅读(110) 评论(0) 推荐(0) 编辑

2017年10月12日

爬取所有校园新闻

摘要: 获取单条新闻的#标题#链接#时间#来源#内容 #点击次数,并包装成一个函数。 import requests import re from bs4 import BeautifulSoup from datetime import datetime news='http://news.gzcc.cn/html/xiaoyuanxinwen/' res=requests.get(news) re... 阅读全文

posted @ 2017-10-12 19:01 ohh咔咔咔 阅读(167) 评论(0) 推荐(0) 编辑

2017年9月28日

用requests库和BeautifulSoup4库爬取新闻列表

摘要: 用requests库和BeautifulSoup4库,爬取校园新闻列表的时间、标题、链接、来源、详细内容。 将其中的时间str转换成datetime类型。 将取得详细内容的代码包装成函数。 import requests from bs4 import BeautifulSoup from date 阅读全文

posted @ 2017-09-28 19:10 ohh咔咔咔 阅读(167) 评论(0) 推荐(0) 编辑

2017年9月25日

中文词频统计及词云制作

摘要: 1.中软国际华南区技术总监曾老师还会来上两次课,同学们希望曾老师讲些什么内容?(认真想一想回答) 希望老师讲解更多的实用企业内容,把专业知识联系到实际运用之中。 2.中文分词 你曾经有梦见这样无边无际的月光下的水域么?无声起伏的黑色的巨浪,在地平线上爆发出沉默的力量。就这样,从仅仅打湿脚底,到盖住脚 阅读全文

posted @ 2017-09-25 18:47 ohh咔咔咔 阅读(178) 评论(0) 推荐(0) 编辑

2017年9月21日

组合数据类型练习,英文词频统计实例

摘要: 查询速度随内容增加而变慢 占用内存较小 表达固定数据项、函数多返回值、 多变量同步赋值、循环遍历等情况下适用 改&查操作速度快, 不会因key值增加而变慢。 占用内存大,内存浪费多 (利用空间成本换时间) 数据独立性: 能够过滤重复参数 排除语法型词汇,代词、冠词、连词 阅读全文

posted @ 2017-09-21 17:16 ohh咔咔咔 阅读(109) 评论(0) 推荐(0) 编辑

2017年9月18日

字符串操作练习:星座、凯撒密码、99乘法表、词频统计预处理

摘要: 实例:输出12个星座符号,以反斜线分隔。 for i in range(12): print(chr(9800+i),end='\\') 实例:恺撒密码的编码 plaincode=input('明文:') print('密文:',end='') s=ord('a') t=ord('z') for i in plaincode: if s<= ord(i)<=t: ... 阅读全文

posted @ 2017-09-18 17:38 ohh咔咔咔 阅读(105) 评论(0) 推荐(0) 编辑

2017年9月14日

条件、循环、函数定义、字符串操作练习

摘要: 用循环画五角星 import turtle turtle.color ('red') turtle.fillcolor ('yellow') turtle.begin_fill () for i in range (5): turtle.forward (100) turtle.right (144) turtle.end_fill () 用循环画同心圆 impor... 阅读全文

posted @ 2017-09-14 18:58 ohh咔咔咔 阅读(121) 评论(0) 推荐(0) 编辑

2017年9月7日

Python输入输出练习,运算练习,turtle初步练习

摘要: Hello World! print('hello world!') 简单交互(交互式,文件式)教材P19 name=input('your name:') print('hi,%s'%name) 用户输入两个数字,计算并输出两个数字之和(尝试用一行代码实现)。 print(float(input('第一个数:'))+float(input('第二个数:'))) ... 阅读全文

posted @ 2017-09-07 18:36 ohh咔咔咔 阅读(201) 评论(0) 推荐(0) 编辑

2017年9月4日

了解大数据

摘要: 随着人们日常生活的日益提升,人们的生活方式发生了翻天覆地的改变。从以前的书信车马,纸币支付,慢慢的发展成为如今只需要一部手机就能解决人们日常的通讯和商品交换。手机的强大已经慢慢的离不开人们的生活,那么,到底手机的市场分布是如何的呢?下面一些数据带我们了解手机市场: 在上图中我们能够清晰的看到市场对手 阅读全文

posted @ 2017-09-04 18:41 ohh咔咔咔 阅读(86) 评论(0) 推荐(0) 编辑

导航