2017年10月31日
摘要: 1.选一个自己感兴趣的主题。选取www.91.com为移动互联网来作为兴趣来进行研究 2.网络上爬取相关的数据。到网站进行对网页框架进行分析,然后搜出标题进行爬数据 3.进行文本分析,生成词云。将收集到的数据进行结巴分词,然后将写入wadee.txt中,并且进行词频统计 使用词云来展示词频。并且字体 阅读全文
posted @ 2017-10-31 21:26 wa_dee 阅读(164) 评论(0) 推荐(0) 编辑
  2017年10月19日
摘要: >>> import requests >>> import pandas >>> from bs4 import BeautifulSoup >>> from datetime import datetime >>> def Click(newurl): id = re.search('_(.*).html', newurl).group(1).split('/')[1] cl... 阅读全文
posted @ 2017-10-19 22:29 wa_dee 阅读(101) 评论(0) 推荐(0) 编辑
  2017年10月12日
摘要: 获取单条新闻的#标题#链接#时间#来源#内容 #点击次数,并包装成一个函数。 获取一个新闻列表页的所有新闻的上述详情,并包装成一个函数。 获取所有新闻列表页的网址 阅读全文
posted @ 2017-10-12 13:15 wa_dee 阅读(132) 评论(0) 推荐(0) 编辑
  2017年9月28日
摘要: 1.用requests库和BeautifulSoup4库,爬取校园新闻列表的时间、标题、链接、来源。 将其中的时间str转换成datetime类型。 选一个自己感兴趣的主题,做类似的操作,为后面“爬取网络数据并进行文本分析”做准备。 阅读全文
posted @ 2017-09-28 18:10 wa_dee 阅读(187) 评论(0) 推荐(0) 编辑
  2017年9月25日
摘要: 1.中软国际华南区技术总监曾老师还会来上两次课。希望老师能够讲一下 现在的网络发展和现状,感觉计算机专业是最受欢迎的,但是凭借着每年不断毕业(增多)的人数,我们凭借着什么来跟好比如我们是网工专业,跟学软件班的同学去PK,去取得更好的就业岗位。并且一般现在看到比我们大一届的师兄师姐很多都是(大部分), 阅读全文
posted @ 2017-09-25 16:35 wa_dee 阅读(352) 评论(0) 推荐(0) 编辑
  2017年9月21日
摘要: 1、列表实例:由字符串创建一个作业评分列表,做增删改查询统计遍历操作。例如,查询第一个2分的下标,统计2分的同学有多少个,3分的同学有多少个等。 2、列表,元组,字典,集合的遍历。 总结列表,元组,字典,集合的联系与区别。 列表:有序,可做增删改查操作,用方括号[x,y,z]的方式表示 元组:有序, 阅读全文
posted @ 2017-09-21 15:48 wa_dee 阅读(281) 评论(0) 推荐(0) 编辑
  2017年9月18日
摘要: 1、实例:输出12个星座符号,以反斜线分隔。 >>> for i in '我叫黄德华': print(ord(i)) 25105 21483 40644 24503 21326 >>> for i in range(12): print(chr(9800+i),end='\\') ♈\♉\♊\♋\♌ 阅读全文
posted @ 2017-09-18 17:16 wa_dee 阅读(160) 评论(0) 推荐(0) 编辑
  2017年9月14日
摘要: 一颗星 五星红旗 同心圆 太阳花 输入学号,识别年级、专业、序号。 身份证号码 输入1-7的数字,输出对应的“星期几”。 阅读全文
posted @ 2017-09-14 16:16 wa_dee 阅读(587) 评论(0) 推荐(0) 编辑
  2017年9月7日
摘要: 显示如图: 阅读全文
posted @ 2017-09-07 21:59 wa_dee 阅读(877) 评论(0) 推荐(0) 编辑
  2017年9月4日
摘要: 上百度指数,因为想做一个关于王者荣耀里面某个英雄的使用率和登场率以及关于这个英雄的一个使用调查,所以使用大数据来进行测试。 搜索王者荣耀李白,发现搜索地区以“广东”排列为第一位 使用的人群基本为男性居多而且适玩人群基本在30-39岁居多 使用百度指数继续搜索发现7月份和八月份的搜索指数有很多地方都不 阅读全文
posted @ 2017-09-04 18:16 wa_dee 阅读(307) 评论(1) 推荐(0) 编辑