会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
素欣
博客园
首页
新随笔
联系
订阅
管理
[置顶]
一个完整的大作业
摘要: 1.选一个自己感兴趣的主题。最近好多人和我说要去旅游,我就想自己家这边有什么吸引人的地方呢? 2.网络上爬取相关的数据,截取网站的标题以及来源。 import requestsfrom bs4 import BeautifulSoupres=requests.get('http://trips.tu
阅读全文
posted @ 2017-10-31 23:10 405陈素欣
阅读(150)
评论(0)
推荐(0)
[置顶]
数据结构化与保存
摘要: 1、结构化 单条新闻的详情字典:news 一个列表页所有单条新闻汇总列表:newsls.append(news) 所有列表页的所有新闻汇总列表:newstotal.extend(newsls) 2、转换成pandas的数据结构DataFrame 3、从DataFrame保存到excel 4、从Dat
阅读全文
posted @ 2017-10-19 14:54 405陈素欣
阅读(120)
评论(0)
推荐(0)
[置顶]
爬取所有新闻列表
摘要: 1、获取单条新闻的#标题#链接#时间#来源#内容 #点击次数,并包装成一个函数。 2、获取一个新闻列表页的所有新闻的上述详情,并包装成一个函数。 3、获取所有新闻列表页的网址,调用上述函数。 4、完成所有校园新闻的爬取工作。
阅读全文
posted @ 2017-10-12 21:45 405陈素欣
阅读(143)
评论(0)
推荐(0)
[置顶]
用requests库和BeautifulSoup4库爬取新闻列表
摘要: import requests from bs4 import BeautifulSoup from datetime import datetime wangzhan='http://news.gzcc.cn/html/xiaoyuanxinwen/' res =requests.get(wangzhan) res.encoding='utf-8' soup=BeautifulSoup(re...
阅读全文
posted @ 2017-09-28 21:18 405陈素欣
阅读(172)
评论(0)
推荐(0)
[置顶]
中文词频统计及词云制作
摘要: 1.中软国际华南区技术总监曾老师还会来上两次课,同学们希望曾老师讲些什么内容?(认真想一想回答) 大数据能否用于机动化检测以及分析其数据 2.中文分词
阅读全文
posted @ 2017-09-25 19:44 405陈素欣
阅读(104)
评论(0)
推荐(0)
[置顶]
组合数据类型练习,英文词频统计实例
摘要: 1.列表实例:由字符串创建一个作业评分列表,做增删改查询统计遍历操作。例如,查询第一个3分的下标,统计1分的同学有多少个,3分的同学有多少个等。 2.字典实例:建立学生学号成绩字典,做增删改查遍历操作。 3.列表,元组,字典,集合的遍历。 4.英文词频统计实例 排除语法型词汇,代词、冠词、连词
阅读全文
posted @ 2017-09-21 17:53 405陈素欣
阅读(111)
评论(0)
推荐(0)
[置顶]
字符串操作练习:星座、凯撒密码、99乘法表、词频统计预处理
摘要: 1.输出12个星座符号,以反斜线分隔 2.恺撒密码的编码 3.输入姓名,格式输出:占4位、居中、不足4字的以空格填充。 4.格式化输出:中华人民共和国国内生产总值(GDP)689,136.89亿元(2015年)(千分位、2位小数,浮点数 5.打出99乘法表
阅读全文
posted @ 2017-09-18 23:04 405陈素欣
阅读(101)
评论(0)
推荐(0)
[置顶]
条件、循环、函数定义、字符串操作练习
摘要: 发布一些小练习,希望大家感兴趣
阅读全文
posted @ 2017-09-14 21:28 405陈素欣
阅读(205)
评论(0)
推荐(0)
[置顶]
大数据应用于web
摘要: 用python写web,其实我不明白,为什么相对后端语言来说,python写web比较麻烦,但是还是有人喜欢用....(我感觉像是自虐)
阅读全文
posted @ 2017-09-12 10:53 405陈素欣
阅读(157)
评论(0)
推荐(0)
2017年9月12日
python练习
摘要: 这里我做了一些关于python的小练习,感兴趣的朋友可以看下
阅读全文
posted @ 2017-09-12 10:52 405陈素欣
阅读(126)
评论(0)
推荐(0)
公告