会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
、一叶孤城
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
···
14
下一页
2021年12月11日
下载些音乐 - Python
摘要: 闲来无事,爬爬音乐: 酷我 1 import os.path 2 import pprint 3 import random 4 import time 5 from selenium import webdriver 6 from selenium.webdriver.common.by impo
阅读全文
posted @ 2021-12-11 16:44 、一叶孤城
阅读(215)
评论(0)
推荐(0)
2021年12月10日
几种方式保存爬虫爬取的数据 - Python
摘要: 以美团烤肉为例,将爬取的数据进行保存。 第一种:csv。 新建一个csv文档,利用字典写入器写入头,然后把爬取好的数据进行字典构造,然后将字典逐条写入到csv文档里。 1 """ 2 爬取美团烤肉 3 """ 4 import pprint 5 import csv 6 import parsel
阅读全文
posted @ 2021-12-10 15:24 、一叶孤城
阅读(3424)
评论(0)
推荐(0)
2021年12月9日
Putty连Ubuntu
摘要: 用Putty连接Ubuntu,提示“Network refused”。 安装ssh-sever,sudo apt-get install openssh-server 再连就ok了。
阅读全文
posted @ 2021-12-09 10:38 、一叶孤城
阅读(12)
评论(0)
推荐(0)
2021年12月6日
某直聘python岗位 - Python爬虫
摘要: 过年了,爬爬看python需要什么技能才能有备无患。 大体思路: 爬所需信息 爬一爬详情页做个可视化词云,看看所需节能 做一做数据可视化 所需库: csv,保存数据用的 selenium,模拟真人访问网站,因为requests很容易被反爬 parsel和requests,可以尝试爬详情页 rando
阅读全文
posted @ 2021-12-06 21:16 、一叶孤城
阅读(158)
评论(0)
推荐(0)
2021年11月30日
Pyecharts绘制精美图标并做成可视化大屏 - Python
摘要: Pyecharts,数据可视化神器。说到它就不得不提Echarts,它是由百度开源的一款使用JavaScript实现的开源可视化库,涵盖了各种图表、满足各类业务需求,而pyecharts也就是Python与Echarts结合之后的产物,封装了Echarts各类图表的基本操作,然后通过渲染机制,输出一
阅读全文
posted @ 2021-11-30 15:38 、一叶孤城
阅读(2232)
评论(0)
推荐(0)
2021年11月26日
抓一下严禁失德艺人曲线复出的评论 - Python
摘要: 11月23日,人民日报微博客户端发表 - 严禁违法失德艺人曲线复出,总共封禁了88位失德艺人,其中就包括吴某签,郑某爽,还有那个拜靖国神社的东西(这种人活着都是浪费空气,司马的无脑渣渣)。 我们来爬一下下方的评论并做个词云可视化。经年爬微博评论,那个PC端是爬到第17爷就会给咱们分发垃圾数据,所以从
阅读全文
posted @ 2021-11-26 16:02 、一叶孤城
阅读(93)
评论(0)
推荐(0)
2021年11月25日
冬天来了,用Python看看哪里的人最喜欢吃火锅
摘要: 本文仅用于学习和交流使用,不具有任何商业价值,如有问题,请与我联系,我将即时处理。 数据来源于百度地图。开发者工具就不说了,直接上代码: 1 """ 2 爬取百度地图全国火锅店并可视化 3 """ 4 import pprint 5 6 import openpyxl as op 7 import
阅读全文
posted @ 2021-11-25 16:44 、一叶孤城
阅读(148)
评论(0)
推荐(0)
出生率创40年来最低,人口几近负增长,微博爬虫爬评论
摘要: 本文仅用于学习和交流,不具有任何商业价值,如有问题,请与我联系,我将即时处理。 近日,《中国统计年鉴2021年》发布,公布了我国2020年的相关人口数据。据了解,去年我国的人口出生率为8.52‰,直接跌破了10‰的整数关口,创下了我国近43年来的新低。同期全国人口自然增长率(出生率-死亡率)仅为1.
阅读全文
posted @ 2021-11-25 11:22 、一叶孤城
阅读(253)
评论(0)
推荐(0)
2021年11月23日
关于jieba分词 - Python
摘要: 做词云可视化的时候,一般都用一个库叫jieba,它是用来分词的。 Jieba库在安装时,会附带一个词库,这个词库中包含了日常汉语的词语和词性。在分词时,Jieba库会先基于词库对文本进行匹配,生成文本中的汉字最有可能形成的词。然后将这些词组成一个DAG,用动态规划算法来查找最大的概率路径,尽可能不将
阅读全文
posted @ 2021-11-23 15:23 、一叶孤城
阅读(260)
评论(0)
推荐(0)
2021年11月22日
爬取某东商品数据 - Python基于selenium
摘要: 本文仅用于学习与交流,不具有任何商业价值,如有问题,请与我联系,我将即时处理。 爬下某东数据,基于selenium。上代码: 1 """ 2 爬取某东数据并保存到csv 3 """ 4 import random 5 import time 6 7 from selenium import webd
阅读全文
posted @ 2021-11-22 22:02 、一叶孤城
阅读(107)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
···
14
下一页
公告