徐海建 - 博客园

2021年12月22日

摘要：大概2年之前，就可以接触pyecharts，无奈工作中接触不多，很多功能已经忘记，现在重拾，以求实用小白学Python（8）——pyecharts 入门 - 徐海建 - 博客园 (cnblogs.com) 简介 Apache ECharts是一个由百度开源的数据可视化，凭借着良好的交互性，精巧的图阅读全文

posted @ 2021-12-22 14:03 徐海建阅读(898) 评论(0) 推荐(0)

2021年12月21日

Jupyter Notebook/Lab 的安装及添加R的详细步骤

摘要： Jupyter Notebook 是一个 Web 应用程序，用于创建和共享包含代码、可视化效果和文本的文档。它可用于数据科学，统计建模，机器学习等等。 Jupyter项目|安装 Jupyter 软件 CMD命令下： pip3 install jupyter 等一会就安装好了指定文件位置：（dos命阅读全文

posted @ 2021-12-21 11:32 徐海建阅读(3342) 评论(0) 推荐(0)

2021年12月15日

python 读取本地CSV数据

摘要：逗号分隔值（Comma-Separated Values，CSV，有时也称为字符分隔值，因为分隔字符也可以不是逗号），其文件以纯文本形式存储表格数据（数字和文本）。纯文本意味着该文件是一个字符序列，不含必须像二进制数字那样被解读的数据。 CSV文件由任意数目的记录组成，记录间以某种换行符分隔；每条阅读全文

posted @ 2021-12-15 17:17 徐海建阅读(383) 评论(0) 推荐(0)

2021年11月29日

微信公众号文章提取并保存为PDF

摘要：有时会看到非常好的公众号文章想保存下来供以后参阅，避免文章被删的情况，笔者介绍几种方法以供参考。手动保存找到公众号链接，如下篇：https://mp.weixin.qq.com/s/8fhYaOnAwqCOZwip__3zcg 在浏览器打开然后 ctrl+p 点击保存即可。存在问题，有的图片阅读全文

posted @ 2021-11-29 17:09 徐海建阅读(2902) 评论(1) 推荐(0)

2021年8月22日

颜色表及html代码

摘要：颜色名称及色样表(HTML版) 颜色名中文名称 Hex RGB 十进制 Decimal LightPink 浅粉红 #FFB6C1 255,182,193 Pink 粉红 #FFC0CB 255,192,203 Crimson 深红(猩红) #DC143C 220,20,60 LavenderBl 阅读全文

posted @ 2021-08-22 17:46 徐海建阅读(1237) 评论(0) 推荐(0)

2021年8月20日

python爬虫练习5——新闻联播

摘要：提取新闻联播相关文字并输出网址：新闻联播 (cctv.com) import requests import re url = 'https://tv.cctv.com/lm/xwlb/' ua = { 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win 阅读全文

posted @ 2021-08-20 14:22 徐海建阅读(548) 评论(0) 推荐(0)

2021年8月18日

python爬虫练习4——腾讯视频评论提取

摘要：由于腾讯视频评论处进行触碰处理，点击后，网址是不变的，所以需要先进行分析。网址：HBO纪录片：成为沃伦·巴菲特【正片】_成为沃伦·巴菲特_腾讯视频 (qq.com) 点击更多评论，查看F12，可以发现其网址。打开后，我们发现其通过 'first'和'last’进行评论的翻页。我们需要对网址二次赋阅读全文

posted @ 2021-08-18 16:51 徐海建阅读(241) 评论(0) 推荐(0)

python爬虫练习3——豆瓣电影

摘要：网址：豆瓣电影 (douban.com) 和豆瓣读书类似，需要对爬虫的headers进行处理。 import requests import re for i in range(0,2): j = i*20 url = 'https://movie.douban.com/j/search_subje 阅读全文

posted @ 2021-08-18 16:40 徐海建阅读(110) 评论(0) 推荐(0)

python爬虫练习2——豆瓣读书

摘要：豆瓣网站禁止了爬虫爬取，需要对其进行简单的反爬虫处理后才可进行提取。 https://book.douban.com/robots.txt 网址：豆瓣读书 (douban.com) F12，找到 User-agent ，在爬虫程序中进行添加。 import requests import re fo 阅读全文

posted @ 2021-08-18 16:27 徐海建阅读(157) 评论(0) 推荐(0)

python爬虫练习1——百度阅读榜

摘要：网址：畅销榜_正版电子书在线阅读_百度阅读 (baidu.com) 根据页数，提取网址，查看其变化，进行爬取。 import requests import re for i in range(0,10): j = i*20 url = 'https://yuedu.baidu.com/rank/h 阅读全文

posted @ 2021-08-18 16:14 徐海建阅读(144) 评论(0) 推荐(0)

徐海建的自学笔记

自学笔记

公告