2022年8月31日

python基础知识学习

摘要: 基础知识学习——两周时间 视频教程:https://time.geekbang.org/course/intro/100008801?tab=catalog 辅助网站教程:https://www.runoob.com/python3/python3-basic-syntax.html 第一周——环境 阅读全文

posted @ 2022-08-31 09:49 banji 阅读(35) 评论(0) 推荐(0) 编辑

2021年11月2日

爬取哔哩哔哩python搜索结果

摘要: 题目描述 爬取python搜索结果,获取所有结果,并将每个结果中的 标题 播放量 上传时间 时长 UP主名称,以及UP主的主页URL 附加 弹幕数 点赞数 投币数 收藏数 转发数 所属分类 UP主的粉丝数(可先不获取) 可能用到的知识 查看HTML源码 requests BeautifulSoup 阅读全文

posted @ 2021-11-02 19:09 banji 阅读(72) 评论(0) 推荐(0) 编辑

2021年10月26日

数据可视化练习题

摘要: 数据可视化练习题 折线图 解析excel,画出合约AP005所有交易日的,成交量折线图(x轴是日期,并按照时间顺序增长,y轴是成交量) 解析excel,画出合约AP005所有交易日的,持仓量折线图(x轴是日期,并按照时间顺序增长,y轴是持仓量) 1、2中成交量和持仓量折线图展示到一张折线图中。 饼状 阅读全文

posted @ 2021-10-26 20:50 banji 阅读(331) 评论(0) 推荐(0) 编辑

2021年9月23日

python正则表达式

摘要: 过滤字符串 方式1 # 过滤掉<和> content = '<学习><你好><啊>' import re p = re.compile(r'\w+') obj = re.findall(p, content) print(obj) 方式2 # 通过()来获取想要的值 content = '<学习>< 阅读全文

posted @ 2021-09-23 19:16 banji 阅读(15) 评论(0) 推荐(0) 编辑

git的安装和基础知识

摘要: MAC安装git 安装git 只需要查看第一部分即可。github配置可不看 配置git git基础知识 git status -s -- 查看有哪些文件没有提交(M开头的是变更(Modify)、A开头的是新增(ADD)、?开头的是还没有添加进来的文件) git add file -- 添加文件 g 阅读全文

posted @ 2021-09-23 09:52 banji 阅读(40) 评论(0) 推荐(0) 编辑

2021年9月10日

python学习计划

摘要: 第一周【2021-09-13/2021-09-17】 视频学习 网站学习 使用博客园记录自己的学习笔记(也可以选择自己喜欢的,最好能在网上看得到的) 学习markdown基础知识 学习问题记录 每日记录学习笔记 学习了哪些内容 做了什么习题,有什么疑问或问题 有什么收获 主要目标:安装环境 了解计算 阅读全文

posted @ 2021-09-10 10:31 banji 阅读(347) 评论(1) 推荐(0) 编辑

2017年12月26日

c++类间互相调用

摘要: 转载原文链接: c++类间相互调用 文中出现的extern应当去掉, 因为extern修饰的是变量或者函数, 用于全局变量的声明, 而这里只是声明class类,而具体的class类在另一个文件中定义好了.只需要找到即可. 如果两个类使用的都是指针, 那么相关的.h文件都可以不包含, 只需添加所要使用 阅读全文

posted @ 2017-12-26 14:50 banji 阅读(317) 评论(0) 推荐(0) 编辑

2017年11月28日

Scrapy爬虫的基本流程

摘要: 首先要知道爬取的网站是否需要登陆(如知乎, 只有登陆才能访问某些数据), 是否需要headers等. 之后就是根据自己的需要爬取自己需要解析的网页 start_request_url是第一个函数, 如果不重载, 默认迭代调用start_urls中的所有链接, 然后交给parse(默认)函数处理, 也 阅读全文

posted @ 2017-11-28 19:49 banji 阅读(164) 评论(0) 推荐(0) 编辑

CrawlSpider源码分析

摘要: CrawlSpider是对Spider做了进一步的封装, 使得该类可以直接爬取一个网站.也就是说CrawlSpider是为了爬取整个网站设计的 CrawlSpider和Spider一样, 入口都是start_request, 如果想要模拟登陆, 可以重载这个函数, 然后callback自己定义的登陆 阅读全文

posted @ 2017-11-28 15:14 banji 阅读(195) 评论(0) 推荐(0) 编辑

2017年11月24日

模拟知乎登陆(requests和scrapy)

摘要: 1. request 登录知乎需要向服务器提交的信息有: ①headers ②_xsrf ③captcha 需要通过解析页面获得_xsrf和captcha(验证码) 而有关captcha的获取则必须要用session的方式获得, 目的是为了使_xsrf和验证码信息一致 (因为session中可以保存 阅读全文

posted @ 2017-11-24 17:07 banji 阅读(231) 评论(0) 推荐(0) 编辑

导航