banji

python基础知识学习

摘要：基础知识学习——两周时间视频教程：https://time.geekbang.org/course/intro/100008801?tab=catalog 辅助网站教程：https://www.runoob.com/python3/python3-basic-syntax.html 第一周——环境阅读全文

posted @ 2022-08-31 09:49 banji 阅读(58) 评论(0) 推荐(0)

爬取哔哩哔哩python搜索结果

摘要：题目描述爬取python搜索结果，获取所有结果，并将每个结果中的标题播放量上传时间时长 UP主名称，以及UP主的主页URL 附加弹幕数点赞数投币数收藏数转发数所属分类 UP主的粉丝数（可先不获取）可能用到的知识查看HTML源码 requests BeautifulSoup 阅读全文

posted @ 2021-11-02 19:09 banji 阅读(98) 评论(0) 推荐(0)

数据可视化练习题

摘要：数据可视化练习题折线图解析excel，画出合约AP005所有交易日的，成交量折线图（x轴是日期，并按照时间顺序增长，y轴是成交量）解析excel，画出合约AP005所有交易日的，持仓量折线图（x轴是日期，并按照时间顺序增长，y轴是持仓量） 1、2中成交量和持仓量折线图展示到一张折线图中。饼状阅读全文

posted @ 2021-10-26 20:50 banji 阅读(394) 评论(0) 推荐(0)

python正则表达式

摘要：过滤字符串方式1 # 过滤掉<和> content = '<学习><你好><啊>' import re p = re.compile(r'\w+') obj = re.findall(p, content) print(obj) 方式2 # 通过()来获取想要的值 content = '<学习>< 阅读全文

posted @ 2021-09-23 19:16 banji 阅读(25) 评论(0) 推荐(0)

git的安装和基础知识

摘要： MAC安装git 安装git 只需要查看第一部分即可。github配置可不看配置git git基础知识 git status -s -- 查看有哪些文件没有提交（M开头的是变更（Modify）、A开头的是新增（ADD）、？开头的是还没有添加进来的文件） git add file -- 添加文件 g 阅读全文

posted @ 2021-09-23 09:52 banji 阅读(62) 评论(0) 推荐(0)

python学习计划

摘要：第一周【2021-09-13/2021-09-17】视频学习网站学习使用博客园记录自己的学习笔记（也可以选择自己喜欢的，最好能在网上看得到的）学习markdown基础知识学习问题记录每日记录学习笔记学习了哪些内容做了什么习题，有什么疑问或问题有什么收获主要目标：安装环境了解计算阅读全文

posted @ 2021-09-10 10:31 banji 阅读(458) 评论(1) 推荐(0)

c++类间互相调用

摘要：转载原文链接: c++类间相互调用文中出现的extern应当去掉, 因为extern修饰的是变量或者函数, 用于全局变量的声明, 而这里只是声明class类,而具体的class类在另一个文件中定义好了.只需要找到即可. 如果两个类使用的都是指针, 那么相关的.h文件都可以不包含, 只需添加所要使用阅读全文

posted @ 2017-12-26 14:50 banji 阅读(333) 评论(0) 推荐(0)

Scrapy爬虫的基本流程

摘要：首先要知道爬取的网站是否需要登陆(如知乎, 只有登陆才能访问某些数据), 是否需要headers等. 之后就是根据自己的需要爬取自己需要解析的网页 start_request_url是第一个函数, 如果不重载, 默认迭代调用start_urls中的所有链接, 然后交给parse(默认)函数处理, 也阅读全文

posted @ 2017-11-28 19:49 banji 阅读(179) 评论(0) 推荐(0)

CrawlSpider源码分析

摘要： CrawlSpider是对Spider做了进一步的封装, 使得该类可以直接爬取一个网站.也就是说CrawlSpider是为了爬取整个网站设计的 CrawlSpider和Spider一样, 入口都是start_request, 如果想要模拟登陆, 可以重载这个函数, 然后callback自己定义的登陆阅读全文

posted @ 2017-11-28 15:14 banji 阅读(208) 评论(0) 推荐(0)

模拟知乎登陆(requests和scrapy)

摘要： 1. request 登录知乎需要向服务器提交的信息有: ①headers ②_xsrf ③captcha 需要通过解析页面获得_xsrf和captcha(验证码) 而有关captcha的获取则必须要用session的方式获得, 目的是为了使_xsrf和验证码信息一致 (因为session中可以保存阅读全文

posted @ 2017-11-24 17:07 banji 阅读(257) 评论(0) 推荐(0)