随笔档案「2024年3月」 - HelloJacker

mongodb

摘要：插入数据 result = collection.insert_one(students) result = collection.insert_many([students]) 查询数据 result = collection.find_one({'name': 'Mike'}) # 大于20 r 阅读全文

posted @ 2024-03-12 16:29 HelloJacker 阅读(22) 评论(0) 推荐(0)

Scrapy框架理解

摘要：Engine（引擎）：负责处理数据的流转和逻辑处理 == 处理器 Scheduler（调度器）：负责request请求的调动规则 Spiders（蜘蛛）：负责站点的爬取逻辑和页面解析规则 Spider Middlewares：负责实现Spiders和Engine的之间的item和request处理阅读全文

posted @ 2024-03-09 15:59 HelloJacker 阅读(30) 评论(0) 推荐(0)

playwright

摘要：代码生成器： playwright codegen -o script.py -b chromium (-device iphone11) 移动端： from playwright.sync_api import sync_playwright with sync_playwright() as p 阅读全文

posted @ 2024-03-05 21:11 HelloJacker 阅读(80) 评论(0) 推荐(0)

selenium的基本使用

摘要：1. 基本使用 browser.current_url browser.get_cookies() browser.page_source 2. 定位元素 from selenium.webdriver.common.by import By input_first = browser.find_e 阅读全文

posted @ 2024-03-05 09:58 HelloJacker 阅读(51) 评论(0) 推荐(0)

公告