上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 25 下一页
摘要: import jsonimport timeimport requestsimport pandas as pdmax_ids = [283033662846177, 170058843019812, 149030683477660, 142433613341546, 477775297039829 阅读全文
posted @ 2022-06-07 16:18 布都御魂 阅读(90) 评论(0) 推荐(0)
摘要: """ 时间:2021/6/30 13:14 发布账号昵称、发布账号ID、发布时间、内容、发帖链接、账号主页链接、点赞数、评论数、分享数 运行环境 Chrome浏览器 和 selenium驱动版本一致即可 可自行接入公司数据库 keyword_list = ['tsaiingwen'] 放入采集政府 阅读全文
posted @ 2022-05-18 21:50 布都御魂 阅读(35) 评论(0) 推荐(0)
摘要: //div[contains(text(),'李')] 阅读全文
posted @ 2022-05-06 14:51 布都御魂 阅读(94) 评论(0) 推荐(0)
摘要: <span class="comment-info"> <a href="https://www.douban.com/people/65610165/">Cotman</a> <span class="user-stars allstar30 rating" title="还行"></span> 阅读全文
posted @ 2022-05-05 16:41 布都御魂 阅读(1590) 评论(0) 推荐(0)
摘要: 相邻元素定位,div是需要定位的元素所在的标签[1]代表前一位 前一位:preceding-sibling::div[1]后一位:following-sibling::div[1]前N位:preceding-sibling::div[N]后N位:following-sibling::div[N] 阅读全文
posted @ 2022-05-05 16:04 布都御魂 阅读(265) 评论(0) 推荐(0)
摘要: 问题:ssh模块上传文卡顿 解决:设置超时 1.找到paramiko文件夹下的client.py文件 2.确定 def exec_command(self, command, bufsize=-1,timeout = None) 3.在chan = self._transport.open_sess 阅读全文
posted @ 2022-04-02 15:40 布都御魂 阅读(1385) 评论(0) 推荐(0)
摘要: 豆瓣图书 https://book.douban.com/tag/%E5%B0%8F%E8%AF%B4?start=40&type=T 1.店里列表元素的左上角,全选列表内容 2.点击选中子元素 3.点击选中全部 4.点击采集数据,修改数据预览中的字段 5.设计翻页 6.保存 7.采集 阅读全文
posted @ 2022-03-29 11:09 布都御魂 阅读(249) 评论(0) 推荐(0)
摘要: 问题: python中安装包出现Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None))………… 解决办法:pip install 模块 -i http://pypi.douban.com/simpl 阅读全文
posted @ 2022-03-28 15:06 布都御魂 阅读(25) 评论(0) 推荐(0)
摘要: 错误提示: The Fiddler AutoResponder is enabled, but this request did not match any of the listed rules. Because the "Unmatched requests passthrough" optio 阅读全文
posted @ 2022-03-28 09:53 布都御魂 阅读(271) 评论(0) 推荐(0)
摘要: 按照方法2 为什么电脑磁盘占用率长时间显示100%?_百度知道 (baidu.com) 阅读全文
posted @ 2022-03-22 15:22 布都御魂 阅读(180) 评论(0) 推荐(0)
上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 25 下一页