上一页 1 ··· 3 4 5 6 7 8 下一页
摘要: 计算 1-200 的平方,数据长这样:[[0, 1, 2, 3, 4, 5, 6, 7, 8, 9], [10, 11, 12, 13, 14, 15, 16, 17, 18, 19],...,[180, 181, 182, 183, 184, 185, 186, 187, 188, 189],[1 阅读全文
posted @ 2021-07-04 10:51 山鬼谣` 阅读(236) 评论(0) 推荐(0)
摘要: 简单来说,正则表达式的 .*? 可以匹配任意字符串,例子如下: 数据的结构长这样: 代码: #coding=utf-8 import re from bs4 import BeautifulSoup mystr2 = '<ul><li class="" data-rid="1"><a class=" 阅读全文
posted @ 2021-07-03 17:54 山鬼谣` 阅读(2602) 评论(0) 推荐(0)
摘要: 分布式:让多台计算机同时干活 计算1,2,3,...,10000 的平方数 原理: 代码(服务器): #服务器端 import multiprocessing.managers #分布式进程管理器 import queue #队列 task_queue = queue.Queue() #任务队列(发 阅读全文
posted @ 2021-07-03 16:21 山鬼谣` 阅读(428) 评论(0) 推荐(0)
摘要: 开启10个进程,每个进程开10个线程 import concurrent.futures def go(n): return n*n def processgo(list): with concurrent.futures.ThreadPoolExecutor(10) as pool: # 开启10 阅读全文
posted @ 2021-07-03 11:05 山鬼谣` 阅读(361) 评论(0) 推荐(0)
摘要: xpath是解析网页的另一种方法,该方法最大的好处在于可以直接复制路径。 复制粘贴得到路径:/html/body/div[2]/div[6]/div[1]/div/ul/li[1]/a[2] #导入模块并爬取页面 import requests from lxml import etree url 阅读全文
posted @ 2021-07-02 20:06 山鬼谣` 阅读(358) 评论(0) 推荐(0)
摘要: BeautifulSoup是解析网页的基本库之一。简单用法如下: 这里选取class为“nav-list site-nav fl”的div标签,如上图所示 from bs4 import BeautifulSoup div = '<div class="nav-list site-nav fl">< 阅读全文
posted @ 2021-07-02 17:31 山鬼谣` 阅读(168) 评论(0) 推荐(0)
摘要: 只有名称不同,其他完全一样 1、线程池: import concurrent.futures def go(n): return n*n if __name__ == "__main__": list = [1,2,3,4,5,6,7,8,9,10,11,12] with concurrent.fu 阅读全文
posted @ 2021-07-02 16:49 山鬼谣` 阅读(156) 评论(0) 推荐(0)
摘要: 类:self的作用域 阅读全文
posted @ 2021-06-29 11:20 山鬼谣` 阅读(112) 评论(0) 推荐(0)
摘要: 具有某些特征的一行字符串如:XX县委宣传部、XX县委政法委、XX县委编办、XX县委机关工委、XX县委党校、 首先使用正则表达式将其修改为列表: 在pycharm使用 Ctrl + R 调出正则表达式的使用页面,编辑好之后使用replaceall替换全部, 然后使用for循环打印输出:(也可存储到Ex 阅读全文
posted @ 2021-06-26 11:30 山鬼谣` 阅读(1101) 评论(0) 推荐(0)
摘要: mylist = [['月票榜第1位','夜的命名术','会说话的肘子'], ['月票榜第2位','大奉打更人','卖报小郎君'], ['月票榜第3位','从红月开始','黑山老鬼'], ['月票榜第4位','这个人仙太过正经','言归正传'], ['月票榜第5位','深空彼岸','辰东']] a 阅读全文
posted @ 2021-06-25 19:43 山鬼谣` 阅读(204) 评论(0) 推荐(0)
上一页 1 ··· 3 4 5 6 7 8 下一页