• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
山城小跳
博客园    首页    新随笔    联系   管理    订阅  订阅

python 中的协程

import aiohttp
import aiofiles
import asyncio 
# 协程请求
async def get_page_one(href, pathName):
    async with aiohttp.ClientSession() as session:
        async with session.get(href, headers=header) as resp:
            hm = await resp.text(encoding="utf-8")
            tree = etree.HTML(hm)
            data = "".join(tree.xpath('//div[@id="neirong"]/p/text()'))
            # 将数据写入文件
            async with aiofiles.open(pathName, "w", encoding="utf-8") as file:
                await file.write(data)
    print(pathName+"数据更新完成")
#任务绑定
async def main(result_list):
    # 循环result_list
    tasks = []
    for i in result_list:
        if not os.path.exists(i["title"]):
            os.mkdir(i["title"])
        href = i["url"]
        path_name = i["title"]+"/"+i["name"]+".txt"
        path_name = path_name.replace("****", " ")    #作用去除****
        # 创建协程任务
        task = asyncio.create_task(get_page_one(href, path_name))
        tasks.append(task)
    await asyncio.wait(tasks)
#执行
if __name__ == '__main__':
    url="https://www.51shucheng.net/jiakong/qingyunian"
    result_list = get_chapter_info(url)
    event_loop = asyncio.get_event_loop()
    event_loop.run_until_complete(main(result_list))

posted @ 2022-07-06 21:52  字母一哥  阅读(77)  评论(0)    收藏  举报
刷新页面返回顶部
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3