12 2020 档案

LDA模型在邮件分类上的运用
摘要:lda模型实战 # -*- coding: utf-8 -*- """ Created on Tue Dec 8 00:02:27 2020 @author: Administrator """ import numpy as np import pandas as pd import re # 数 阅读全文

posted @ 2020-12-10 11:25 iUpoint 阅读(154) 评论(0) 推荐(0)

hive笔记
摘要:hive笔记 #hive基本语法 #http://dblab.xmu.edu.cn/blog/2440-2/ -- 不区分大小写 --建表 if not exists CREATE TABLE if not exists page_view(viewTime INT, userid BIGINT, 阅读全文

posted @ 2020-12-09 16:05 iUpoint 阅读(107) 评论(0) 推荐(0)

python爬虫 - 异步多任务
摘要:异步爬虫批量下载图片,文件下载链接已失效,不要直接运行 # 异步批量下载 import aiohttp import asyncio import time async def job(session, url): # 声明为异步函数 name = url.split('/')[-1] # 获得名字 阅读全文

posted @ 2020-12-08 16:01 iUpoint 阅读(257) 评论(0) 推荐(0)

python使用docx模块读写
摘要:python使用docx模块读写docx文件的方法与docx模块常用方法详解 阅读全文

posted @ 2020-12-07 11:11 iUpoint 阅读(136) 评论(0) 推荐(0)

python爬虫 - 代理ip的使用
摘要:python爬虫 - 代理ip的使用 import sys import time import hashlib import requests import urllib3 from lxml import etree urllib3.disable_warnings(urllib3.except 阅读全文

posted @ 2020-12-03 13:48 iUpoint 阅读(340) 评论(0) 推荐(0)

导航