随笔分类 -  Python 第三方包

记录Python各类第三方包的学习
摘要:最近在爬b站视频评论 爬取之后存储在csv文件里面,但是用np.loadtxt读取的时候一直报错,最终发现问题在一个参数:comments上面: 这是报错数据:930行 这是读取代码: data = np.loadtxt('./{}_reply.csv'.format(name), dtype='s 阅读全文
posted @ 2022-06-19 17:04 Hello418 阅读(349) 评论(0) 推荐(0)
摘要:功能:检测评论水军 号码转换(代码来自知乎) table = 'fZodR9XQDSUm21yCkr6zBqiveYah8bt4xsWpHnJE7jL5VG3guMTKNPAwcF' tr = {} for i in range(58): tr[table[i]] = i s = [11, 10, 阅读全文
posted @ 2022-06-19 17:04 Hello418 阅读(294) 评论(0) 推荐(0)
摘要:学习笔记:DASK基础操作 1.导包 import dask.dataframe as dd # main import numpy as np # 辅助 2.读取csv文件 ddf = dd.read_csv(dec_CSV_DIR, blocksize=25e6, names=['num', ' 阅读全文
posted @ 2022-06-19 17:04 Hello418 阅读(650) 评论(0) 推荐(0)
摘要:基本思想,xlwt读取已有Excel表格,使用xlutils内的copy复制一份副本,在副本上修改后保存 下面给出一个读取已有表格的第一列数据,将第一列的平方输出到指定列的模板: import xlrd from xlutils.copy import copy workbook = xlrd.op 阅读全文
posted @ 2022-06-19 17:04 Hello418 阅读(99) 评论(0) 推荐(0)