10 2020 档案
摘要:options.add_argument('--disable-infobars') # 禁止策略化 options.add_argument('--no-sandbox') # 解决DevToolsActivePort文件不存在的报错 options.add_argument('window-si
阅读全文
摘要:实际工作场景中,会遇到需要处理时序表。对于少量的时点时序数据,明细数据+数据透视表,也是很快能处理完成。大量的话,可能会出现有一点慢,同时一些计算字段的每次都要设置,不太方便处理。整理一个思路:将系统的时点时序数据进行汇总整合,并形成时序表。 思路:结构化的数据是很方便处理,表格类的数据不方便程序处
阅读全文
摘要:统计数据来说,有时点数据和时期数据。通常情况下,会进行两期数据的比较,现整理一个两期数据比较的场景应用。主要流程分为: 1、数据读取 2、数据预处理 3、数据分类汇总 4、两期数据比较 5、数据输出到EXCEL 主程序如下: df = get_src_data(r'../data/learn_pan
阅读全文
摘要:官方文档:https://pandas.pydata.org/pandas-docs/stable/user_guide/index.html 虽然可以直接查官方文档,不过还是结合一些实际场景,方便记忆,预计做一个使用的系列,涉及平时常见的数据处理应用。 从数据处理的角度来说,主要还是看怎么方便怎么
阅读全文
摘要:python 舆情分析 nlp主题分析 (1) 待续: https://www.cnblogs.com/cycxtz/p/13663895.html python 舆情分析 nlp主题分析 (2)-结合snownlp与jieba库,提高分词与情感判断 待续:https://www.cnblogs.c
阅读全文

浙公网安备 33010602011771号