python 读取pdf文件,并提取所需内容
摘要:1. 读取本地pdf文件 安装工具包:pip install pdfminer3 2. 读取字符串中对应字符
阅读全文
数据分析之用户行为篇
摘要:一、什么是用户行为 1.1 用户行为定义 用户行为构成五元素:时间、地点、人物、交互、交互内容。 用户行为的定义:一个完整的事件,在什么时间,什么平台,哪个ID,做了什么搜索,搜索了什么内容。 1.2 用户行为数据获取 通过 “埋点” 在网站需要监测用户行为的地方加载监测代码,获取用户行为数据 二、
阅读全文
数据分析之日志篇
摘要:一、数据来源 清楚应用的web服务器 二、字段含义 明确日志字段所代表的含义 三、日志处理 明确需求: 数据处理流程: 日志存储(一天产生一个日志文件,以零点为准) 日志数据收集 数据预处理/处理/分析(分块,时间格式转换) 数据可视化
阅读全文