文章分类 -  data analysis

 
matplotlib 绘图篇
摘要:一、导入前图形参数配置 二、绘图细节 阅读全文
posted @ 2019-09-22 12:20 sort_man 阅读(79) 评论(0) 推荐(0)
python 读取pdf文件,并提取所需内容
摘要:1. 读取本地pdf文件 安装工具包:pip install pdfminer3 2. 读取字符串中对应字符 阅读全文
posted @ 2019-08-02 15:09 sort_man 阅读(494) 评论(0) 推荐(0)
数据分析之用户行为篇
摘要:一、什么是用户行为 1.1 用户行为定义 用户行为构成五元素:时间、地点、人物、交互、交互内容。 用户行为的定义:一个完整的事件,在什么时间,什么平台,哪个ID,做了什么搜索,搜索了什么内容。 1.2 用户行为数据获取 通过 “埋点” 在网站需要监测用户行为的地方加载监测代码,获取用户行为数据 二、 阅读全文
posted @ 2019-05-29 22:51 sort_man 阅读(122) 评论(0) 推荐(0)
数据分析之日志篇
摘要:一、数据来源 清楚应用的web服务器 二、字段含义 明确日志字段所代表的含义 三、日志处理 明确需求: 数据处理流程: 日志存储(一天产生一个日志文件,以零点为准) 日志数据收集 数据预处理/处理/分析(分块,时间格式转换) 数据可视化 阅读全文
posted @ 2019-05-29 22:21 sort_man 阅读(99) 评论(0) 推荐(0)