用户使用率及使用概率分布
摘要:1 目标 计算用户使用率及使用概率分布 1.2 程序顺序 df1: 三会终端用户登陆数据 df2: 用户信息数据 df3: 公告数据 df4: df1+df2 df5: 用户首次登陆时间 df: 用户登录时间与公告时间左连接,并去除登陆前公告时间 df6: 统计公告数S,df用户与公告时间去重后gr
阅读全文
网站用户行为分析
摘要:一、背景目的 分析用户日志量分布情况,对数据作出解释,研究用户使用使用行为,根据分析结果提出可行性建议。 二、分析流程 三、用户行为分析过程 3.1 明确细则 中国结算发布《证券持有人名册业务实施细则》并自2018年7月2日开始实施。中国结算每个月向上市公司提供3次前200名大股东名册(包含股东人数
阅读全文
Jzzx用户行为分析1
摘要:一、目标 分析“股东分析”模块用户行为 二、分析流程 三、用户行为分析过程 3.1 明确细则 中国结算发布《证券持有人名册业务实施细则》并自2018年7月2日开始实施。中国结算每个月向上市公司提供3次前200名大股东名册(包含股东人数),分别为每个月的10日、20日和月底最后一个交易日。此前为每月2
阅读全文
淘宝用户行为分析
摘要:一、背景目的 基于电商数据的多样化,从中寻找有价值的数据推断用户购买行为,从而实现利润提升;本项目基于淘宝用户行为数据,探索淘宝用户的行为模式,寻找高购买率背后用户行为特征,具体指标包括:日PV和日UV分析,支付率分析,复购行为分析,漏斗转化率分析和用户价值RFM分析。 二、数据获取与解读 本次竞赛
阅读全文
基于豆瓣图书top250的数据分析
摘要:一、背景目的 互联网的兴起,知识的获取变得越来越便利,然而大量信息有时候会对我们的选择造成干扰,通过其他用户的点击评阅可以作为一个有效的参考,方便人们搜寻到有效信息,本项目基于豆瓣图书TOP250进行数据分析 二、数据获取 通过python爬虫获取豆瓣图书top250的书名、网址链接、评分、点评数、
阅读全文
基于xpath的爬虫实战
摘要:一、环境简介 使用anaconda编程环境 安装requests和lxml工具包:pip install requests pip install lxml 二、Xpath简介 Xpath即为XML路径语言,用来确定XML文档中某部分位置的语言。 Xpath基于XML的树状结构,提供在数据结构树中寻
阅读全文
基于BeautifulSoup的爬虫实战
摘要:一、背景 互联网时代,数据分析与检索可对公司运营起决策性作用,而大部分数据需要从网上获取,且该类数据多为非结构化数据,本次实战目的是通过python爬虫爬取非结构化数据转换为结构化数据存储到数据库中。 非结构化数据需经过ETL(Extract, Transformation, loading)工具将
阅读全文
基于MySQL实现广告精准投放
摘要:一、软件安装 MySQL安装:https://zhuanlan.zhihu.com/p/46905335NAVICAT安装:https://www.zhihu.com/question/22187503/answer/424079363数据集下载:https://tianchi.aliyun.com
阅读全文