文章分类 -  项目经历

 
用户使用率及使用概率分布
摘要:1 目标 计算用户使用率及使用概率分布 1.2 程序顺序 df1: 三会终端用户登陆数据 df2: 用户信息数据 df3: 公告数据 df4: df1+df2 df5: 用户首次登陆时间 df: 用户登录时间与公告时间左连接,并去除登陆前公告时间 df6: 统计公告数S,df用户与公告时间去重后gr 阅读全文
posted @ 2020-07-04 11:21 sort_man 阅读(753) 评论(0) 推荐(0)
网站用户行为分析
摘要:一、背景目的 分析用户日志量分布情况,对数据作出解释,研究用户使用使用行为,根据分析结果提出可行性建议。 二、分析流程 三、用户行为分析过程 3.1 明确细则 中国结算发布《证券持有人名册业务实施细则》并自2018年7月2日开始实施。中国结算每个月向上市公司提供3次前200名大股东名册(包含股东人数 阅读全文
posted @ 2019-09-16 19:53 sort_man 阅读(136) 评论(0) 推荐(0)
Jzzx用户行为分析1
摘要:一、目标 分析“股东分析”模块用户行为 二、分析流程 三、用户行为分析过程 3.1 明确细则 中国结算发布《证券持有人名册业务实施细则》并自2018年7月2日开始实施。中国结算每个月向上市公司提供3次前200名大股东名册(包含股东人数),分别为每个月的10日、20日和月底最后一个交易日。此前为每月2 阅读全文
posted @ 2019-07-25 13:17 sort_man 阅读(232) 评论(0) 推荐(0)
淘宝用户行为分析
摘要:一、背景目的 基于电商数据的多样化,从中寻找有价值的数据推断用户购买行为,从而实现利润提升;本项目基于淘宝用户行为数据,探索淘宝用户的行为模式,寻找高购买率背后用户行为特征,具体指标包括:日PV和日UV分析,支付率分析,复购行为分析,漏斗转化率分析和用户价值RFM分析。 二、数据获取与解读 本次竞赛 阅读全文
posted @ 2019-05-14 09:29 sort_man 阅读(209) 评论(0) 推荐(0)
基于豆瓣图书top250的数据分析
摘要:一、背景目的 互联网的兴起,知识的获取变得越来越便利,然而大量信息有时候会对我们的选择造成干扰,通过其他用户的点击评阅可以作为一个有效的参考,方便人们搜寻到有效信息,本项目基于豆瓣图书TOP250进行数据分析 二、数据获取 通过python爬虫获取豆瓣图书top250的书名、网址链接、评分、点评数、 阅读全文
posted @ 2019-05-12 09:13 sort_man 阅读(1976) 评论(1) 推荐(0)
基于xpath的爬虫实战
摘要:一、环境简介 使用anaconda编程环境 安装requests和lxml工具包:pip install requests pip install lxml 二、Xpath简介 Xpath即为XML路径语言,用来确定XML文档中某部分位置的语言。 Xpath基于XML的树状结构,提供在数据结构树中寻 阅读全文
posted @ 2019-05-11 19:31 sort_man 阅读(107) 评论(0) 推荐(0)
基于BeautifulSoup的爬虫实战
摘要:一、背景 互联网时代,数据分析与检索可对公司运营起决策性作用,而大部分数据需要从网上获取,且该类数据多为非结构化数据,本次实战目的是通过python爬虫爬取非结构化数据转换为结构化数据存储到数据库中。 非结构化数据需经过ETL(Extract, Transformation, loading)工具将 阅读全文
posted @ 2019-05-08 22:49 sort_man 阅读(105) 评论(0) 推荐(0)
基于MySQL实现广告精准投放
摘要:一、软件安装 MySQL安装:https://zhuanlan.zhihu.com/p/46905335NAVICAT安装:https://www.zhihu.com/question/22187503/answer/424079363数据集下载:https://tianchi.aliyun.com 阅读全文
posted @ 2019-05-07 16:13 sort_man 阅读(333) 评论(0) 推荐(0)