项目经历 - 文章分类 - sort_man

用户使用率及使用概率分布

摘要：1 目标计算用户使用率及使用概率分布 1.2 程序顺序 df1: 三会终端用户登陆数据 df2: 用户信息数据 df3: 公告数据 df4: df1+df2 df5: 用户首次登陆时间 df: 用户登录时间与公告时间左连接，并去除登陆前公告时间 df6: 统计公告数S，df用户与公告时间去重后gr 阅读全文

posted @ 2020-07-04 11:21 sort_man 阅读(753) 评论(0) 推荐(0)

网站用户行为分析

摘要：一、背景目的分析用户日志量分布情况，对数据作出解释，研究用户使用使用行为，根据分析结果提出可行性建议。二、分析流程三、用户行为分析过程 3.1 明确细则中国结算发布《证券持有人名册业务实施细则》并自2018年7月2日开始实施。中国结算每个月向上市公司提供3次前200名大股东名册（包含股东人数阅读全文

posted @ 2019-09-16 19:53 sort_man 阅读(136) 评论(0) 推荐(0)

Jzzx用户行为分析1

摘要：一、目标分析“股东分析”模块用户行为二、分析流程三、用户行为分析过程 3.1 明确细则中国结算发布《证券持有人名册业务实施细则》并自2018年7月2日开始实施。中国结算每个月向上市公司提供3次前200名大股东名册（包含股东人数），分别为每个月的10日、20日和月底最后一个交易日。此前为每月2 阅读全文

posted @ 2019-07-25 13:17 sort_man 阅读(232) 评论(0) 推荐(0)

淘宝用户行为分析

摘要：一、背景目的基于电商数据的多样化，从中寻找有价值的数据推断用户购买行为，从而实现利润提升；本项目基于淘宝用户行为数据，探索淘宝用户的行为模式，寻找高购买率背后用户行为特征，具体指标包括：日PV和日UV分析，支付率分析，复购行为分析，漏斗转化率分析和用户价值RFM分析。二、数据获取与解读本次竞赛阅读全文

posted @ 2019-05-14 09:29 sort_man 阅读(209) 评论(0) 推荐(0)

基于豆瓣图书top250的数据分析

摘要：一、背景目的互联网的兴起，知识的获取变得越来越便利，然而大量信息有时候会对我们的选择造成干扰，通过其他用户的点击评阅可以作为一个有效的参考，方便人们搜寻到有效信息，本项目基于豆瓣图书TOP250进行数据分析二、数据获取通过python爬虫获取豆瓣图书top250的书名、网址链接、评分、点评数、阅读全文

posted @ 2019-05-12 09:13 sort_man 阅读(1976) 评论(1) 推荐(0)

基于xpath的爬虫实战

摘要：一、环境简介使用anaconda编程环境安装requests和lxml工具包：pip install requests pip install lxml 二、Xpath简介 Xpath即为XML路径语言，用来确定XML文档中某部分位置的语言。 Xpath基于XML的树状结构，提供在数据结构树中寻阅读全文

posted @ 2019-05-11 19:31 sort_man 阅读(107) 评论(0) 推荐(0)

基于BeautifulSoup的爬虫实战

摘要：一、背景互联网时代，数据分析与检索可对公司运营起决策性作用，而大部分数据需要从网上获取，且该类数据多为非结构化数据，本次实战目的是通过python爬虫爬取非结构化数据转换为结构化数据存储到数据库中。非结构化数据需经过ETL（Extract, Transformation, loading)工具将阅读全文

posted @ 2019-05-08 22:49 sort_man 阅读(105) 评论(0) 推荐(0)

基于MySQL实现广告精准投放

摘要：一、软件安装 MySQL安装：https://zhuanlan.zhihu.com/p/46905335NAVICAT安装：https://www.zhihu.com/question/22187503/answer/424079363数据集下载：https://tianchi.aliyun.com 阅读全文

posted @ 2019-05-07 16:13 sort_man 阅读(333) 评论(0) 推荐(0)

文章分类 - 项目经历

公告