Fork me on GitHub
上一页 1 ··· 8 9 10 11 12 13 14 15 16 ··· 18 下一页
摘要: 一.目的 基于基站定位数据的商圈分析移动通信网络会记录用户手机的相关信息,比如手机所处的基站区域编号,所处基站的时间等。根据这些数据可以进行商圈划分,目的是为了研究潜在的顾客的分布以制定适宜的商业对策。如:可划分商业区、住宅区以及工作区 二.数据 数据来源【Python数据分析与挖掘实战(第14章基 阅读全文
posted @ 2020-11-22 10:25 石头木 阅读(815) 评论(0) 推荐(0)
摘要: 一.数据 这是一个Udacity纳米学位项目(数据科学的顶点)。这个项目使用来自Sparkify的用户事件数据来建立一个模型来预测用户的流失。Sparkify是一个类似于Spotify或Pandora的数字化音乐服务(类似于网易云音乐和QQ音乐的音乐平台)。使用Spark分析探索某数字音乐服务平台S 阅读全文
posted @ 2020-11-22 10:13 石头木 阅读(458) 评论(0) 推荐(0)
摘要: 一.什么是AHP RFM是对顾客价值分群,但是每个群内的顾客并没有区分价值度。所以AHP就是针对每个群内的顾客进行打分去区分不同价值顾客。 什么是AHP > https://baike.baidu.com/item/%E5%B1%82%E6%AC%A1%E5%88%86%E6%9E%90%E6%B3 阅读全文
posted @ 2020-11-21 10:49 石头木 阅读(673) 评论(0) 推荐(0)
摘要: 一.RFM RFM是一种用来衡量当前客户价值和潜在客户价值的重要工具和手段。 在面向客户制定运营策略、营销策略时,我们希望能够针对不同的客户推行不同的策略,实现精准化运营,以期获取最大的转化率。精准化运营的前提是客户关系管理,而客户关系管理的核心是客户分类。 通过客户分类,对客户群体进行细分,区别出 阅读全文
posted @ 2020-11-21 10:36 石头木 阅读(750) 评论(0) 推荐(0)
摘要: 一.统计指标针对淘宝app一个月的数据进行流量运营分析,主要包括: 1.app流量分析 (1).pv页面浏览量 (2).uv独立访客 (3).访问深度 (4).每天访客数和成交量 (5).不同时段的访客数及成交量 (6).流失率 2.用户行为分析 (1).用户浏览活跃时段 (2).用户购买活跃时段 阅读全文
posted @ 2020-11-21 10:18 石头木 阅读(836) 评论(0) 推荐(0)
摘要: 记录一下使用py2neo进行查询,查询某演员出演的电影,返回三元组,可转为json用于前端显示,如下(以下在jupyter notebook中进行操作): 一.查询数据 from py2neo import Graph,Node,Relationship,NodeMatcher,Relationsh 阅读全文
posted @ 2020-09-29 23:00 石头木 阅读(5571) 评论(0) 推荐(0)
摘要: 一.简介电影知识图谱问答,利用spark,neo4j以及hanlp完成一个简易的电影问答。二.要求 利用java-driver方式,使用cypher和apoc构建节点和关系,使用spark ml完成问句分类。 1.neo4j3.5.3 2.apoc3.5.0.13 3.jdk1.8 4.hanlp1 阅读全文
posted @ 2020-09-23 22:13 石头木 阅读(1651) 评论(0) 推荐(0)
摘要: 一.背景 之前在github上看到https://github.com/liuhuanyong/TextGrapher利用pyltp对文章进行分析并图示。所以这两天打算利用java,hanlp进行文章分析并图示,项目在https://github.com/jiangnanboy/text_graph 阅读全文
posted @ 2020-06-05 17:12 石头木 阅读(735) 评论(0) 推荐(1)
摘要: 一.从京东抓取一些婴儿奶粉的相关商品,格式如1.1: 1.1 1.2主要字段有: 商品名称,1商品sku,2商品链接,3封面图链接,4价格,5评价人数,6评论链接,7商家店名,8店铺链接,9标签,10是否广告,11页码,12当前时间,13页面网址,14 二.数据处理 2.1需要的字段有: 品牌名、奶 阅读全文
posted @ 2020-05-26 22:35 石头木 阅读(532) 评论(0) 推荐(0)
摘要: 在推荐中,多样性并不是目的,而是一种提高用户粘度或是惊喜度的手段。记得在17年的时候在公司做的一个新闻文本摘要项目(那时候没有用到深度学习中的生成式方法是因为:一是没有gpu机器;二是样本不够。而且深度学习的这种生成式方法有时候真的不是太准,即生成的摘要有时候是不通顺的或是不知道説啥,这个还需要后续 阅读全文
posted @ 2020-04-18 16:50 石头木 阅读(1764) 评论(0) 推荐(0)
上一页 1 ··· 8 9 10 11 12 13 14 15 16 ··· 18 下一页