摘要: 1.鼠标放在内建函数上,Ctrl+B,看源码 2. 阅读全文
posted @ 2018-07-26 14:31 NicoleFisher 阅读(144) 评论(0) 推荐(0)
摘要: 相似性 1.闵可夫斯基聚类minkowski/欧式距离 p=1 p=2,欧式距离,2范式 p=无穷代,取最大值 2.杰拉德相似度Jacard 3.余弦相似性 4. K-means a.k的选择? b.k个中心点的选择?对结果会有影响的 c.损失函数? 阅读全文
posted @ 2018-07-26 00:04 NicoleFisher 阅读(110) 评论(0) 推荐(0)
摘要: 1.静态属性 静态属性主要从用户的基本信息进行用户的划分。静态属性是用户画像建立的基础,最基本的用户信息记录。 如性别、年龄、学历、角色、收入、地域、婚姻等。依据不同的产品,记性不同信息的权重划分。 2.动态属性 动态属性指用户在再互联网环境下的上网行为。信息时代用户出行、工作、休假、娱乐等都离不开 阅读全文
posted @ 2018-07-25 11:47 NicoleFisher 阅读(564) 评论(0) 推荐(0)
摘要: 命令 模式 dd:删除光标所在的那一行 ndd:n为数字,删除光标所在的向下n行,例如,20dd则是删除20行 yy:复制光标所在的那一行 nyy:n为数字,复制光标所在的向下n行,例如20yy则是复制20行 P:将已复制的数据在光标下一行粘贴 P:将已复制的数据在光标上一行粘贴 U:复原前1个操作 阅读全文
posted @ 2018-07-22 09:17 NicoleFisher 阅读(128) 评论(0) 推荐(0)
摘要: Apriori算法是一种挖掘关联规则的频繁项集算法,是由Rakesh Agrawal和Ramakrishnan Srikant两位在1994年提出的布尔关联规则的频繁项集挖掘算法。算法的名字"Apriori "的由来是因为算法基于先验知识(prior knowledge)。算法核心思想是通过候选集生 阅读全文
posted @ 2018-07-16 18:03 NicoleFisher 阅读(2584) 评论(0) 推荐(0)
摘要: 1.简介 独立性检验的目的是检测两个变量之间是否存在必然联系。 常识告诉我们,吸烟与患肺癌之间是存在一定联系的,但这是一个模糊的概念,如何用量化的方法,来说明吸烟与患肺癌之间是存在联系的, 更精确地说,我们有多大的把握证明吸烟与患肺癌之间是存在联系的,这是独立性检验要做的事情。 1.列2*2列联表 阅读全文
posted @ 2018-07-16 13:55 NicoleFisher 阅读(3138) 评论(0) 推荐(0)
摘要: 调查问卷数据分析中经常遇到对数据进行加权的问题,什么是加权?沈浩老师博客中这样描述:让一些人变得比另一些人更重要!那为什么要加权?为了让调查数据在特征的分布上更接近实际情况。 比如在会员数据中,男女比例是6:4,而调查问卷的比例是7:3,为了使调查结果更贴近真实,首先需要对问卷进行加权处理,让问卷的 阅读全文
posted @ 2018-07-16 11:01 NicoleFisher 阅读(6027) 评论(0) 推荐(0)
摘要: 从功能为王到用户为王的转变 怎样去衡量我们的产品呢?用数据去衡量 AARRR Acquisition 获取:对外营销(广告投放),入站营销, Activation 激活 Retention 留存 :50%(次日)-20%(一周)-10%(一个月以上) 法则 魔法数字 linkedln 发现在第一周增 阅读全文
posted @ 2018-07-12 19:35 NicoleFisher 阅读(176) 评论(0) 推荐(0)
摘要: useadd passwd shadow:密码文件 group: gshadow:组密码 usermod -d /home/sb -- 只能修改配置文件 mkdir /home/sb 还必须添加目录 配置文件都是在etc下面 ls -l 权限信息 硬链接数 属主 属组 文件大小 文件创建的日期 文件 阅读全文
posted @ 2018-07-10 23:00 NicoleFisher 阅读(137) 评论(0) 推荐(0)
摘要: # root权限提示符 $普通用户提示符 语法格式 命令【选项】【参数】 选项:说明命令运行的方式 参数:命令作用在谁身上 ls -l / whoami:我是谁 who:那些人登录 # useadd yuhuifang --增加用户 #su - yuhuifang -- 切换账号,上层换 # man 阅读全文
posted @ 2018-07-09 23:14 NicoleFisher 阅读(124) 评论(0) 推荐(0)