会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
嗷山
嗷山个人技术类blog
博客园
首页
新随笔
联系
订阅
管理
2017年8月10日
分类器性能指标之ROC曲线、AUC值
摘要: 一 roc曲线 1、roc曲线:接收者操作特征(receiveroperating characteristic),roc曲线上每个点反映着对同一信号刺激的感受性。 横轴:负正类率(false postive rate FPR)特异度,划分实例中所有负例占所有负例的比例;(1-Specificity
阅读全文
posted @ 2017-08-10 11:42 嗷山
阅读(378)
评论(0)
推荐(0)
2017年7月4日
如何理解似然函数?
摘要: 作者:Yeung Evan链接:https://www.zhihu.com/question/54082000/answer/145495695来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 在英语语境里,likelihood 和 probability 的日常使用是
阅读全文
posted @ 2017-07-04 14:04 嗷山
阅读(370)
评论(0)
推荐(0)
2017年6月28日
sigmoid函数简介
摘要: Sigmoid函数由下列公式定义 sigmoid函数是一个良好的阈值函数, 连续 光滑 严格单调 关于(0,0.5)中心对称 在信息科学中,由于其单增以及反函数单增等性质,Sigmoid函数常被用作神经网络的阈值函数,将变量映射到0,1之间。 sigmoid函数是一个良好的阈值函数, 连续 光滑 严
阅读全文
posted @ 2017-06-28 17:53 嗷山
阅读(1521)
评论(0)
推荐(0)
Hive分析窗口函数
摘要: Hive中提供了越来越多的分析函数,用于完成负责的统计分析。 今天简单整理一下,以务以后自己快速查询,也给看到的朋友作个参考。 分析函数主要用于实现分组内所有和连续累积的统计。 一. AVG,MIN,MAX,和SUM 如果不指定ROWS BETWEEN,默认为从起点到当前行; 如果不指定ORDER
阅读全文
posted @ 2017-06-28 15:44 嗷山
阅读(3450)
评论(0)
推荐(1)
2017年6月16日
强大的矩阵奇异值分解(SVD)及其应用
摘要: 版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com 前言: 上一次写了关于PCA与LDA的文章,PCA的实现一般有两种,一种是用特征值分解去实现的,一种是用奇异值分解去实现的。在上篇文章中便是基于特征值分解的一种解释。特征值和奇异值在大部分人的
阅读全文
posted @ 2017-06-16 16:22 嗷山
阅读(516)
评论(0)
推荐(0)
数据归一化和两种常用的归一化方法
摘要: 数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。以下是两种常用的归一
阅读全文
posted @ 2017-06-16 16:18 嗷山
阅读(28525)
评论(0)
推荐(2)
2017年6月13日
《Python数据分析常用手册》一、NumPy和Pandas篇
摘要: 一、常用链接: 1.Python官网:https://www.python.org/2.各种库的whl离线安装包:http://www.lfd.uci.edu/~gohlke/pythonlibs/#scikit-learn 一、常用链接: 3.数据分析常用库的离线安装包(pip+wheels)(百
阅读全文
posted @ 2017-06-13 11:48 嗷山
阅读(364)
评论(0)
推荐(0)
2017年5月11日
轻松看懂机器学习十大常用算法
摘要: 通过本篇文章可以对ML的常用算法有个常识性的认识,没有代码,没有复杂的理论推导,就是图解一下,知道这些算法是什么,它们是怎么应用的,例子主要是分类问题。 每个算法都看了好几个视频,挑出讲的最清晰明了有趣的,便于科普。以后有时间再对单个算法做深入地解析。 今天的算法如下: 1. 决策树 根据一些 fe
阅读全文
posted @ 2017-05-11 09:59 嗷山
阅读(199)
评论(0)
推荐(0)
2017年5月10日
最详细的《MapReduce框架详解》
摘要: 开始聊mapreduce,mapreduce是hadoop的计算框架,我学hadoop是从hive开始入手,再到hdfs,当我学习hdfs时候,就感觉到hdfs和mapreduce关系的紧密。这个可能是我做技术研究的思路有关,我开始学习某一套技术总是想着这套技术到底能干什么,只有当我真正理解了这套技
阅读全文
posted @ 2017-05-10 14:36 嗷山
阅读(511)
评论(0)
推荐(0)
2017年5月5日
hadoop HDFS常用文件操作命令
摘要: 命令基本格式: 1.ls 列出hdfs文件系统根目录下的目录和文件 列出hdfs文件系统所有的目录和文件 2.put hdfs file的父目录一定要存在,否则命令不会执行 hdfs dir 一定要存在,否则命令不会执行 从键盘读取输入到hdfs file中,按Ctrl+D结束输入,hdfs fil
阅读全文
posted @ 2017-05-05 11:13 嗷山
阅读(602)
评论(0)
推荐(0)
下一页
公告