会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Loading...
Mr.Yan
首页
新随笔
联系
管理
上一页
1
2
3
4
5
6
7
8
下一页
2019年1月19日
Error: Cannot retrieve repository metadata (repomd.xml) for repository: rpmforge.
摘要: Error: Cannot retrieve repository metadata (repomd.xml) for repository: rpmforge. Please verify its path and try again 解决办法:(或者把/etc/yum.repos.d下的文件全部
阅读全文
posted @ 2019-01-19 10:08 严康
阅读(752)
评论(0)
推荐(0)
2018年12月27日
Mysql调优之查看explain命令
摘要: explain怎么用? 比如说你查看一个 select count(1) from table 某个表的时候,在语句前面加一个explain就可以了。 具体说一下各个字段都是什么意思: id:自增长的id,其实没什么用,做一个标示作用; select_type: 查看数据查询的查询 ,主要有下面这个
阅读全文
posted @ 2018-12-27 21:28 严康
阅读(711)
评论(0)
推荐(0)
2018年11月27日
大数据判断数据是否存在——布隆过滤器
摘要: 题目:给定十亿个数字,怎么去判断这个数据是否存在; 这个一个典型的查找问题,我们知道面对查找的时候,最快的查找是基于hash查找,那么都是在O(1)的时间内找到指定的数据集,但是这样要把数据全部load到内存里,内存大部分的时候是不支持一次性load十亿的数据的,而且hash的空间利用率来说相对比较
阅读全文
posted @ 2018-11-27 21:53 严康
阅读(2403)
评论(0)
推荐(1)
2018年11月25日
无监督学习在反欺诈中的应用
摘要: 一.反欺诈几种发展阶段: 1.黑名单,信誉库和指纹设备。这个很好理解,就是针对已有的出现过过信用的人进行标记,但是这种无法标记没有信用记录的人; 2.规则规律。这个根据一些好的信用的人一些特性,或者一些黑名单的人进行标记统计,总结出一些规则,然后通过规则去过滤避免一些风险; 3.有监督机器学习。有监
阅读全文
posted @ 2018-11-25 21:09 严康
阅读(1609)
评论(0)
推荐(0)
2018年11月19日
Java中Object对象方法
摘要: 1.clone() 复制 2.getClass() 获取对象的class 3.equals() 对象值比较,重写equals方法必须重写hashcode,对象的约定,例如不重写,hashMap的kv不一致; 4.hashCode() 对象的hash值 5.tostring() 默认方法是 包名@改对
阅读全文
posted @ 2018-11-19 00:23 严康
阅读(6005)
评论(0)
推荐(1)
2018年11月15日
ambari下httpfs安装
摘要: 1.比较webFS 和 httpFS 两个比较基本没啥区别,只是说两个竞争公司不同的人写的,功能上都是一致的,都支持REST的HDFS API。 最大的区别是httpfs可以HA模式访问,webHDFS只能单节点namenode访问; 2.安装 执行 sudo yum install hadoop-
阅读全文
posted @ 2018-11-15 19:02 严康
阅读(753)
评论(0)
推荐(1)
2018年10月21日
深入理解spark-rdd详解
摘要: 1.我们在使用spark计算的时候,操作数据集的感觉很方便是因为spark帮我们封装了一个rdd(弹性分布式数据集Resilient Distributed Dataset); 那么rdd数据本身是如何存储的呢,又是如何调度读取的? spark大部分时候都是在集群上上运行的,那么数据本身一定是也是分
阅读全文
posted @ 2018-10-21 18:28 严康
阅读(1222)
评论(0)
推荐(1)
Tensorflow实践Basic Classification
摘要: 版本 Tensorflow的安装,我使用anaconda3.6 安装 最新版本 1.11.0; 废物不多说,先拿案例代码basic classification跑一下结果: 再来详解一下代码:
阅读全文
posted @ 2018-10-21 17:31 严康
阅读(323)
评论(0)
推荐(1)
2018年10月14日
深入理解spark-两种调度模式FIFO,FAIR模式
摘要: 前面我们应知道了一个任务提交会由DAG拆分为job,stage,task,最后提交给TaskScheduler,在提交taskscheduler中会根据master初始化taskscheduler和schedulerbackend两个类,并且初始化一个调度池; 1.调度池比较 根据mode初始化调度
阅读全文
posted @ 2018-10-14 14:20 严康
阅读(6475)
评论(0)
推荐(0)
2018年10月13日
深入理解spark-taskScheduler,schedulerBackend源码分析
摘要: 上次分析了dagshceduler是如何将任务拆分成job,stage,task的,但是拆分后的仅仅是一个逻辑结果,保存为一个resultstage对象,并没执行; 而将任务正在执行的是spark的taskscheduler模块和shcedulerbackend模块, taskcheduler模块负
阅读全文
posted @ 2018-10-13 13:25 严康
阅读(1797)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
8
下一页
公告