会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
首页
联系
Github
友情链接
博客园
管理
关于
云流
Published on undefined in
暂未分类
with
云流
暂未分类
Joker's Blog
首页
新随笔
联系
订阅
管理
随笔 - 73
文章 - 0
评论 - 10
阅读 -
30595
上一页
1
···
3
4
5
6
7
8
下一页
2020年1月15日
机器学习-决策树算法
摘要: date: 2019-04-07 00:48 一、基本流程 1、初始化属性集合和数据集合 2、从数据集中选择最优划分属性,并以该属性为当前决策节点 3、更新数据集合和属性集合(删除掉上一步中使用的属性,并按照属性值来划分不同分支的数据集合) 4、依次对每种取值情况下的子集重复第2步 5、若子集只包含
阅读全文
posted @ 2020-01-15 00:28 吹不散的流云
阅读(282)
评论(0)
推荐(0)
2020年1月14日
机器学习-线性模型(线性回归与逻辑回归)
摘要: date: 2019-03-31 00:58 一、线性模型(linear model) 线性模型试图学习一个通过属性关系的线性组合来进行预测的函数。 表达式如下:
f
(
x
)
=
w
1
x
1
+
w
2
x
2
+
.
.
.
+
w
d
x
d
+
b
f
(
x
)
=
w
1
x
1
+
w
2
x
2
+
.
.
.
+
w
d
x
d
+
b
向量形式为:
阅读全文
posted @ 2020-01-14 00:58 吹不散的流云
阅读(670)
评论(0)
推荐(0)
2020年1月13日
深入JVM内核(四)垃圾回收器与GC参数
摘要: date: 2018-10-18 13:03:17 堆的回顾 很多垃圾回收算法,如CMS,使用的堆内存结构如下: 新手代:一个Eden和两个survivor 老年代:old space 持久带:1.8之前的perm space 元空间:1.8之后的metaspace 注:这些space必须是地址连续
阅读全文
posted @ 2020-01-13 13:03 吹不散的流云
阅读(114)
评论(0)
推荐(0)
2020年1月12日
深入JVM内核(三)对象存活判定算法与垃圾收集算法
摘要: date: 2018-10-16 13:02:54 对象存活判定算法 引用计数法(Reference Counting) 思路很简单,给每个对象中添加一个引用计数器,每当一个地方引用它时,计数器值加一;当引用失效时,计数器值减一。任何时候,当计数器值为0就不可能再被使用了。 引用计数法实现简单,判断
阅读全文
posted @ 2020-01-12 13:02 吹不散的流云
阅读(105)
评论(0)
推荐(0)
2020年1月11日
深入JVM内核(二)常用的JVM配置参数
摘要: date: 2018-10-14 13:02:33 前言 目的:监控GC执行和JVM基本内存状态。 Trace跟踪参数 -verbose:gc or -XX:+PrintGC 打印GC的简要信息 在虚拟机发生内存回收时在输出设备显示信息 实例: /** * @author ZenoYang * wi
阅读全文
posted @ 2020-01-11 13:02 吹不散的流云
阅读(199)
评论(0)
推荐(0)
2020年1月10日
深入JVM内核(一)JVM内存区域与运行机制
摘要: date: 2018-10-03 13:01:52 JVM启动流程 JVM基本结构 程序计数器 每个线程拥有一个PC寄存器 在线程创建时创建 指向下一条指令的地址 执行本地方法师,PC的值为undefined 方法区 所有线程共享 存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等
阅读全文
posted @ 2020-01-10 13:01 吹不散的流云
阅读(108)
评论(0)
推荐(0)
2020年1月9日
基于Spark的文本情感分析
摘要: date: 2018-08-28 15:06:56 前言 本文以大众点评中餐馆的评论数据为例,实现一个简单的文本情感分析系统。 主要的技术环节: **收集数据。**这里包括爬虫爬取相应数据,并对数据进行清洗、过滤、抽取等。 **设计文本的表示模型,选择文本的特征。**使用向量来表示文本,首先需要对文
阅读全文
posted @ 2020-01-09 15:06 吹不散的流云
阅读(1873)
评论(3)
推荐(0)
2020年1月8日
Spark Streaming消费Kafka直连(Direct)方式实现数据零丢失
摘要: date: 2018-08-16 22:24:26 DStream的理解 Dstream是Spark Streaming中的一个最基本的抽象,代表了一系列连续的数据,本质上是一系列连续的RDD,对DStream进行操作,就是对RDD进行操作。 DStream可以认为是一个RDD的工厂,该DStrea
阅读全文
posted @ 2020-01-08 01:23 吹不散的流云
阅读(636)
评论(0)
推荐(0)
2020年1月6日
再见 RoboCup
摘要: date: 2018-06-23 19:13 自16年6月6号的面试开始入坑 RoboCup,到现在已经两年多了。起初完全不知道什么是 RoboCup,跟大部人一样划了一年的水,看到学长们去德国比赛甚是羡慕。后来有幸和学长们去日照参加国赛,遇到了很多热衷 2D 的大佬和 YuShan 团队的程老师,
阅读全文
posted @ 2020-01-06 19:13 吹不散的流云
阅读(29)
评论(1)
推荐(0)
2020年1月3日
MapReduce原理篇
摘要: map
阅读全文
posted @ 2020-01-03 18:17 吹不散的流云
阅读(130)
评论(0)
推荐(0)
上一页
1
···
3
4
5
6
7
8
下一页
搜索
我的标签
essay
(33)
java
(11)
hbase
(11)
c++
(10)
spark
(2)
robocup
(2)
mapreduce
(2)
machinelearning
(2)
hadoop
(2)
algorithm
(2)
更多
随笔分类
(73)
algorithm(2)
c++(10)
dbms(1)
docker(1)
hbase(1)
java(11)
linux(1)
machinelearning(2)
mapreduce(2)
movie(1)
netty(1)
quartz(1)
robocup(1)
spark(2)
tools(1)
书法(1)
随笔(33)
养生(1)
随笔档案
(73)
2025年2月(1)
2024年4月(1)
2024年2月(1)
2023年5月(1)
2023年4月(1)
2023年3月(1)
2023年2月(1)
2023年1月(2)
2022年12月(2)
2022年11月(1)
2022年10月(1)
2022年9月(4)
2022年8月(3)
2022年7月(3)
2022年6月(6)
2022年5月(2)
2022年4月(1)
2022年3月(1)
2022年1月(2)
2021年12月(5)
2021年11月(2)
2021年7月(1)
2021年5月(1)
2021年1月(4)
2020年10月(2)
2020年8月(3)
2020年6月(2)
2020年3月(5)
2020年1月(13)
点击右上角即可分享