• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
暗时间&量变
博客园 | 首页 | 新随笔 | 新文章 | 联系 | 订阅 订阅 | 管理
上一页 1 2 3 4 5 6 7 8 ··· 11 下一页

2018年4月11日

One VS Rest
摘要: 简单来说就是分类的类别有多个,不再是二分,比如根据某些特征,什么温度、湿度、空气流动情况来预测天气,天气的label不能说是好天气和坏天气两种,而是分晴天、雨天、阴天,雪天等等,对于决策树或者从计算机的本质上来说,二分,0或者1是本质,计算机对于二分才是擅长的,那么接下来就有两种分类方法,一种是按照 阅读全文
posted @ 2018-04-11 21:20 WuLei吴磊 阅读(863) 评论(0) 推荐(0)
 
多层感知器
摘要: 写在最前面 本系列文章试图以直观的思维讲解神经网络的两个种类——多层感知器(Muti-Layer Percetron)和卷积网络(Convolutional Neural Network)。这两种网络都属于前馈型网络(Feedforward network),其中多层感知器(MLP)是最简单也是最常 阅读全文
posted @ 2018-04-11 20:39 WuLei吴磊 阅读(695) 评论(0) 推荐(0)
 
Solr数据迁移
摘要: 单机Solr部署在linux /opt目录下,运行一段时间后发现该目录分配的空间不足,而Solr的索引数据量较大,必须更改相关core下面的data目录,以改变索引存放的目录。 找到相应的solrconfig.xml文件,将dataDir修改为自定义的目录,如/home/solrDate/kkrec 阅读全文
posted @ 2018-04-11 20:32 WuLei吴磊 阅读(3762) 评论(0) 推荐(0)
 
 

2018年4月10日

How do you explain Machine Learning and Data Mining to non Computer Science people?
摘要: How do you explain Machine Learning and Data Mining to non Computer Science people? How do you explain Machine Learning and Data Mining to non Compute 阅读全文
posted @ 2018-04-10 21:57 WuLei吴磊 阅读(238) 评论(0) 推荐(0)
 
随机森林
摘要: 在机器学习中,随机森林是一个包含多个决策树的分类器, 并且其输出的类别是由个别树输出的类别的众数而定。 随机森林构建 编辑 决策树相当于一个大师,通过自己在数据集中学到的知识对于新的数据进行分类。但是俗话说得好,一个诸葛亮,玩不过三个臭皮匠。随机森林就是希望构建多个臭皮匠,希望最终的分类效果能够超过 阅读全文
posted @ 2018-04-10 20:36 WuLei吴磊 阅读(385) 评论(0) 推荐(0)
 
 

2018年4月3日

决策树
摘要: 以下关于决策树的内容来自网络,都是非常通俗易懂的。 一.GBDT简介 GBDT(Gradient Boosting Decision Tree) 是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论累加起来做最终结果。它在被提出之初就和SVM一起被认为是泛化能力(generalization 阅读全文
posted @ 2018-04-03 15:04 WuLei吴磊 阅读(1193) 评论(0) 推荐(0)
 
 

2018年4月2日

Spark实战记录
摘要: ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~PipelineExample winutils.exe java.lang.NullPointException~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 在运行Spark ML管道 PipelineExample 样例代 阅读全文
posted @ 2018-04-02 20:15 WuLei吴磊 阅读(178) 评论(0) 推荐(0)
 
 

2018年3月26日

Python_summary
摘要: Q: python中出现IndentationError:unindent does not match any outer indentation levelA:复制代码的时候容易出现缩进错误,虽然看起来是缩进了,但是实际上没有。可以用Notepad++下的 视图->显示符号->显示空格和制表符 阅读全文
posted @ 2018-03-26 08:49 WuLei吴磊 阅读(681) 评论(0) 推荐(0)
 
 

2018年3月21日

实时计算DStream下求平均值(reduceByKey or combineByKey)
摘要: 对NC市的卡口数据进行分析,大概所有卡口每15秒接入的有效数据在3000条左右,现在产品经理要求对这些数据进行拥堵分析,通过两个卡口之间的车辆行驶时长来判断道路的拥堵情况。具体算法不展开。其中我需要做的是用Spark Streaming把Kafka的数据接进来,然后根据卡口数据中的车牌和经过时间找到 阅读全文
posted @ 2018-03-21 20:17 WuLei吴磊 阅读(362) 评论(0) 推荐(0)
 
 

2018年3月7日

机器学习算法入门
摘要: 机器学习算法简单入门。 由于团队(大数据团队)技术发展需要,借对交通业务数据进行需求拓展,实现数据挖掘和数据分析技术的掌握,绕不开机器学习算法,可以说,大数据的核心价值在于算法。 如下图,当前机器学习按照任务类型可以分为有监督学习和无监督学习,这两者的区别在于你是否告诉程序一个标签,或者叫答案,一个 阅读全文
posted @ 2018-03-07 20:54 WuLei吴磊 阅读(236) 评论(0) 推荐(0)
 
 
上一页 1 2 3 4 5 6 7 8 ··· 11 下一页

公告


博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3