LestatZ

2019年2月24日

摘要：文章目录概述L1和L2的区别? 为什么L2能提升泛化能力（减少预测误差，防止过拟合？）L1正则化有哪些好处L1正则为什么可以把系数压缩成0，坐标下降法的具体实现细节为什么要做数据归一化？归一化方式交叉熵cross entropy损失函数？0-1分类的交叉熵... 阅读全文

posted @ 2019-02-24 10:43 LestatZ 阅读(718) 评论(0) 推荐(0)

机器学习面试问题整理(4) — Emsenble learning集成学习

摘要：文章目录概述集成学习树集成模型有哪几种形式？Boosting和bagging的区别Bagging为什么能减小方差概述基本推导和理论还是以看李航老师的《统计学习方法》为主。各种算法的原理，推荐理解到可以手撕的程度。以下为通过网络资源搜集整理的一些问题及答案，准... 阅读全文

posted @ 2019-02-24 09:28 LestatZ 阅读(613) 评论(0) 推荐(0)

机器学习面试问题整理(3) — Tree树形模型

摘要：文章目录概述决策树笔记随机森林优缺点GBDT的原理，如何做分类和回归GBDT分类树拟合的是什么GBDT+ LR 是怎么做的CART分类回归树和ID3以及C4.5有什么区别决策树的优点和缺点RF, GBDT, XGBOOST, XGB的区别改变随机森林的训练... 阅读全文

posted @ 2019-02-24 09:23 LestatZ 阅读(1151) 评论(0) 推荐(0)

机器学习面试问题整理(2) — SVM支持向量机

摘要：文章目录概述SVM原理及推导SVM与随机森林比较SVM为什么要引入拉格朗日的优化方法。SVM原问题和对偶问题关系？SVM在哪个地方引入的核函数, 如果用高斯核可以升到多少维?SVM怎么防止过拟合 ?SVM的目标函数。常用的核函数。SVM硬软间隔对偶的推导概述... 阅读全文

posted @ 2019-02-24 09:09 LestatZ 阅读(1767) 评论(0) 推荐(0)

机器学习面试问题整理(1) — LR逻辑斯蒂回归

摘要：文章目录概述logistics公式及推导LR为什么用sigmoid函数，为什么不用其他函数？这个函数有什么优点和缺点？逻辑斯蒂回归怎么实现多分类？Softmax公式逻辑回归估计参数时的目标函数，如果加上一个先验的服从高斯分布的假设，会是什么样?LR和SVM... 阅读全文

posted @ 2019-02-24 08:57 LestatZ 阅读(1316) 评论(0) 推荐(0)

2019年2月23日

Pandas加载含有嵌套(nested)文档的mongodb数据

摘要：文章目录读取MongoDB数据到Pandas中不含嵌套数据含有嵌套数据读取MongoDB数据到Pandas中我们可以通过pymongo包连接mongodb进行数据处理，然后将数据存储到pandas的dataframe里面。例子中的student表的数据结构如... 阅读全文

posted @ 2019-02-23 20:42 LestatZ 阅读(634) 评论(0) 推荐(0)

[Spark笔记]Spark Streaming连接Kafka的入门代码

摘要：用scala写的一段Spark Streaming连接Kafka的入门代码阅读全文

posted @ 2019-02-23 17:18 LestatZ 阅读(539) 评论(0) 推荐(0)

[Spark笔记]Apache Spark — Overview

摘要：文章目录 Spark简介为什么用Spark 文章目录 Spark简介为什么用Spark Spark简介为什么用Spark Spark简介为什么用Spark Spark简介为什么用Spark Spark简介 Apache Spark是一个开源的分布式通用计算框架，具有(大部分)内存数据处理引阅读全文

posted @ 2019-02-23 17:12 LestatZ 阅读(164) 评论(0) 推荐(0)

[Hive笔记]Hive常用命令整理

摘要：文章目录 Commonly used Hive Commands DDL Commands DML Commands 文章目录 Commonly used Hive Commands DDL Commands DML Commands Commonly used Hive Commands DDL 阅读全文

posted @ 2019-02-23 17:05 LestatZ 阅读(164) 评论(0) 推荐(0)

Mac上安装MongoDB后没有默认用户或密码，需要创建用户

摘要：默认情况下，MongoDB没有启用访问控制，因此没有默认用户或密码。要启用访问控制，请使用命令行选项·--auth或security.authorization配置文件设置。具体细节请查看官方文档的启用验证章节以下使我在Mac上测试的具体步骤：打开终端，启动... 阅读全文

posted @ 2019-02-23 16:23 LestatZ 阅读(868) 评论(0) 推荐(0)

公告