2020 年 3月随笔档案 - justDoIT&

[数据挖掘]特征工程

摘要：本文来自《零基础入门数据挖掘》笔记。特征工程常见的特征工程包括：总结 1、特征工程的主要目的是将数据转换为能更好地表示潜在问题的特征，从而提高机器学习的性能。比如，异常值处理为了去除噪声，填补缺失值可以加入先验知识等。 2、特征构造属于特征工程的一部分，目的是为了增强数据的表达。 3、如果特征阅读全文

posted @ 2020-03-28 00:47 justDoIT& 阅读(607) 评论(0) 推荐(0)

[ML]提升算法——Adaboost、提升树

摘要：本文是《统计学习方法》笔记阅读全文

posted @ 2020-03-25 16:06 justDoIT& 阅读(206) 评论(0) 推荐(0)

[ML]逻辑斯谛回归算法

摘要：本文是《统计学习方法》笔记。逻辑回归的损失函数是交叉熵，使用交叉熵做损失函数是为了让学到的模型分布更贴合训练数据的分布，而为了做到这一点，最好的方法是计算相对熵，为了计算简便，通常我们会计算交叉熵。具体的内容可以查看博客：https://blog.csdn.net/huwenxing0801/a 阅读全文

posted @ 2020-03-25 16:05 justDoIT& 阅读(193) 评论(0) 推荐(0)

[ML]决策树

摘要：阅读全文

posted @ 2020-03-24 21:54 justDoIT& 阅读(156) 评论(0) 推荐(0)

[数据挖掘]数据探索-EDA

摘要：阅读全文

posted @ 2020-03-24 20:29 justDoIT& 阅读(208) 评论(0) 推荐(0)

[ML]xgboost理解

摘要：Bagging与Boosting的异同： 1、共同点：二者都是由多个分类器构成 2、不同点：bagging的每个分类器都是过拟合的，boosting的每个分类器都是弱分类器，是欠拟合的参考资料 [1] https://machinelearningmastery.com/gentle-introd 阅读全文

posted @ 2020-03-23 18:07 justDoIT& 阅读(218) 评论(0) 推荐(0)

好用的编辑器-typora

摘要：推荐一个好用的编辑器-typora，代码、数学公式、流程图等等都可以很方便的进行编辑。 https://blog.csdn.net/liumingzhuo/article/details/102496472 阅读全文

posted @ 2020-03-17 13:54 justDoIT& 阅读(200) 评论(0) 推荐(0)

[设计模式]单件模式

摘要：1、定义：单件模式确保一个类只有一个实例，并提供一个全局访问点。 2、实现方式：经典方式： public class Singleton{ private static Singleton uniqueInstance; private Singleton(){} public static Si 阅读全文

posted @ 2020-03-13 22:52 justDoIT& 阅读(138) 评论(0) 推荐(0)

[设计模式]工厂模式——抽象工厂

摘要：简介根据《head first 设计模式》所述，工厂模式共有三种：静态工厂方法、工厂方法、抽象工厂。本文介绍抽象工厂。 1、定义：提供一个接口，用于创建相关或依赖对象的家族，而不需要指定具体类。 2、满足的OO原则——依赖倒置原则：要依赖抽象，不要依赖具体类。 3、模式结构：工厂类（抽象工厂和具体阅读全文

posted @ 2020-03-13 20:40 justDoIT& 阅读(261) 评论(0) 推荐(0)

[设计模式]工厂模式(2)——工厂方法

摘要：简介根据《head first 设计模式》所述，工厂模式共有三种：静态工厂方法、工厂方法、抽象工厂。本文介绍工厂方法。 1、工厂方法模式定义：工厂方法模式定义了一个创建对象的接口，但由子类来决定要实例化的类是哪一个。工厂方法让类把实例化进程推迟到子类。注：工厂方法(抽象)用来处理对象的创建，并将阅读全文

posted @ 2020-03-13 18:27 justDoIT& 阅读(249) 评论(0) 推荐(0)

[设计模式]工厂模式——静态工厂方法(实际不是一种设计模式)

摘要：简介根据《head first 设计模式》所述，工厂模式共有三种：简单/静态工厂、工厂方法和抽象工厂。注：其实静态工厂不是一个设计模式，它更像是一种编程习惯。但是这里是根据[1]所做的笔记，为了方便管理区分，假称它是工厂模式的一种。本文介绍静态工厂方法。 1、定义：利用静态方法定义一个简单的工阅读全文

posted @ 2020-03-13 15:50 justDoIT& 阅读(2637) 评论(1) 推荐(0)

[设计模式]装饰者模式(decorator)

摘要：1、定义：装饰者模式动态地将责任附加到对象上。若要扩展功能，装饰者提供了比继承更有弹性的替代方案。 2、满足OO设计原则——开放-关闭原则：类应该对扩展开放，对修改关闭。注：装饰者模式是一个简单的能够实现开放-关闭原则的设计模式 3、优点：能够遵循开放-关闭原则，使系统更有弹性组合和委托可以用阅读全文

posted @ 2020-03-12 16:22 justDoIT& 阅读(163) 评论(0) 推荐(0)

[NLP]ELMO理解

摘要：论文地址：https://arxiv.org/pdf/1802.05365.pdf 简介以往的词向量如word2vec、glove等词向量模型，针对某一个词生成的词向量都是固定的，无法解决一词多义现象，如“苹果”在不同的上下文中有不同的含义，它可表示一种水果、一个公司名称或者手机、电脑、平板电脑等阅读全文

posted @ 2020-03-11 16:38 justDoIT& 阅读(1841) 评论(1) 推荐(1)

[NLP]LSTM理解

摘要：简介 LSTM(Long short-term memory,长短期记忆)是一种特殊的RNN，主要是为了解决长序列训练过程中的梯度消失问题。以下先从RNN介绍。简说RNN RNN(Recurrent Neural Network,循环神经网络)是一种处理序列数据的神经网络。下图是它的结构：从上图阅读全文

posted @ 2020-03-11 16:33 justDoIT& 阅读(7333) 评论(0) 推荐(0)

[设计模式]观察者模式

摘要：一、观察者模式的定义与特点 1、定义：定义了对象之间的一对多依赖，这样一来，当一个对象改变状态时，它的所有依赖者都会受到通知并自动更新注：简单地说，主题 + 观察者 = 观察者模式或者出版者 + 订阅者 = 观察者模式 2、优点：松耦合设计，降低了对象之间的依赖；目标与观察者之间建立了一套阅读全文

posted @ 2020-03-09 12:18 justDoIT& 阅读(308) 评论(0) 推荐(0)

[设计模式]策略模式

摘要：一、策略模式的定义与特点 1、定义：定义了算法族，分别封装起来，让他们之间可以互相替换，此模式让算法的变化独立于使用算法的用户。 2、优点：类的行为被封装进一组类中，可以被轻易地扩充与改变，如果需要，甚至可以在运行时改变行为多重条件语句不易维护，使用策略模式可以避免使用多重条件语句。提供相同行阅读全文

posted @ 2020-03-09 01:57 justDoIT& 阅读(259) 评论(0) 推荐(0)

[NLP]BERT论文理解

摘要：论文地址：https://arxiv.org/pdf/1810.04805.pdf 简介 bert是google2018年提出的一种两阶段语言模型，全称Bidirectional Encoder Representations from Transformers，它本质上是基于Denoising A 阅读全文

posted @ 2020-03-07 17:17 justDoIT& 阅读(1182) 评论(0) 推荐(0)

[NLP]XLNet论文理解

摘要：论文地址：https://arxiv.org/pdf/1906.08237.pdf 简介 XLNet是一个类似BERT的模型，但是它采用了通用的自回归预训练方法(AR模型)，而基于DAE的Bert模型采用的则是降噪自动编码方法(AE模型)，bert和AR模型的区别主要是在以下三方面： 1、独立假设：阅读全文

posted @ 2020-03-06 17:10 justDoIT& 阅读(944) 评论(0) 推荐(0)

[NLP]AR模型与AE模型

摘要：AR语言模型(AutoRegressive LM)：只能获取单向信息，即只能前向读取信息并预测t位置的单词或者从后向读取信息并预测t位置的单词，却不能同时获取双向信息，代表例子是GPT，GPT2，XLNet，ELMO AR LM的优点：比较擅长生成类任务缺点：只能获取单向信息，不能获取双向信息。阅读全文

posted @ 2020-03-01 22:59 justDoIT& 阅读(1819) 评论(1) 推荐(0)

JustDoIT

03 2020 档案

公告