Loading

摘要: 基本概念 通常我们自定义的类类型,不具有内置类型的一些操作,比如 int 类型的算术运算,指针类型的解引用、取地址操作,容器类型的下标操作等。因此,如果希望我们自定义的类类型具有一些运算符操作,就需要定义重载运算符函数,实现对应的功能。 重载运算符是具有特殊名字的函数:它们的名字由关键字 opera 阅读全文
posted @ 2022-12-24 21:21 hiyoung 阅读(47) 评论(0) 推荐(0) 编辑
摘要: 什么是构造函数 构造函数(constructor)是类的一种特殊的成员函数,它被用于控制类的初始化过程、初始化对象的数据成员。无论何时只要类的对象被创建,都会执行构造函数,不同的初始化方法会调用不同的构造函数。 构造函数的特点 构造函数的名字和类名相同。 构造函数没有返回类型。 构造函数有一个(可能 阅读全文
posted @ 2022-12-23 18:47 hiyoung 阅读(30) 评论(0) 推荐(0) 编辑
摘要: 前言 学习决策树时会接触到一些信息熵,条件熵和信息增益的知识,此外还有互信息,相对熵,交叉熵和互信息,KL散度等等乱七八糟的知识和名字,我本人已经记得大脑混乱了,还没有全部记住,所以在这里记录一下. 1.信息熵:信息的度量,信息的不确定程度,是乱七八糟熵的基础.吴军大大的数学之美中用了猜球队冠军的方 阅读全文
posted @ 2018-12-18 19:22 hiyoung 阅读(3740) 评论(0) 推荐(0) 编辑
摘要: 简介: BERT,全称Bidirectional Encoder Representations from Transformers,是一个预训练的语言模型,可以通过它得到文本表示,然后用于下游任务,比如文本分类,问答系统,情感分析等任务.BERT像是word2vec的加强版,同样是预训练得到词级别 阅读全文
posted @ 2018-12-17 17:07 hiyoung 阅读(2907) 评论(0) 推荐(0) 编辑
摘要: 最近在研究问答系统,但是在查找资料的过程中一直处于懵逼状态,因为问答系统分类比较多,根据不同的依据可以分为不同种类,总是搞混,也没有找到资料详细全面的介绍,所以在一边学习查找资料的同时,自己也整理出一份总结,用于以后学习过程不至于思路混乱,如有错误请帮忙指出. 19世纪60年代最早:基于模板和规则 阅读全文
posted @ 2018-11-22 12:58 hiyoung 阅读(1251) 评论(0) 推荐(0) 编辑
摘要: 前言 检索回答系统一般过程:1)构建好候选回答索引集,2)收到quary后,初步选出一些候选回答,3)quary和回答做matching,然后reranking,4)最后返回topk个回答. 排序reranking根据不同任务类型有不同方法. matching操作有如下模型使用: 1. DSSM(  阅读全文
posted @ 2018-11-09 16:33 hiyoung 阅读(871) 评论(0) 推荐(0) 编辑
摘要: 简介 TextCNN模型是由 Yoon Kim提出的Convolutional Naural Networks for Sentence Classification一文中提出的使用卷积神经网络来处理NLP问题的模型.相比较nlp中传统的rnn/lstm等模型,cnn能更加高效的提取重要特征,这些特 阅读全文
posted @ 2018-11-09 09:20 hiyoung 阅读(2289) 评论(0) 推荐(0) 编辑
摘要: 简介 Logistic回归是机器学习中最常用最经典的分类方法之一,有的人称为逻辑回归或逻辑斯蒂回归。虽然它称为回归模型,但是却处理的是分类问题,这主要是因为它的本质是一个线性模型加上一个映射函数sigmoid,将线性模型得到的连续结果映射到离散型上。它常用于二分类问题,在多分类问题的推广叫做soft 阅读全文
posted @ 2018-10-28 18:39 hiyoung 阅读(2186) 评论(0) 推荐(0) 编辑
摘要: 什么是Attention机制 Attention机制通俗的讲就是把注意力集中放在重要的点上,而忽略其他不重要的因素。其中重要程度的判断取决于应用场景,拿个现实生活中的例子,比如1000个人眼中有1000个哈姆雷特。根据应用场景的不同,Attention分为空间注意力和时间注意力,前者用于图像处理,后 阅读全文
posted @ 2018-10-27 11:18 hiyoung 阅读(38939) 评论(3) 推荐(0) 编辑
摘要: 简介 前面介绍的线性回归,SVM等模型都是基于数据有标签的监督学习方法,本文介绍的聚类方法是属于无标签的无监督学习方法。其他常见的无监督学习还有密度估计,异常检测等。 聚类就是对大量未知标注的数据集,按照数据的内在相似性将数据集划分为多个类别(在聚类算法中称为簇),使类别内的数据相似度高,二类别间的 阅读全文
posted @ 2018-10-20 14:29 hiyoung 阅读(4416) 评论(0) 推荐(0) 编辑