03 2019 档案
摘要:Homogeneous networks: representative of singular type of nodes and relationships Challenges: multiple types of nodes and links Matapath2vec meta-path
阅读全文
摘要:1、四种常见的无监督式任务? 聚类、可视化、降维、关联规则学习 2、什么是核外学习? 核外算法可以处理计算机主内存无法应对的大量数据。它将数据分割成小批量,然后使用在线学习技术从这些小批量中学习。 3、模型参数与学习算法的超参数之间有什么区别? 模型有一个参数或多个参数,这些参数决定了模型对新的给定
阅读全文
摘要:数据方面 1、训练数据的数量不足 2、训练数据不具代表性 由于最终我们要实现泛化,如果使用不具代表性的训练集训练出来的模型不可能做出准确的预估。因此使用具有代表性的训练集至关重要,不过做起来是很难的。如果样本集太小,将会出现采样噪声(即非代表性数据被选中);而即便是非常大的样本数据,如果采样方式欠妥
阅读全文
摘要:1、除了可以根据监督/无监督的标准对机器学习系统分类,我们还可以从批量学习和在线学习进行分类。 批量学习 在批量学习中,系统无法进行增量学习,也就是说,必须使用所有可用数据进行训练。由于需要大量时间和计算资源,所以通常情况下都是离线完成的。即先训练系统,然后将其投入生产环境。 当数据集更新的时候,就
阅读全文
摘要:今天呢,对机器学习的种类进行介绍~ 从是否在人类监督下训练,可以分为:监督式学习、无监督式学习、半监督式学习和强化学习; 从是否可以动态地进行增量学习,可以分为:在线学习和批量学习; 从是简单地将新的数据点和已知的数据点进行匹配,还是像科学家那样,对训练数据进行模式检测,然后建立一个预测模型,可以分
阅读全文
摘要:开始学习机器学习的基础知识了,下面是我在看书过程中,整理的一些重点。看的书是《机器学习实战》。 系统用来学习的这些示例,我们称之为训练集。每一个训练示例称为训练实例或者是训练样本。 机器学习与数据挖掘的关系: 应用机器学习技术来挖掘海量数据。 机器学习系统的种类: 是否在人类监督下训练(监督式学习、
阅读全文

浙公网安备 33010602011771号