摘要: 2024.3.11 ELMO模型—>解决向量一词多义 elmo解决一词多义问题,与Word2Vec不同的是,可以融合上下文信息 ElMO(专门做词向量,通过预训练) 不只是训练一个Q矩阵,我们还可以把这个词的上下文信息融入到这个Q矩阵中 上图中,左边的LSTM获取E2的上文信息,右边对应获取下文信息 阅读全文
posted @ 2024-03-11 18:15 adam12138 阅读(70) 评论(0) 推荐(0)
摘要: 2024.3.10 Word2Vec+下游任务 word2vec 也是一种神经网络语言模型 >主要目的就是为了得到词向量 这类神经网络模型主要分为两个小类 CBOW 和 Skip-gram CBOW 主要作用:给出一个词的上下文,得到一个词 Skip-gram 主要作用:给出一个词,得到词的上下文 阅读全文
posted @ 2024-03-10 20:56 adam12138 阅读(73) 评论(0) 推荐(0)
摘要: 2024.3.9 神经语言网络模型 >NNLM:主要是预测出下一个词 神经网络+语言模型——》用是神经网络的方法去完成以下两个和人说的话相关的任务 第二个任务:v ”判断“,”一个“,”词“,“的”,” “ 假设词库里有”词性“和”火星“ P(' '|"判断",”一个“,”词“,”的“) ‘词性’ 阅读全文
posted @ 2024-03-09 16:45 adam12138 阅读(43) 评论(0) 推荐(0)
摘要: 2024.3.8 统计语言模型 统计语言模型 1. 语言模型 语言(人说的话)+模型(表示某个东西,完成某个任务) P1(“判断这个词的词性”),P2(“判断这个词的磁性”) **“判断这个词的 " ** 2. 统计语言模型 用统计的方法去解决上述两个问题 “判断这个词的词性”="判断","这个", 阅读全文
posted @ 2024-03-09 13:39 adam12138 阅读(123) 评论(0) 推荐(0)
摘要: 2024.3.7 预训练 1.预训练 有什么用 机器学习:偏数学(《统计学习方法》-李航) 深度学习(人工智能)的项目:大数据支持(主流) 我们首先介绍下卷积神经网络(CNN),CNN 一般用于图片分类任务,并且CNN 由多个层级结构组成,不同层学到的图像特征也不同,越浅的层学到的特征越通用(横竖撇 阅读全文
posted @ 2024-03-09 13:38 adam12138 阅读(112) 评论(0) 推荐(0)
摘要: 2024.3.5 数据类型内置方法 1.数字类型内置 id不变值可变,即在原值的基础上修改,则为可变数据类型; 值变id也变,即重新申请一个空间放入新值,则为不可变数据类型 age = 19 print(f'first:{id(age)}') age = 20 print(f'second:{id( 阅读全文
posted @ 2024-03-06 18:06 adam12138 阅读(33) 评论(0) 推荐(0)
摘要: 2024.3.1 异常种类 常用异常 AttributeError 试图访问一个对象没有的树形,比如foo.x,但是foo没有属性x IOError 输入/输出异常;基本上是无法打开文件 ImportError 无法引入模块或包;基本上是路径问题或名称错误 IndentationError 语法错误 阅读全文
posted @ 2024-03-05 14:26 adam12138 阅读(40) 评论(0) 推荐(0)
摘要: 2024.2.29 今日学习内容 python基础 变量名可以使用下划线的模式 例如 ad_sdcv=3 print(ad_sdcv) python垃圾回收机制 对于上述师大的例子,此处再做延伸。由于那一批学生所在班级新转来了几位同学,需要那一批学生更换更大一点教室,也就是给他们一个新的教室。那么学 阅读全文
posted @ 2024-02-29 20:45 adam12138 阅读(21) 评论(0) 推荐(0)
摘要: 2024.2.28 今日内容 1.什么是编程 2.计算机组成原理 3.计算机操作系统 4.编程语言是什么 1.什么是编程语言 编程语言:人与计算机交流的介质 编程:用编程语言写出一个个文件,这堆文件会达到一个目的 为什么要编程:计算就像是人类的奴隶,编程的目的是想要奴役计算机,把计算机当成人类的奴隶 阅读全文
posted @ 2024-02-29 17:10 adam12138 阅读(42) 评论(0) 推荐(0)