会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
MarisaMagic
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
···
15
下一页
2024年1月17日
[NLP复习笔记] Seq2Seq 模型、Attention机制
摘要: 1. Seq2Seq 模型 1.1 Seq2Seq 简介 \(\text{Seq2Seq}\)(\(\text{Sequence to Sequence}\))通常由两部分构成:编码器(\(\text{Encoder}\)) 和 解码器(\(\text{Decoder}\))。 \(\text{En
阅读全文
posted @ 2024-01-17 02:39 MarisaMagic
阅读(392)
评论(0)
推荐(0)
2024年1月11日
[NLP复习笔记] Transformer
摘要: 1. Transformer 概述 1.1 整体结构 \(\text{Transformer}\) 主要由 \(\text{Encoder}\) 和 \(\text{Decoder}\) 两个部分组成。\(\text{Encoder}\) 部分有 \(N = 6\) 个相同的层,每层包含 一个 \(
阅读全文
posted @ 2024-01-11 16:08 MarisaMagic
阅读(276)
评论(0)
推荐(0)
2024年1月7日
[NLP复习笔记] 神经网络及BP算法
摘要: 1. 神经网络 1.1 神经元 神经元(Neuron)或节点(Node) 是神经网络的基本单元。下图是一个简单的神经元示意图,\(x\) 表示 输入(\(\text{Input}\)), \(x_i\) 表示来自于前面第 \(i\) 个 神经元(\(\text{Neuron}\))的输入,通常会增加
阅读全文
posted @ 2024-01-07 17:42 MarisaMagic
阅读(353)
评论(0)
推荐(0)
[NLP复习笔记] RNN、LSTM
摘要: 1. RNN 1.1 RNN 简介 循环神经网络(\(\text{Recurrent Neural Network}\),简称 \(\text{RNN}\))是一种用于处理序列数据的神经网络。其核心思想是使用循环结构来保持一个内部状态,这个状态理论上可以捕获到目前为止的全部信息流。\(\text{R
阅读全文
posted @ 2024-01-07 03:14 MarisaMagic
阅读(234)
评论(0)
推荐(0)
2024年1月6日
[NLP复习笔记] Word2Vec: 基于负采样的 Skip-gram 及其 SGD 训练
摘要: 1. one-hot 向量 我们先了解一下 \(\text{one-hot}\) 向量。\(\text{one-hot}\) 编码是表示分类变量的常见方法,尤其在数据预处理和机器学习的特征工程中。一个 \(\text{one-hot}\) 向量是一个其中只有一个元素是 1,其余为 0 的向量。 假设
阅读全文
posted @ 2024-01-06 23:44 MarisaMagic
阅读(1323)
评论(0)
推荐(1)
[NLP复习笔记] 单词向量表示、余弦相似度以及TF-IDF
摘要: 1. 单词与向量 1.1 Term-document 矩阵 Term-document 矩阵是信息检索和文本挖掘中常用的一种表示方法,这种矩阵是一个二维表格,用来表示词(term)在文档(document)集合中的分布情况。在这个矩阵中,行通常代表词汇(terms),列代表文档。矩阵中的每一个元素,
阅读全文
posted @ 2024-01-06 17:39 MarisaMagic
阅读(436)
评论(0)
推荐(0)
2024年1月5日
[NLP复习笔记] 朴素贝叶斯分类器
摘要: 1. 贝叶斯决策论 假设有 \(N\) 中类别标记 \(\gamma = \{c_1, c_2, \dots, c_N\}\),\(\lambda_{ij}\) 是将一个真实标记为 \(c_{j}\) 分类为 \(c_i\) 所产生的损失。基于后验概率 \(P(c | \mathbf{x})\) 可
阅读全文
posted @ 2024-01-05 21:16 MarisaMagic
阅读(263)
评论(0)
推荐(0)
[NLP复习笔记] N-gram 及基本平滑方法
摘要: 1. N-gram 模型 1.1 N-gram 模型介绍 \(\text{N-gram}\) 是一种基于统计语言模型的算法,用于预测文本中的单词,其中 \(\text{N}\) 一般指的是序列中的单词数量。其基本思想是将文本内容进行大小为 \(\text{N}\) 的滑动窗口操作来计算概率。 例如:
阅读全文
posted @ 2024-01-05 16:05 MarisaMagic
阅读(2203)
评论(0)
推荐(2)
2023年12月16日
[最优化方法笔记] 非线性规划 拉格朗日乘子法
摘要: 1. 拉格朗日乘子法 拉格朗日乘子法 是一种 将约束优化问题 转化 为 无约束优化问题 的方法。其核心思想就是通过 拉格朗日乘子 将 含有 \(n\) 个变量和 \(m\) 个约束条件的带约束优化问题转换为含有 \(n + m\) 个变量的无约束优化问题。 对于如下约束优化问题: \[\begin{
阅读全文
posted @ 2023-12-16 17:21 MarisaMagic
阅读(1261)
评论(0)
推荐(1)
[最优化方法笔记] 共轭梯度法
摘要: 1. 共轭方向 设 \(A \in \mathbb{R}^{n \times n}\) 为 对称阵,\(p, q \in \mathbb{R}^{n \times 1}\) 为 n元列向量。如果: \[p^T A q = 0 \]则称 \(p\) 和 \(q\) 关于 \(A\) 共轭。 特别地,若
阅读全文
posted @ 2023-12-16 03:32 MarisaMagic
阅读(2653)
评论(2)
推荐(3)
上一页
1
2
3
4
5
6
···
15
下一页
公告