Graph:如社交网与分子图)

SciTech-BigDataAIML-LLM-Transformer Series

Sampling(采样)

Text文本: Word Embedding就可以转化Word Seq.为Matrix(Vector Seq.)
将每一word 变换为一 Vector，
就可以将整段Text(Word Seq.)变化为一 Matrix(Vector Seq.).
Audio语音, Picture图片, Video视频,
这三类都可采用 "Stepping Slip Window" 或"CNN"方式,
并Sampling a frame( OR Window) 来将each frame(OR window)转化成一 Vector,
最终将数据转化成一 Matrix(Vector Seq.).
如下图: 对audio音频进行Vectorize与Matrixize,
将 Slip Window设为25ms时长, Step为10ms; 对frame进行Sampling 得到其 Vector.
将完整的audio音频转换为一 Matrix. 如一段 1s音频转换为长100的Matrix(Vector Seq.).
Graph图结构(如社交网图与分子结构图)、Object二进制对象(如可执行文件).
可将 a Node 用 a Vector 表示, 于是整个 "Graph" "转化为一个 "Matrix(Vector Seq.)"
比如:
- Social Network Graph 将 a Node 的 Profile(账户信息) 表示为一 "Vector";
- Molecular Structure Graph:
  将 an Atom 表示为一个One-Hot vector(也可 Embedding with Context),
  进一步可将 Molecule Structure 表示为一 Matrix(Vector Seq.).

\(\large N:N\) 输入 N长的 Vector Seq., 输出 N长的 label Seq., 每个vector对应一个label.
\(\large N:1\) 输入 N长的 Vector Seq., 输出 unique label
\(\large N:M\) 输入 N长的 Vector Seq., 输出 M长(模型决定长度)的 Vector Seq.
著名的 \(\large Seq2Seq\) \(\large Output\)模型. 经典应用是: Translation(机器翻译任务).

posted @ 2024-08-16 14:26 abaelhe 阅读(37) 评论(0) 收藏举报

刷新页面返回顶部