摘要:
这篇文章中,我简要实现一下大语言模型的 MOE 模块。MOE 模块位于每个GPT层中,位于注意力模块的后面,每个MOE模块包含若干个MLP模块作为专家。这些专家是稀疏的,也就是每次选择部分来调用,并不会调用全部,从而节省宝贵的算力。 首先定义一些常量,通常应该在模型配置文件里面。 bs = 5 # 阅读全文
posted @ 2024-06-21 15:52
绝不原创的飞龙
阅读(158)
评论(0)
推荐(0)
摘要:
JAX 中文文档(一) 原文:jax.readthedocs.io/en/latest/ 开始入门 安装 JAX 原文:jax.readthedocs.io/en/latest/installation.html 使用 JAX 需要安装两个包:jax 是纯 Python 的跨平台库,jaxlib 包 阅读全文
posted @ 2024-06-21 14:07
绝不原创的飞龙
阅读(920)
评论(0)
推荐(0)
摘要:
JAX 中文文档(五) 原文:jax.readthedocs.io/en/latest/ 形状多态性 原文:jax.readthedocs.io/en/latest/export/shape_poly.html 当使用 JIT 模式的 JAX 时,函数将被跟踪、降级到 StableHLO,并针对每种 阅读全文
posted @ 2024-06-21 14:07
绝不原创的飞龙
阅读(272)
评论(0)
推荐(0)
摘要:
JAX 中文文档(四) 原文:jax.readthedocs.io/en/latest/ 理解 Jaxpr 原文:jax.readthedocs.io/en/latest/jaxpr.html 更新日期:2020 年 5 月 3 日(提交标识为 f1a46fe)。 从概念上讲,可以将 JAX 转换看 阅读全文
posted @ 2024-06-21 14:07
绝不原创的飞龙
阅读(273)
评论(0)
推荐(0)
摘要:
JAX 中文文档(十一) 原文:jax.readthedocs.io/en/latest/ JAX 增强提案(JEPs) 原文:jax.readthedocs.io/en/latest/jep/index.html 大多数改动可以通过简单的问题/讨论和拉取请求进行讨论。 然而,有些变更范围较大或需要 阅读全文
posted @ 2024-06-21 14:07
绝不原创的飞龙
阅读(117)
评论(0)
推荐(0)
摘要:
JAX 中文文档(十五) 原文:jax.readthedocs.io/en/latest/ jax.tree 模块 原文:jax.readthedocs.io/en/latest/jax.tree.html 用于处理树形容器数据结构的实用工具。 jax.tree 命名空间包含了来自 jax.tree 阅读全文
posted @ 2024-06-21 14:07
绝不原创的飞龙
阅读(141)
评论(0)
推荐(0)
摘要:
JAX 中文文档(十四) 原文:jax.readthedocs.io/en/latest/ jax.scipy 模块 原文:jax.readthedocs.io/en/latest/jax.scipy.html jax.scipy.cluster | vq(obs, code_book[, chec 阅读全文
posted @ 2024-06-21 14:07
绝不原创的飞龙
阅读(115)
评论(0)
推荐(0)
摘要:
JAX 中文文档(十三) 原文:jax.readthedocs.io/en/latest/ 在 JAX 之上构建 原文:jax.readthedocs.io/en/latest/building_on_jax.html 学习高级 JAX 使用的一种很好的方法是看看其他库如何使用 JAX,它们如何将库 阅读全文
posted @ 2024-06-21 14:07
绝不原创的飞龙
阅读(337)
评论(0)
推荐(0)
摘要:
JAX 中文文档(十七) 原文:jax.readthedocs.io/en/latest/ JAX 术语表 原文:jax.readthedocs.io/en/latest/glossary.html 数组 JAX 的 numpy.ndarray 的类比。见 jax.Array。 CPU 缩写Cent 阅读全文
posted @ 2024-06-21 14:07
绝不原创的飞龙
阅读(80)
评论(0)
推荐(0)
摘要:
JAX 中文文档(十六) 原文:jax.readthedocs.io/en/latest/ jax.experimental.sparse.bcoo_multiply_dense 原文:jax.readthedocs.io/en/latest/_autosummary/jax.experimenta 阅读全文
posted @ 2024-06-21 14:07
绝不原创的飞龙
阅读(327)
评论(0)
推荐(0)

浙公网安备 33010602011771号