上一页 1 ··· 611 612 613 614 615 616 617 618 619 ··· 929 下一页
摘要: 这篇文章中,我简要实现一下大语言模型的 MOE 模块。MOE 模块位于每个GPT层中,位于注意力模块的后面,每个MOE模块包含若干个MLP模块作为专家。这些专家是稀疏的,也就是每次选择部分来调用,并不会调用全部,从而节省宝贵的算力。 首先定义一些常量,通常应该在模型配置文件里面。 bs = 5 # 阅读全文
posted @ 2024-06-21 15:52 绝不原创的飞龙 阅读(158) 评论(0) 推荐(0)
摘要: JAX 中文文档(一) 原文:jax.readthedocs.io/en/latest/ 开始入门 安装 JAX 原文:jax.readthedocs.io/en/latest/installation.html 使用 JAX 需要安装两个包:jax 是纯 Python 的跨平台库,jaxlib 包 阅读全文
posted @ 2024-06-21 14:07 绝不原创的飞龙 阅读(920) 评论(0) 推荐(0)
摘要: JAX 中文文档(五) 原文:jax.readthedocs.io/en/latest/ 形状多态性 原文:jax.readthedocs.io/en/latest/export/shape_poly.html 当使用 JIT 模式的 JAX 时,函数将被跟踪、降级到 StableHLO,并针对每种 阅读全文
posted @ 2024-06-21 14:07 绝不原创的飞龙 阅读(272) 评论(0) 推荐(0)
摘要: JAX 中文文档(四) 原文:jax.readthedocs.io/en/latest/ 理解 Jaxpr 原文:jax.readthedocs.io/en/latest/jaxpr.html 更新日期:2020 年 5 月 3 日(提交标识为 f1a46fe)。 从概念上讲,可以将 JAX 转换看 阅读全文
posted @ 2024-06-21 14:07 绝不原创的飞龙 阅读(273) 评论(0) 推荐(0)
摘要: JAX 中文文档(十一) 原文:jax.readthedocs.io/en/latest/ JAX 增强提案(JEPs) 原文:jax.readthedocs.io/en/latest/jep/index.html 大多数改动可以通过简单的问题/讨论和拉取请求进行讨论。 然而,有些变更范围较大或需要 阅读全文
posted @ 2024-06-21 14:07 绝不原创的飞龙 阅读(117) 评论(0) 推荐(0)
摘要: JAX 中文文档(十五) 原文:jax.readthedocs.io/en/latest/ jax.tree 模块 原文:jax.readthedocs.io/en/latest/jax.tree.html 用于处理树形容器数据结构的实用工具。 jax.tree 命名空间包含了来自 jax.tree 阅读全文
posted @ 2024-06-21 14:07 绝不原创的飞龙 阅读(141) 评论(0) 推荐(0)
摘要: JAX 中文文档(十四) 原文:jax.readthedocs.io/en/latest/ jax.scipy 模块 原文:jax.readthedocs.io/en/latest/jax.scipy.html jax.scipy.cluster | vq(obs, code_book[, chec 阅读全文
posted @ 2024-06-21 14:07 绝不原创的飞龙 阅读(115) 评论(0) 推荐(0)
摘要: JAX 中文文档(十三) 原文:jax.readthedocs.io/en/latest/ 在 JAX 之上构建 原文:jax.readthedocs.io/en/latest/building_on_jax.html 学习高级 JAX 使用的一种很好的方法是看看其他库如何使用 JAX,它们如何将库 阅读全文
posted @ 2024-06-21 14:07 绝不原创的飞龙 阅读(337) 评论(0) 推荐(0)
摘要: JAX 中文文档(十七) 原文:jax.readthedocs.io/en/latest/ JAX 术语表 原文:jax.readthedocs.io/en/latest/glossary.html 数组 JAX 的 numpy.ndarray 的类比。见 jax.Array。 CPU 缩写Cent 阅读全文
posted @ 2024-06-21 14:07 绝不原创的飞龙 阅读(80) 评论(0) 推荐(0)
摘要: JAX 中文文档(十六) 原文:jax.readthedocs.io/en/latest/ jax.experimental.sparse.bcoo_multiply_dense 原文:jax.readthedocs.io/en/latest/_autosummary/jax.experimenta 阅读全文
posted @ 2024-06-21 14:07 绝不原创的飞龙 阅读(327) 评论(0) 推荐(0)
上一页 1 ··· 611 612 613 614 615 616 617 618 619 ··· 929 下一页