随笔分类 - AI 人工智能
AI 人工智能
摘要:
DeepSeek-V3 是大语言模型(LLM)领域的一项变革性进展,为开源人工智能设定了新的标杆。作为一个拥有 6710 亿参数的专家混合(Mixture-of-Experts,MoE)模型,其中每个 token 激活 370 亿参数。它引入了多头潜在注意力(Multi-Head Latent Attention,MLA)、无需辅助损失的负载均衡以及多 token 预测等创新技术,DeepSeek-V3 在编程、数学和推理任务中展现出了前所未有的能力。本文将深入探讨其架构、训练策略、创新点以及实际应用场景。
阅读全文
DeepSeek-V3 是大语言模型(LLM)领域的一项变革性进展,为开源人工智能设定了新的标杆。作为一个拥有 6710 亿参数的专家混合(Mixture-of-Experts,MoE)模型,其中每个 token 激活 370 亿参数。它引入了多头潜在注意力(Multi-Head Latent Attention,MLA)、无需辅助损失的负载均衡以及多 token 预测等创新技术,DeepSeek-V3 在编程、数学和推理任务中展现出了前所未有的能力。本文将深入探讨其架构、训练策略、创新点以及实际应用场景。
阅读全文
摘要:
一步一步基于LangChain构建智能问答系统(Construct intelligent question answering system based on LangChain)
阅读全文
一步一步基于LangChain构建智能问答系统(Construct intelligent question answering system based on LangChain)
阅读全文
摘要:
Milvus向量数据库入门专栏 - 详细介绍Milvus向量数据库的一些基础操作和入门开发实践,包括向量数据库的入门介绍、安装启动、PyMilvus库、Attu图形化管理工具、Zilliz Cloud云环境、开发入门实践等等。
阅读全文
Milvus向量数据库入门专栏 - 详细介绍Milvus向量数据库的一些基础操作和入门开发实践,包括向量数据库的入门介绍、安装启动、PyMilvus库、Attu图形化管理工具、Zilliz Cloud云环境、开发入门实践等等。
阅读全文
摘要:
LangChain轻松入门和开发实践-专栏探讨了LangChain的功能特性,其中包括重要组件:模型(Models)、提示(Prompts)、索引(Indexes)、存储(Memory)、链(Chains)和代理(Agents)。文章中有详细的介绍以及对应的示例代码。
阅读全文
LangChain轻松入门和开发实践-专栏探讨了LangChain的功能特性,其中包括重要组件:模型(Models)、提示(Prompts)、索引(Indexes)、存储(Memory)、链(Chains)和代理(Agents)。文章中有详细的介绍以及对应的示例代码。
阅读全文
摘要:
Hugging Face 是一个在自然语言处理(NLP)领域非常受欢迎的公司和社区。它为开发者提供了一系列工具,使得部署和使用最新的NLP技术变得更加简单。
阅读全文
Hugging Face 是一个在自然语言处理(NLP)领域非常受欢迎的公司和社区。它为开发者提供了一系列工具,使得部署和使用最新的NLP技术变得更加简单。
阅读全文
摘要:
在人工智能时代,机器学习技术日新月异,深度学习是机器学习领域中一个全新的研究方向和应用热点,它是机器学习的一种,也是实现人工智能的必由之路。深度学习的出现不仅推动了机器学习的发展,还促进了人工智能技术的革新。
阅读全文
在人工智能时代,机器学习技术日新月异,深度学习是机器学习领域中一个全新的研究方向和应用热点,它是机器学习的一种,也是实现人工智能的必由之路。深度学习的出现不仅推动了机器学习的发展,还促进了人工智能技术的革新。
阅读全文

浙公网安备 33010602011771号