果冻人工智能

2024年12月2日

摘要：序言：重新训练人工智能大型模型是一项复杂且高成本的任务，尤其对于当前的LLM（大型语言模型）来说，全球99.99%的企业难以承担。这是因为模型训练需要巨大的资源投入、复杂的技术流程以及大量的人力支持。因此，无论在科学研究还是实际应用中，人们通常依赖开源的预训练模型及其已经学习到的各种特征信息，就像使阅读全文

posted @ 2024-12-02 09:51 果冻人工智能阅读(206) 评论(0) 推荐(0)

2024年12月1日

人工智能：在传统行业中的挑战、机遇与数据科学家角色的演变

摘要：生成式人工智能（GenAI）为我们开启了更快的开发周期、更少的技术和维护工作，以及之前看起来无法实现的创新应用场景的大门。但与此同时，它也带来了新的风险——比如幻觉问题，以及对第三方API的依赖。对于数据科学家和机器学习团队来说，这一变革直接影响了他们的工作方式。一种新的AI项目类型已经出现，其中阅读全文

posted @ 2024-12-01 10:25 果冻人工智能阅读(92) 评论(0) 推荐(0)

2024年11月30日

新型大语言模型的预训练与后训练范式，Meta的Llama 3.1语言模型

摘要：前言：大型语言模型（LLMs）的发展历程可以说是非常长，从早期的GPT模型一路走到了今天这些复杂的、公开权重的大型语言模型。最初，LLM的训练过程只关注预训练，但后来逐步扩展到了包括预训练和后训练在内的完整流程。后训练通常涵盖监督指导微调和对齐过程，而这些在ChatGPT的推广下变得广为人知。自C 阅读全文

posted @ 2024-11-30 09:41 果冻人工智能阅读(651) 评论(0) 推荐(1)

2024年11月29日

新型大语言模型的预训练与后训练范式，谷歌的Gemma 2语言模型

摘要：前言：大型语言模型（LLMs）的发展历程可以说是非常长，从早期的GPT模型一路走到了今天这些复杂的、公开权重的大型语言模型。最初，LLM的训练过程只关注预训练，但后来逐步扩展到了包括预训练和后训练在内的完整流程。后训练通常涵盖监督指导微调和对齐过程，而这些在ChatGPT的推广下变得广为人知。自C 阅读全文

posted @ 2024-11-29 09:20 果冻人工智能阅读(329) 评论(0) 推荐(0)

2024年11月28日

新型大语言模型的预训练与后训练范式，苹果的AFM基础语言模型

摘要：前言：大型语言模型（LLMs）的发展历程可以说是非常长，从早期的GPT模型一路走到了今天这些复杂的、公开权重的大型语言模型。最初，LLM的训练过程只关注预训练，但后来逐步扩展到了包括预训练和后训练在内的完整流程。后训练通常涵盖监督指导微调和对齐过程，而这些在ChatGPT的推广下变得广为人知。自C 阅读全文

posted @ 2024-11-28 09:27 果冻人工智能阅读(175) 评论(0) 推荐(0)

2024年11月27日

新型大语言模型的预训练与后训练范式，阿里Qwen

摘要：前言：大型语言模型（LLMs）的发展历程可以说是非常长，从早期的GPT模型一路走到了今天这些复杂的、公开权重的大型语言模型。最初，LLM的训练过程只关注预训练，但后来逐步扩展到了包括预训练和后训练在内的完整流程。后训练通常涵盖监督指导微调和对齐过程，而这些在ChatGPT的推广下变得广为人知。自C 阅读全文

posted @ 2024-11-27 09:48 果冻人工智能阅读(911) 评论(0) 推荐(0)

2024年11月26日

设计一个基于 LSTM 神经网络的文本分类器

摘要：前一篇：《用于自然语言处理的循环神经网络RNN》序言：本节主要讲解如何使用循环神经网络（RNN）创建一个文本分类器。RNN 是一类适合处理序列数据的神经网络的统称，而我们将在本节中使用 RNN 的一种常见变体——LSTM（长短期记忆网络）来实现这一文本分类器。使用RNN创建文本分类器在第六章中阅读全文

posted @ 2024-11-26 09:20 果冻人工智能阅读(400) 评论(0) 推荐(0)

2024年11月25日

用于自然语言处理的循环神经网络RNN

摘要：前一篇：《人工智能模型学习到的知识是怎样的一种存在？》序言：在人工智能领域，卷积神经网络（CNN）备受瞩目，但神经网络的种类远不止于此。实际上，不同类型的神经网络各有其独特的应用场景。在接下来的几节中，我将带大家走近循环神经网络（RNN），深入了解其原理及其在处理人类自然语言中的改进与应用。需要阅读全文

posted @ 2024-11-25 12:25 果冻人工智能阅读(370) 评论(3) 推荐(0)

2024年11月24日

人工智能模型学习到的知识是怎样的一种存在？

摘要：前一篇：《设计和训练人工智能模型的意义是什么？》序言：在上一篇文章中，我们通过大型互联网社交平台的一个常规需求场景，举例说明了如何使用人工智能模型来解决常规程序无法解决的应用问题。这让我们明白，人类设计和训练人工智能模型并不是为了“无聊”，也不是出于某些阴谋论而刻意突破人工智能技术，而是为了在实际阅读全文

posted @ 2024-11-24 10:21 果冻人工智能阅读(50) 评论(0) 推荐(0)

2024年11月23日

它终于发生了。2024年因人工智能倒闭的第一家美国上市企业！

摘要：一家美国公司在最近的财报发布后，股价从历史高点暴跌了99%，现在正走在倒闭的最后一段路上。这家公司叫 Chegg，是一家美国的教育科技公司，主要提供一系列服务，帮助学生完成学业。疫情期间，它曾是备受关注的明星公司，三年前的市值一度高达 120 亿美元。现在呢？它眼看就要消失了。原因是什么？Che 阅读全文

posted @ 2024-11-23 19:06 果冻人工智能阅读(186) 评论(0) 推荐(0)

公告