上一页 1 2 3 4 5 6 ··· 46 下一页
摘要: PAL(Program-Aided Language models) 思想成为大模型 Agent 领域的重要范式。核心思路是 LLM 只负责语言任务,复杂的逻辑/计算交由程序执行。 通过合理设计 prompt,模型生成代码/SQL/逻辑描述,外部程序再执行,得到结果后反馈给 LLM,LLM 再生成最 阅读全文
posted @ 2025-06-19 13:10 chester·chen 阅读(724) 评论(0) 推荐(1)
摘要: 随着大模型(LLM)能力越来越强,RAG(Retrieval Augmented Generation,检索增强生成)技术成为增强大模型知识准确性的关键手段。 通过检索实时数据、外部文档,模型能回答更多基于事实的问题,降低“幻觉”概率。 而 LangChain 的 LangGraph 能将 LLM、 阅读全文
posted @ 2025-06-17 15:03 chester·chen 阅读(1130) 评论(0) 推荐(0)
摘要: 检索增强生成(RAG)是一种结合“向量检索”与“大语言模型”的技术路线,能在问答、摘要、文档分析等场景中大幅提升准确性与上下文利用率。 本文将基于 LangChain 构建一个完整的 RAG 流程,结合 PGVector 作为向量数据库,并用 LangGraph 构建状态图控制流程。 大语言模型初始 阅读全文
posted @ 2025-06-15 08:28 chester·chen 阅读(894) 评论(0) 推荐(2)
摘要: 1.VGG16背景介绍 VGG16是由牛津大学Visual Geometry Group(VGG)在2014年提出的深度卷积神经网络模型,它在当年的ImageNet图像分类竞赛中取得了优异成绩。 VGG16的主要贡献在于展示了网络深度(层数)对模型性能的重要性,通过使用多个小尺寸(3×3)卷积核堆叠 阅读全文
posted @ 2025-06-14 09:58 chester·chen 阅读(2202) 评论(0) 推荐(0)
摘要: 基于 LangChain 和 GPT-4o-mini 的大模型智能体开发实战 近年来,大模型能力的持续突破,使得构建智能代理(Agent)系统成为开发者追逐的热点。 本文将以 LangChain 框架为核心,结合 GPT-4o-mini 模型,通过接入工具与消息修剪策略,实现一个具备记忆、调用搜索、 阅读全文
posted @ 2025-06-13 12:08 chester·chen 阅读(1197) 评论(1) 推荐(0)
摘要: 在大模型应用开发中,状态管理 和 对话追踪 是不可忽视的重要能力,尤其在需要保存上下文、重放对话或进行异步处理时尤为关键。 今天我们来演示如何用 LangChain + OpenAI 的 GPT 模型 + PostgreSQL 搭建一个 具备消息存储能力 的聊天机器人。 技术栈 LangChain( 阅读全文
posted @ 2025-06-12 10:54 chester·chen 阅读(1124) 评论(0) 推荐(1)
摘要: AlexNet背景 AlexNet是2012年由Alex Krizhevsky、Ilya Sutskever和Geoffrey Hinton提出的深度卷积神经网络架构。 它在ImageNet大规模视觉识别挑战赛(ILSVRC)中取得了突破性成绩,将top-5错误率从26%降低到了15.3%,这一成就 阅读全文
posted @ 2025-06-11 08:56 chester·chen 阅读(1050) 评论(0) 推荐(0)
摘要: 介绍 Hugging Face的Transformers库提供了大量预训练模型,但有时我们需要修改这些模型的默认参数来适应特定任务。 本文将详细介绍如何修改BERT模型的最大序列长度(max_position_embeddings)参数,并解释相关原理和实现细节。 原理 BERT等Transform 阅读全文
posted @ 2025-06-10 10:16 chester·chen 阅读(792) 评论(0) 推荐(0)
摘要: 在自然语言处理(NLP)领域,预训练语言模型如BERT已经成为主流。HuggingFace提供的Transformers库让我们能够方便地使用这些强大的模型。 本文将详细介绍如何使用PyTorch微调HuggingFace上的BERT模型,包括原理讲解、代码实现和逐行解释。 1. 微调原理 1.1 阅读全文
posted @ 2025-06-06 19:19 chester·chen 阅读(858) 评论(0) 推荐(0)
摘要: 1.LetNet5简介 LeNet5是由Yann LeCun等人在1998年提出的一种卷积神经网络架构,主要用于手写数字识别。它是早期卷积神经网络的成功应用之一,为现代深度学习模型奠定了基础。LeNet5的名字来源于其发明者LeCun和网络层数(5层)。 LeNet5的主要特点包括: 使用卷积层提取 阅读全文
posted @ 2025-06-05 14:51 chester·chen 阅读(816) 评论(0) 推荐(3)
上一页 1 2 3 4 5 6 ··· 46 下一页