pytorch入门 - GoogLeNet神经网络
摘要:GoogLeNet 是 Google 在 2014 年 ILSVRC(ImageNet Large Scale Visual Recognition Challenge)比赛中提出的一种深度卷积神经网络模型,其关键创新在于引入了 Inception 模块,大大提高了网络的参数利用率与计算效率。 本文
阅读全文
posted @
2025-06-26 10:27
chester·chen
阅读(930)
推荐(0)
AI大模型应用开发入门-LangChain实现文档总结
摘要:一、整体思路 长网页文本往往超过 LLM 单次处理的 token 限制,我们需要设计一个 map-reduce 流水线来拆分、局部总结、归并: 加载网页内容 拆分成可控大小的 chunk 对每个 chunk 做初步总结 (map) 汇总所有初步总结 (reduce) 如有需要递归 reduce 直到
阅读全文
posted @
2025-06-24 10:36
chester·chen
阅读(791)
推荐(0)
pytorch入门 - 基于AlexNet神经网络实现猫狗大战
摘要:基于之前的博客 pytorch入门 - AlexNet神经网络,并借助Kaggle 的 Dogs vs Cats Redux 数据集,实现一个基于 AlexNet 的二分类模型识别猫与狗。 完整流程涵盖数据准备、归一化、模型定义、训练增强、验证并可视化结果。 一、数据集准备与预处理 import o
阅读全文
posted @
2025-06-23 09:11
chester·chen
阅读(707)
推荐(0)
AI大模型应用开发-用LangChain构建PAL应用:SQL的生成与执行
摘要:PAL(Program-Aided Language models) 思想成为大模型 Agent 领域的重要范式。核心思路是 LLM 只负责语言任务,复杂的逻辑/计算交由程序执行。 通过合理设计 prompt,模型生成代码/SQL/逻辑描述,外部程序再执行,得到结果后反馈给 LLM,LLM 再生成最
阅读全文
posted @
2025-06-19 13:10
chester·chen
阅读(681)
推荐(1)
AI大模型应用开发-用LangChain构建带Agen流程的RAG系统
摘要:随着大模型(LLM)能力越来越强,RAG(Retrieval Augmented Generation,检索增强生成)技术成为增强大模型知识准确性的关键手段。 通过检索实时数据、外部文档,模型能回答更多基于事实的问题,降低“幻觉”概率。 而 LangChain 的 LangGraph 能将 LLM、
阅读全文
posted @
2025-06-17 15:03
chester·chen
阅读(978)
推荐(0)
AI大模型应用开发入门-LangChain开发RAG增强检索生成
摘要:检索增强生成(RAG)是一种结合“向量检索”与“大语言模型”的技术路线,能在问答、摘要、文档分析等场景中大幅提升准确性与上下文利用率。 本文将基于 LangChain 构建一个完整的 RAG 流程,结合 PGVector 作为向量数据库,并用 LangGraph 构建状态图控制流程。 大语言模型初始
阅读全文
posted @
2025-06-15 08:28
chester·chen
阅读(759)
推荐(2)
pytorch入门 - VGG16神经网络
摘要:1.VGG16背景介绍 VGG16是由牛津大学Visual Geometry Group(VGG)在2014年提出的深度卷积神经网络模型,它在当年的ImageNet图像分类竞赛中取得了优异成绩。 VGG16的主要贡献在于展示了网络深度(层数)对模型性能的重要性,通过使用多个小尺寸(3×3)卷积核堆叠
阅读全文
posted @
2025-06-14 09:58
chester·chen
阅读(1539)
推荐(0)
AI大模型应用开发入门-LangChain开发Agent
摘要:基于 LangChain 和 GPT-4o-mini 的大模型智能体开发实战 近年来,大模型能力的持续突破,使得构建智能代理(Agent)系统成为开发者追逐的热点。 本文将以 LangChain 框架为核心,结合 GPT-4o-mini 模型,通过接入工具与消息修剪策略,实现一个具备记忆、调用搜索、
阅读全文
posted @
2025-06-13 12:08
chester·chen
阅读(1105)
推荐(0)
AI大模型应用开发入门-LangChain开发聊天机器人ChatBot
摘要:在大模型应用开发中,状态管理 和 对话追踪 是不可忽视的重要能力,尤其在需要保存上下文、重放对话或进行异步处理时尤为关键。 今天我们来演示如何用 LangChain + OpenAI 的 GPT 模型 + PostgreSQL 搭建一个 具备消息存储能力 的聊天机器人。 技术栈 LangChain(
阅读全文
posted @
2025-06-12 10:54
chester·chen
阅读(1036)
推荐(1)
pytorch入门 - AlexNet神经网络
摘要:AlexNet背景 AlexNet是2012年由Alex Krizhevsky、Ilya Sutskever和Geoffrey Hinton提出的深度卷积神经网络架构。 它在ImageNet大规模视觉识别挑战赛(ILSVRC)中取得了突破性成绩,将top-5错误率从26%降低到了15.3%,这一成就
阅读全文
posted @
2025-06-11 08:56
chester·chen
阅读(822)
推荐(0)
pytorch入门 - 修改huggingface大模型配置参数
摘要:介绍 Hugging Face的Transformers库提供了大量预训练模型,但有时我们需要修改这些模型的默认参数来适应特定任务。 本文将详细介绍如何修改BERT模型的最大序列长度(max_position_embeddings)参数,并解释相关原理和实现细节。 原理 BERT等Transform
阅读全文
posted @
2025-06-10 10:16
chester·chen
阅读(706)
推荐(0)
pytorch入门 - 微调huggingface大模型
摘要:在自然语言处理(NLP)领域,预训练语言模型如BERT已经成为主流。HuggingFace提供的Transformers库让我们能够方便地使用这些强大的模型。 本文将详细介绍如何使用PyTorch微调HuggingFace上的BERT模型,包括原理讲解、代码实现和逐行解释。 1. 微调原理 1.1
阅读全文
posted @
2025-06-06 19:19
chester·chen
阅读(767)
推荐(0)
pytorch入门 - LetNet5神经网络
摘要:1.LetNet5简介 LeNet5是由Yann LeCun等人在1998年提出的一种卷积神经网络架构,主要用于手写数字识别。它是早期卷积神经网络的成功应用之一,为现代深度学习模型奠定了基础。LeNet5的名字来源于其发明者LeCun和网络层数(5层)。 LeNet5的主要特点包括: 使用卷积层提取
阅读全文
posted @
2025-06-05 14:51
chester·chen
阅读(758)
推荐(3)