刷新
个人 Windows 电脑本地部署运行 DeepSeek 大模型

博主头像 1、大模型管理器 1.1、下载ollama 官网下载地址:https://ollama.com/download 如上图所示,下载 Windows 操作系统版本的 ollama 安装包。 1.2、安装ollama 如上图所示,以“管理员身份运行”安装包。 如上图所示,允许安装包对设备进行更改。 如上 ...

Google Skills免费开放啦

博主头像 家人们,AI圈的大事来啦!Google搞了个大动作,直接把内部的AI学习资源打包成“Google Skills”平台,向全球开放!这波操作直接把AI学习的门槛拉到超低,普通人也能轻松上车!免费用户直接用Google Cloud账号就能学,非Cloud用户花29刀就能月卡畅学。这个平台简直就是AI学习 ...

构建YouTube视频总结摘要智能体

博主头像 智能体 AI 平台 智能体 AI 框架是一个工具包,用于创建能够通过工具使用和记忆自主或半自主地推理、计划和采取行动的智能体系统。这些框架提供了创建能够与环境交互、做出决策和执行任务的智能体所需的结构。有几个流行的智能体 AI 平台,如 LangChain、CrewAI 和 Phidata。在本教程 ...

Search-R1论文浅析与代码实现

博主头像 GitHub: https://github.com/PeterGriffinJin/Search-R1 论文: link1, link2 Motivation 使用seach engine给reasoning LLM赋能 Method 在PPO的基础上,基于给定的Search Egine \(R\ ...

OpenAI Codex整合Z.ai GLM-4.6编程

博主头像 背景 OpenAI Codex 是一个由 OpenAI 开发的人工智能模型,它能够理解自然语言(比如中文、英文)指令,并将其实时翻译成可工作的计算机代码。简单来说,你用日常语言告诉它你想要实现什么功能,它就能为你写出代码。技术基础: Codex 是基于 OpenAI 的 GPT-3(生成式预训练变换 ...

DAPO代码实现浅析

博主头像 参考verl对dapo的实现,首先咱们看一下入口.sh和.py文件,在./recipe/dapo/文件夹中有以下目录 . ├── config │ ├── dapo_megatron_trainer.yaml │ └── dapo_trainer.yaml ├── dapo_ray_trainer. ...

DAPO浅析

博主头像 论文地址 https://arxiv.org/abs/2503.14476 参考实验:DAPO + vLLM v1 + VeRL —— VOC性能比较 Motivation 没有完整的GRPO训练R1-32B的框架 目标: 降低错误样本的长度 (token-level loss) 训练更加稳定 (o ...

DeepResearch代码浅析

博主头像 DeepResearch代码浅析 概述 代码:DeepResearch 主要看一下inference下面的ReAct推理流程。 inference ├── eval_data │ ├── example_with_file.jsonl │ ├── example.jsonl │ └── file_c ...

微软智能体框架(Microsoft Agent Framework)介绍

博主头像 背景 微软智能体框架(Microsoft Agent Framework)进行全面深入的分析。该框架于2025年10月1日发布公共预览版,标志着微软在人工智能智能体技术领域的一次重大战略整合 。其核心使命在于解决人工智能领域长期存在的“研究”与“生产”之间的鸿沟,将以研究为驱动、具备动态多代理编排能 ...

Salesforce实践AI驱动下的4个工程启示

博主头像 引言:当软件测试达到极限 在现代软件开发中,自动化测试是质量保障的基石,但它也带来了一个普遍的挑战:海量的测试失败案例。当系统规模达到一定程度时,诊断和修复这些失败案例本身就可能成为一个巨大的工程瓶瓶颈,拖慢整个开发节奏。 Salesforce的工程团队对此深有体会。他们的测试生态系统规模惊人:每天 ...

AgentFounder浅析——Agent的演化历程与目标

博主头像 理论上(浅显)分析Agent与传统llm、RAG的不同以及演进历程,根据Agent的目标解读AgentFounder论文的训练策略和数据集构建 Agent的目标以及对应的技术方案 Agent的推理目标 形式化的表达: 咱们首先来分析一下最开始大模型的功能,即仅根据\(\pi\)的内部知识和问题\(q ...

云Pinecone向量数据库集成SpringAI

博主头像 RAG实现架构图Pinecone面板查询QPS峰值插入模型 llama-text-embed-v2 是由NVIDIA Research开发的一款先进的文本嵌入模型,旨在提供高质量的检索能力和低延迟的推理性能。该模型也被称为 llama-3_2-nv-embedqa-1b-v2,它基于Llama 3. ...

别再怪AI答非所问了!5分钟掌握Prompt,让你的AI从“人工智障”秒变“人工智能”

博主头像 是不是有过这种经历?你让AI写个“霸气侧漏”的辞职信,它却给你一篇“感恩公司”的温情小作文;你让AI画个“在咖啡馆敲代码的程序员”,结果生成一个“像在打游戏的奥特曼”…… 先别急着给AI扣上“智商不行”的帽子——90%的问题,可能都出在您给它的“指令”上。 这道指令,就是今天的主角:Prompt(提 ...

Qwen WebAgent 系列

博主头像 GitHub地址: https://github.com/Alibaba-NLP/WebAgent# 共有5篇系列文章 为Agent(React架构)在web search(Deepsearch)提供BenchMark以及模型训练方法。 WebWalker 将原始instruct-answer的si ...

<1···91011···27>