大模型 - 网站分类

LLM应用测试，终于有了趁手武器？深度评测Product Hunt爆火的LLM Testing Tool

摘要最近Product Hunt上冒出了一批LLM测试工具，我试用了三天，说实话：有些是真香，有些是鸡肋。本文从测试工程师视角，深度评测BenchLLM、Langtail、Giskard三款热门工具，并结合LLM测试的"三重地狱"（幻觉、偏见、泄露）痛点，给出选型建议和实践经验。背景引入说实话 ...

Gemini生成摇滚音乐音频

生成摇滚音乐音频【冲前冲Rock-MV】 https://www.bilibili.com/video/BV1gffHBbEPp/?share_source=copy_web&vd_source=404ca3937788d99e8d6f4e4716b4e324生成歌词https://www.doub ...

2026年的17个LLM应用场景

核心洞察：三条技术路线路线代表模型核心优势适用场景推理密集型GPT-5.x 系列深度思考、长上下文、多模态复杂认知任务工程执行型Claude Opus 4.x代码严谨性、工具使用、可靠性生产级工程知识密集型Gemini 3.x/DeepThink广博知识、数学形式化、事实性研究分析类逐条解读适配逻辑 ...

Claude Code 的 Skills 可以在 Trae IDE 中通用

Claude Code 的 Skills 可以在 Trae IDE 中通用，但需要了解两者在实现细节上的差异。兼容性总结根据社区文档和工具生态的调研，Claude Code 和 Trae IDE 都遵循通用的 Agent Skills 规范，因此 Skills 在两者间基本兼容特性Claude C ...

SeeDance2.0提示词之跳舞女孩

SeeDance2.0提示词之跳舞女孩### Visual Style 9: 16 Vertical composition, 4K ultra-clear realistic image quality. Low-key lighting style with high contrast. The ...

Stanford-CS336-Lecture-01 学习理解

title: Stanford CS336 Lecture_01 date: 2026-02-19 16:52:58 categories: [人工智能] 1.资源课件资料：https://github.com/stanford-cs336/spring2025-lectures clone下来后 ...

各AI厂商在春节抢夺C端用户市场，顺便做生态连接，A/B testing

春节C端AI用户争夺战春节期间是超级流量窗口——用户空闲时间多、社交活跃度高、尝鲜意愿强。各AI厂商（如字节豆包、百度文心、阿里通义、Kimi等）将此视为抢占用户心智的关键战役。两个关键策略1. 「随便做生态连接」指轻量化、广撒网式的产品植入，而非深度技术整合：做法具体表现红包/抽奖活动AI生成拜年 ...

Seed团队最新发布的Seed2.0系列大语言模型

字节跳动Seed团队最新发布的Seed2.0系列大语言模型。以下是对重点内容的总结与归纳：一、发布背景与定位核心目标：突破真实世界中的复杂任务，从解决奥林匹克竞赛类问题迈向支持研究级推理任务。市场洞察：基于MaaS服务调用数据分析，企业最高频的需求是处理混杂图表、文档等非结构化信息（占比超30%）， ...

从0到1，无代码微调并部署本地大语言模型LLM

前言 LLM模型微调能让大模型掌握特定行业的深度知识，能够实现AI虚拟主播，AI医生，AI程序员，AI网络安全工程师等特定领域的延展。更重要的是，当有本地部署的硬件条件限制时，能够让微调后小的大语言模型等效百亿级的大语言模型测试环境：windows11，RTX4070显卡下面将手把手带你跑通无 ...

6个提示词，能把混乱的剪辑变成专业策略

6个提示词，能把混乱的剪辑变成专业策略1.编辑架构'提示词（触碰时间轴前） '你是资深视频编辑。根据原始素材描述，制定完整编辑方案：视频结构、每段节奏、精确切点、B素材位置、推荐转场。目标：最大留存率，无冗余特效。素材：[粘贴描述]' 2.'风格复制'提示词（克隆任何编辑）分析参考视频，逐步拆解编 ...

ProxyBridge下使用Antigravity

ProxyBridge下使用Antigravity，不需要启动TUN模式ProxyBridge 是一款轻量级、开源的代理工具，支持 Windows 和 macOS 系统，可在内核层面拦截指定进程的 TCP 和 UDP 流量，并将其重定向到 SOCKS5 或 HTTP 代理服务器。它常被用于精细化控 ...

基于Ai Coding,20天完成一个基于大模型的医学分析系统：Ai体征分析助手

我是一名长期使用C#开发后台服务与数据库的开发者，在短短20天内，独立完成一个跨前后端、贴合医疗健康场景分析的完整系统（Ai体征分析助手）是未曾想过的。得益于AI Coding工具的深度实践与应用和医疗领域大模型的应用，让我对AI时代的软件开发有了全新的认知。 ...

国产大模型适配优选，MonkeyCode 赋能企业研发

长亭MonkeyCode AI开发平台上线：免费算力赋能，AI助力全场景工程级研发落地当前AI编程工具层出不穷，但多数仅能应对“代码撰写、Demo运行”的基础场景，难以匹配真实工程研发的复杂诉求。长亭科技全新推出的AI开发平台MonkeyCode，成功突破这一行业瓶颈——平台以企业级研发标准构建， ...

[大模型实战 02] 图形化的大模型交互: Open WebUI部署指南

核心摘要 (TL;DR) 目标：为本地的 Ollama 模型穿上漂亮的图形化界面 (GUI)。工具：Docker + Open WebUI (社区最活跃的开源 WebUI)。核心功能：媲美 ChatGPT 的对话界面、本地知识库 (RAG)、自定义角色 (Agent)。相信各位友人在上一篇文章 ...

Claude Code团队内部使用指南

Claude Code（Anthropic 推出的 AI 命令行编程工具）的团队内部使用指南。它系统地总结了高效使用该工具的 10 个核心技巧，旨在将 AI 从简单的“自动补全”提升为“协同开发者”。以下是梳理的详细解读：一、核心效率指标图片右上角标注了四个关键目标：10个核心技巧。3-5个并行会 ...

从0到1，快速训练并使用YOLO模型

简介 YOLO是目前计算机视觉领域最前沿、应用最广泛的目标检测算法框架，他能快速识别区分目标，广泛应用于游戏，无人驾驶，工业等领域。以识别躲避掉落滑块的游戏的物体图片作为例子。一，环境配置 pip install ultralytics 二，准备数据集这个格式目录如下： my_dataset/ ...

stable_baseline3 快速入门(二): 训练自定义游戏，构建Gymnasium训练环境

简介 Gymnasium 为强化学习提供了一个标准化的API，它定义了 Agent 应该如何观察世界、如何做出动作以及如何获得奖励，不管是游戏，还是工业设备，只需要满足Gymnasium标准都能使用同一套代码进行训练。认识Gymnasium 使用stable_baseline3只需要定义好Gymn ...

stable_baseline3 快速入门(一): 训练第一个强化学习模型

简介 stable_baseline3 是一个基于 PyTorch 的强化学习算法开源库，里面集成了多种强化学习算法，使用这个开源库能够让我们不需要过度关注强化学习算法细节，专注于AI业务的开发。环境配置 pip install stable-baselines3 pip install gymn ...

AI模型Claude的Haiku、Sonnet、Opus 怎么选？

claude模型有以下版本：haiku(诗)，Sonnet(好诗)，Opus(杰作) claude不同模型之间对比模型版本速度成本智力水平最佳应用场景 Haiku 极快 ⚡️ 最低入门级客服、翻译、大量简单数据清洗 Sonnet 快中等高级 (主流) 编程、日 ...

智能客服不是问答机器人，微调更不是“多训点数据”

智能客服失败常因误将“问答机器人”当“服务处理器”。其核心不在答对，而在判断：是否该答、答到哪、何时转人工、如何安抚。微调非万能，仅适用于稳定风格、固化明确规则、强化安全拒答三类场景；知识更新、动态状态、争议判断等问题，应交由RAG或规则系统处理。 ...