大模型 - 第21页 - 网站分类

基于QwenVL2.5模块实现发票识别

提示词准确的真实发票数据 https://source.xtechcn.com/xrhsc/other/2025/05/21/1925128521245523968.jpg"请提取发票图像中的以下信息：\n" +"- 发票代码\n" +"- 发票号码\n" +"- 开票日期\n" +"- 校验码\ ...

扣子智能体websdk集成多会话模式

扣子智能体websdk集成默认PAT是不安全的，官方也推荐使用JWT认证，就涉及到服务端集成OAUTH认证。另一个是默认PAT集成，每个人打开同一个session对话，并不满足实际生产环境需求。配置First, 云端创建一个 OAuth应用 [服务类应用]，如下：具体进一步的操作是服务端集成在服务端 ...

为什么人类程序员仍然比大语言模型（LLMs）强大？

为什么人类程序员仍然比大语言模型（LLMs）强大？作者：antirez 这是一个简短的小故事，告诉你为什么人类的编程能力仍然远远领先于当前的AI技术。请注意，我并不是反AI的人，熟悉我的朋友都知道这一点。我日常都会使用大语言模型（LLMs），包括今天也是如此。当我需要快速验证自己的想法、进行代码审 ...

SmolVLM2轻量级视频多模态模型，应用效果测评(风景、事故、仿真、统计、文字、识物)

SmolVLM2轻量级视频多模态模型，应用效果测评目录 1. 前言... 2 2. 应用部署... 2 3. 应用效果... 4 1.1 风景图像理解... 4 1.2 事故现场理解... 5 1.3 仿真图像理解... 6 1.4 数量统计描述... 7 1.5 图像文字理解... 8 1.6 ...

RAG越来越不准？从Dify和ima知识库看元数据与标签如何让大模型更懂你

你是否有这样的经历：”知识库文档越来越多，知识库问答却越来越不靠谱，RAG检索到的都是一堆不相关的内容。“ 在这个信息爆炸的时代，我们不缺资料，缺的是找到"对的资料"的能力。元数据和标签看似普通，却能很大提升RAG能力。这篇文章聊一聊它们如何辅助RAG系统真正理解用户意图，精准找到需要的信息。 ...

重磅开源基于AI大语言模型的AI 助手全套开源解决方案 AI开源平台geekai-django

介绍 GeekAI 基于AI大语言模型的AI 助手全套开源解决方案，自带运营管理后台，开箱即用。集成了 OpenAI, Claude, 通义千问，Kimi，DeepSeek等多个平台的大语言模型。基于极客学长大佬的开源项目geekai 二次开发而来。首先感谢大佬的开源，致敬。大佬的项目地址：htt ...

Dify解锁并行处理，四种模式助你玩转复杂工作流！

本文已收录在Github，关注我，紧跟本系列专栏文章，咱们下篇再续！魔都架构师 | 全网30W技术追随者大厂分布式系统/数据中台实战专家主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者以技术驱动创新，我们的征途是改变世 ...

不止是推理王者！DeepSeek R1 如何用“低成本、高性能”重塑 AI 产业格局？

本文已收录在Github，关注我，紧跟本系列专栏文章，咱们下篇再续！魔都架构师 | 全网30W技术追随者大厂分布式系统/数据中台实战专家主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者以技术驱动创新，我们的征途是改变世 ...

微软开源bitnet b1.58大模型，应用效果测评(问答、知识、数学、逻辑、分析)

微软开源的BitNet模型（特别是BitNet b1.58 2B4T）是一种革命性的低精度大语言模型（LLM），1.58位三值权重：权重仅取-1、0、+1三种值，每个参数平均占用约1.58位存储，结合8位整数激活值（W1.58A8配置），大幅压缩模型体积，通过创新的量化技术和架构设计，在性能、能效和... ...

ESP32大模型AI语音助手-软件到硬件

去年底开始基于ESP32开发DIY的各种AI语音智能助手层出不穷，AI智能玩偶也比较火热。目前市面上也都有比较成熟的开发板集成了各种模块麦克风、OLED、功放、摄像头等几乎是开箱即用，普通开发者买了折腾一通总能搞点什么出来，当然对于批量推出市场的使用这种开发板成本比较高，通常比较少人这么用。目前市 ...

Claude4 从UI生成前端工程代码实践

背景Claude Sonnet 4是对Claude Sonnet 3.7的重大升级，在更精确地响应你的指令的同时，提供卓越的编码和推理能力。除了这些模型，我们还宣布了以下内容：扩展思考与工具使用（测试版）：两款模型都可以在扩展思考过程中使用工具（如网络搜索），使Claude能够在推理和工具使用之间交 ...

Claude 4 震撼发布：编程能力登顶，智能体迈入新时代！

本文已收录在Github，关注我，紧跟本系列专栏文章，咱们下篇再续！魔都架构师 | 全网30W技术追随者大厂分布式系统/数据中台实战专家主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者以技术驱动创新，我们的征途是改变世 ...

【202406】预训练器的数据指南：衡量数据年龄、领域覆盖、质量和毒性的影响

- 值得注意的内容： - 数据年龄问题，表面上越新越好，训练数据比评估数据旧就会导致性能下降。 - 但是，评估的内容是具有时间标签的，理所应当当然需要更新的模型来理解。 - 时间退化概念，本文之前就有人提出，2022年。 - 领域覆盖：多样性很重要。 - 质量和毒性的影响... ...

SgLang代码细读-3.Cache

Sglang代码细读的最后一篇, 主要集中分析了框架中的二级显存池, cache复用相关的ChunkCache/RadixCache, 以及PD分离后KVCache是如何进行传输的这三部分内容 ...

hexo基于TianliGPT使用免费的Spark-Lite制作AI摘要

本人博客 https://www.konoxin.top/ 前提环境 Vercel账号 GitHub仓库域名大家也可以根据代码修改自己想要的效果 ✒️申请星火Spark-Lite 打开讯飞星火大模型API-大模型API-大模型接口-科大讯飞下滑到如下，选择Spark-Lite，点击立即调用会 ...

张高兴的大模型开发实战：（六）在 LangGraph 中使用 MCP 协议

目录什么是 MCP 协议MCP 协议与 API 调用的区别MCP 协议的连接方式SSE（Server-Sent Events）stdio（标准输入输出）在 LangGraph 中使用 MCP 协议什么是 MCP 协议 MCP（Model Context Protocol，模型上下文协议）是一种专为 ...

告别 jQuery 思维：用 Vue.js 轻松打造清单应用，体验数据驱动的魅力

本文已收录在Github，关注我，紧跟本系列专栏文章，咱们下篇再续！魔都架构师 | 全网30W技术追随者大厂分布式系统/数据中台实战专家主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者以技术驱动创新，我们的征途是改变世 ...

RocketMQ客户端是如何感知Broker节点的？

本文已收录在Github，关注我，紧跟本系列专栏文章，咱们下篇再续！魔都架构师 | 全网30W技术追随者大厂分布式系统/数据中台实战专家主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者以技术驱动创新，我们的征途是改变世 ...

Trae开发工具中配置Qwen3-235B-A22B

Cline 是一款用于智能编程的 VSCode 插件，您可以集成阿里云百炼提供的通义千问或 DeepSeek 模型，完成复杂的编程任务。先看最终效果： Qwen3-235B-A22B 是阿里巴巴通义实验室发布的 Qwen3 系列旗舰级开源大模型，采用混合专家架构（Mixture-of-Expert ...

SgLang代码细读-1.从req到batch

SgLang代码细读-1.从req到batch 代码入口 & 初始化 sglang/python/sglang/srt/entrypoints/http_server.py launch_server 主要分4个步骤: 启动下列进程 (_launch_subprocesses): Tokenizer ...