刷新
华为Ascend 910B部署Qwen2.5-VL-32B方案

博主头像 华为Ascend 910B部署Qwen2.5-VL-32B方案 目录一、多模态大模型——Qwen2.5-VL-32B1.1 简介1.2 显存测算1.2.1 Model Memory Calculator工具测算1.2.2 按模型参数量一般测算1.3 算力测算1.3.1 单 Token 理论计算量估算 ...

MCP应用场景供应链介绍

博主头像 MCP应用场景供应链介绍概要流程流程图mermaid代码graph TDA[SAP ERP] -->|库存数据| B((MCP 数据中台))C[Salesforce CRM] -->|订单数据| BD[IoT 设备] -->|物流追踪数据| BB -->|整合数据| E[(AI 决策模型)]E -- ...

将你的Dify应用转为MCP服务器

博主头像 本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...

基于DeepSeek生成互联网女皇最新AI报告2025

博主头像 "你不会因为AI而失业,但会因为使用AI的人而失业。AI是历史上最易于使用的技术之一,它使那些不懂编程的人也能'编程'。"- Jensen Huang, NVIDIA CEO"AI是一个思维伙伴、深度研究员、评论家、导师和结对程序员。这是我职业生涯中工作方式变化最快的转变。"- Shopify CE ...

ES实战从零搭建高性能商品搜索系统

博主头像 本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...

Spring 5 响应式编程:构建高性能全栈应用的关键

博主头像 本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...

Spring 5 响应式编程:构建高性能全栈应用的关键

博主头像 本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...

如何实现RAG与MCP集成

博主头像 1.概述 在人工智能的创新浪潮中,检索增强生成(RAG)技术以其高效调用外部知识、提升生成内容准确性的能力备受瞩目,而模型上下文协议(MCP)则为不同模型间的交互与协同提供了标准框架。当 RAG 的知识检索优势与 MCP 的灵活交互能力相遇,不仅能大幅提升 AI 系统的实用性与智能水平,还能为复杂场 ...

采购DeepSeek API成本对比与本地部署

博主头像 背景 公司需研发AI大语言模块相关应用,涵盖智能搜索、客服、预测分析、供应链优化、合规管理等场景,涉及自然语言处理(NLP)、图像识别、机器学习等技术。需在 本地部署大模型服务器 或 采购DeepSeek API服务 之间选择最优方案。根据业务需求优先级,推荐 混合部署策略:本地部署服务器适用场景: ...

基于LLM大模型的随机文章生成智能体

博主头像 基于LLM大模型的随机文章生成智能体一.基于代码编程实现我们当前是使用siiconflow的远程模块API, 采用Deepseek V3模型, 先看日志程序流程时序图总计生成10篇文章花费10分钟另一组程序输出目录10篇文章,按段落匹配下载的30张图片二. 扣子空间与最终结果,花费50分钟扣子空间生 ...

如何实现本地大模型与MCP集成

博主头像 1.概述 本文将围绕构建兼具本地运行大型语言模型(LLM)与MCP 集成能力的 AI 驱动工具展开,为读者提供从原理到实践的全流程指南。通过深度整合本地大模型的隐私性、可控性优势与 MCP 工具的自动化执行能力,帮助用户以低门槛、高效率的方式,打造个性化 AI 助手,实现任务自动化 —— 无论是文档 ...

基于QwenVL2.5模块实现发票识别

博主头像 提示词 准确的真实发票数据 https://source.xtechcn.com/xrhsc/other/2025/05/21/1925128521245523968.jpg"请提取发票图像中的以下信息:\n" +"- 发票代码\n" +"- 发票号码\n" +"- 开票日期\n" +"- 校验码\ ...

扣子智能体websdk集成多会话模式

博主头像 扣子智能体websdk集成默认PAT是不安全的,官方也推荐使用JWT认证,就涉及到服务端集成OAUTH认证。另一个是默认PAT集成,每个人打开同一个session对话,并不满足实际生产环境需求。配置First, 云端创建一个 OAuth应用 [服务类应用],如下:具体进一步的操作是服务端集成在服务端 ...

为什么人类程序员仍然比大语言模型(LLMs)强大?

为什么人类程序员仍然比大语言模型(LLMs)强大? 作者:antirez 这是一个简短的小故事,告诉你为什么人类的编程能力仍然远远领先于当前的AI技术。请注意,我并不是反AI的人,熟悉我的朋友都知道这一点。我日常都会使用大语言模型(LLMs),包括今天也是如此。当我需要快速验证自己的想法、进行代码审 ...

<1···101112···30>