这是 让 LLM 来评判 系列文章的第六篇,敬请关注系列文章: 基础概念 选择 LLM 评估模型 设计你自己的评估 prompt 评估你的评估结果 奖励模型相关内容 技巧与提示 LLM 评估模型已知偏差及缓解措施: 缺乏内部一致性:同一 prompt 输入评估模型执行多次得到的结果可能不一样 (如果 ...
1 修饰属性或变量 无论属性是基本类型、引用类型,都使变量里存放的“值”不可变。 常和static关键字协作,作为常量: 基本类型,变量放的是实实在在的值,如1,“abc” 引用类型,变量放的是个地址,所以final修饰引用类型变量指里面的地址不能变,即它只能指向初始时指向的那个对象,不关心指向的对 ...
MindIE是昇腾自研推理框架,本实验手册可指导小白用户快速掌握MindIE在LLM(large language model)场景的基本功能,包括:大模型推理功能测试、大模型性能测试、大模型精度测试、服务化推理部署、benchmark测试等。 1 实验准备 1.1 软硬件环境 本实验使用的设备是8 ...
0 要点总结 Meta发布 Llama 4 系列的首批模型,帮用户打造更个性化多模态体验 Llama 4 Scout 是有 170 亿激活参数、16 个专家模块的模型,同类中全球最强多模态模型,性能超越以往所有 Llama 系列模型,能在一张 NVIDIA H100 GPU 上运行。该模型支持业界领 ...
目录环境搭建与配置定义智能体加载模型提取关键词生成回答连接智能体定义图的状态定义节点方法根据指令路由生成回答文件处理提取关键词网络搜索定义图的结构运行图运行指南在控制台中测试程序使用 Streamlit 构建前端页面 随着大语言模型(LLM)技术的快速发展,人们期望利用 LLM 解决各种复杂问题,在 ...
AI Agent 无疑是今年最火爆的概念,从科技巨头的战略布局到创业公司的创新产品,AI 智能体正在重塑我们与机器交互的方式。无论是自动化任务、个性化服务,还是复杂问题的协同解决,AI Agent 都展现出了前所未有的潜力。 而在众多备受瞩目的框架中,微软 Autogen 凭借其灵活的多智能体协作能 ...
背景ChatGLM-沉思版是由智谱AI于2025年4月推出的新一代智能体,其核心背景可从技术原理、应用场景、发展历程及未来趋势四方面展开:技术原理:融合深度思考与操作执行的革新架构模型基础: 基于GLM(General Language Model)的Transformer架构,采用自回归生成模式, ...
引言:本质上是统一为openai协议 参考文章: OneAPI-接口管理和分发神器:所有大模型一键封装成OpenAI协议 - AI码上来的文章 - 知乎 https://zhuanlan.zhihu.com/p/707769192 目前有两种选择,一是开源可商用的OneAPI,另一种则是国内的接口聚 ...
这个错误 ssl.SSLCertVerificationError: [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate 指出 Python 在尝试建立安 ...
0 前言 null,表示无引用指向或没有指针,若操作该变量会引发空指针异常,即NullPointerException,NPE。 当线上发生该异常,说明代码健壮性不足,如何才能避免NPE?NPE虽烦,但易定位,关键在null到底意味啥: client给server一个null,是其本意就想给个空值, ...
在企业数字化转型中,知识资产的高效利用成为核心竞争力。JBoltAI 通过RAG(检索增强生成)技术,构建了 “知识检索 - 语义理解 - 智能生成” 的闭环体系,帮助企业将海量非结构化数据转化为可行动的智能决策。本文以官网典型案例 —— 智能客服知识库系统为例,详解 RAG 技术的实现逻辑与行业价 ...
最近有很多朋友都在部署deepseek模型,而且都用到了模型量化这个功能,目的是减少显存占用、提升推理速度。 上图是w8a8量化算法流程,主要包含4步: ①,使用昇腾 msmodelslim 仓库提供的量化接口对原始模型权重进行量化,生成int8格式的权重文件,以及后续在推理的时候要用到的激活值 ...
1.概述 OpenAI Agents SDK 现已支持 MCP(模型上下文协议),这是 AI 互操作性的重大变革。这使开发人员能够高效地将 AI 模型连接到外部工具和数据源。本篇博客,笔者将指导使用 OpenAI Agents SDK 构建 MCP 服务器,以增强你的 AI 应用程序。 2.内容 2 ...
背景FireCrawl MCP是一款基于MCP协议的企业级网页爬虫服务器,由Mendable.ai开发,专为高级网页抓取设计。它整合了FireCrawl的网页抓取能力,通过MCP接口将强大的网络爬虫功能暴露给大型语言模型(LLM),如Claude、Grok、Cursor等,使智能体能够抓取网页、处理 ...
背景Midscene.js是一款由字节跳动Web Infra团队开发的开源、基于AI技术的UI自动化工具,其应用场景广泛且多样:1. 自动化测试功能测试:Midscene.js能够模拟用户操作,如点击按钮、输入文本等,对Web应用进行功能测试,确保应用在不同情况下都能稳定运行。冒烟测试:对于简单的站 ...
大模型演变与概念 人工智能 人工智能是一个非常广泛的领域,涵盖了多种技术和方法,包括但不限于机器学习、自然语言处理、计算机视觉、专家系统、机器人学等。 人工智能旨在创建能够模拟人类智能行为的系统或软件。它包括感知、推理、学习、决策和语言理解等多种能力,目标是让计算机能够像人类一样思考和行动。 在人工 ...
DeepSeek-R1 会推理,GPT-4o 会看。能否让 1 LLM既能看又能推理? DeepSeek-R1取得很大成功,但它有个问题——无法处理图像输入。 1.1 DeepSeek模型发展 自2024.12,DeepSeek已发布: DeepSeek-V3(2024.12):视觉语言模型(VLM ...
来源:博客链接 过去两年,开源 AI 社区一直在热烈讨论新 AI 模型的开发。每天都有越来越多的模型在 Hugging Face 上发布,并被用于实际应用中。然而,开发者在使用这些模型时面临的一个挑战是模型格式的多样性。 在本文中,我们将探讨当下常见的 AI 模型格式,包括: GGUF PyTorc ...
2025 AI实战vue3+deepseek+arcoDesign仿DeepSeek/豆包网页版AI聊天助手。 vue3-web-deepseek 实战网页PC版智能AI对话,基于vite6+vue3.5+openAI对接DeepSeek-Chat聊天对话模型。实现流动式打字返回效果、支持亮色+暗黑 ...
前排提醒: 1. 本地通过Ollama部署DeepSeek,部署版本为 deepseek-r1:1.5b,若还未进行本地部署,可以参考博客Windows系统上使用Ollama本地部署DeepSeek 2. 线上API使用的是硅基流动(siliconflow)的DeepSeek API,模型名称为 d ...