相关背景技术基础成熟自然语言处理(NLP):AI可通过解析会议记录、邮件等非结构化文本,自动提取需求关键词(如“用户身份验证”“响应时间”),并分类为功能类、体验类或BUG类,准确率超过98%。 机器学习模型:通过分析历史项目数据(如需求变更频率、资源分配规律),AI可预测需求变更风险,优化任务拆解 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
计算大模型参数量主要依赖于模型的架构和各层配置,我们把常用大模型分为三层:输入层、transformer层、输出层。 输入层 参数组成是Embedding的词表总和 transformer层 参数组成包括归一化参数、QKV的参数、输出全连接线性变换参数、FFN投影参数 输出层 归一化参数、全连接线性 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
目录环境搭建与配置数据集准备WebUI 配置微调参数模型导出与量化导入 Ollama LLaMA Factory 是一个开源的全栈大模型微调框架,简化和加速大型语言模型的训练、微调和部署流程。它支持从预训练到指令微调、强化学习、多模态训练等全流程操作,并提供灵活的配置选项和高效的资源管理能力,适合开 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
错误原因 pip安装依赖时出现报错:ConnectError: [WinError 10054] 远程主机强迫关闭了一个现有的连接。 这通常表示在尝试从 Python 包索引 (PyPI) 下载 python-docx 包时遇到了网络连接问题。 而默认的下载源在国外服务器上,所以连接常常不稳定。 解 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
OneAPI开源项目的地址->One API 最近在学习oneapi,阅读了部分源码,把接口文档分享给大家 OneAPI API 文档 本文档描述了One API 开源项目的 API 接口(部分)。 用户管理 (User Management) 1. 用户注册 (User Registration) ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
大家好。我是一个计算机小白,最近开始写博客记录我的项目开发中遇到的问题和解决方案并且想要分享给大家。 我使用Obsidian来编写markdown文章后,当我想要发布到csdn时,发现虽然支持它支持markdown编辑器,但是图片要从本地一个一个上传上去,这太蠢了。 紧接着又出现了另一个大问题,博客 ...
一、概述 在 AI 应用开发中,工具调用 Tool Calling 是增强大模型能力的核心技术。通过让模型与外部 API 或工具交互,可实现 实时信息检索(如天气查询、新闻获取)、系统操作(如创建任务、发送邮件)等功能。 Spring AI 作为企业级 AI 开发框架,在 1.0.0.M6 版本中进 ...
背景 之前用基于其他LLM大模型已经生成数据大纲,我们主题是《JAVA多线程编程》,基于Trae工具AI能力编写。我们把大纲以markdown格式上传某个git仓库中,在Trae打开这个工程,与代码工程一样。适合场景:结构化文档(如API文档、知识库条目) 数据驱动内容(如产品目录、客户案例)按章节 ...
背景一、核心定义与协议基础MCP协议由Anthropic发起,被称为“AI界的USB-C接口”,其核心是通过标准化接口实现AI模型与外部工具/数据的无缝交互。在地图领域,高德、百度、腾讯等地图服务商已全面兼容MCP协议,提供地理编码、路线规划、POI检索等标准化API接口,支持开发者通过简单配置即可 ...
自从 DeepSeek 发布后,对 AI 行业产生了巨大的影响,以 OpenAI、Google 为首的国际科技集团为之震惊,它的出现标志着全球AI竞争进入新阶段。DeepSeek 是一个开源的产品,任何人都可通过 GitHub 等途径下载它的核心源代码,它的开源性意味着任何人都可以为 DeepSee... ...
这是 让 LLM 来评判 系列文章的第六篇,敬请关注系列文章: 基础概念 选择 LLM 评估模型 设计你自己的评估 prompt 评估你的评估结果 奖励模型相关内容 技巧与提示 LLM 评估模型已知偏差及缓解措施: 缺乏内部一致性:同一 prompt 输入评估模型执行多次得到的结果可能不一样 (如果 ...
1 修饰属性或变量 无论属性是基本类型、引用类型,都使变量里存放的“值”不可变。 常和static关键字协作,作为常量: 基本类型,变量放的是实实在在的值,如1,“abc” 引用类型,变量放的是个地址,所以final修饰引用类型变量指里面的地址不能变,即它只能指向初始时指向的那个对象,不关心指向的对 ...
MindIE是昇腾自研推理框架,本实验手册可指导小白用户快速掌握MindIE在LLM(large language model)场景的基本功能,包括:大模型推理功能测试、大模型性能测试、大模型精度测试、服务化推理部署、benchmark测试等。 1 实验准备 1.1 软硬件环境 本实验使用的设备是8 ...
0 要点总结 Meta发布 Llama 4 系列的首批模型,帮用户打造更个性化多模态体验 Llama 4 Scout 是有 170 亿激活参数、16 个专家模块的模型,同类中全球最强多模态模型,性能超越以往所有 Llama 系列模型,能在一张 NVIDIA H100 GPU 上运行。该模型支持业界领 ...