你是否有这样的经历:”知识库文档越来越多,知识库问答却越来越不靠谱,RAG检索到的都是一堆不相关的内容。“ 在这个信息爆炸的时代,我们不缺资料,缺的是找到"对的资料"的能力。 元数据和标签看似普通,却能很大提升RAG能力。 这篇文章聊一聊它们如何辅助RAG系统真正理解用户意图,精准找到需要的信息。 ...
介绍 GeekAI 基于AI大语言模型的AI 助手全套开源解决方案,自带运营管理后台,开箱即用。集成了 OpenAI, Claude, 通义千问,Kimi,DeepSeek等多个平台的大语言模型。 基于极客学长大佬的开源项目geekai 二次开发而来。首先感谢大佬的开源,致敬。大佬的项目地址:htt ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
微软开源的BitNet模型(特别是BitNet b1.58 2B4T)是一种革命性的低精度大语言模型(LLM),1.58位三值权重:权重仅取-1、0、+1三种值,每个参数平均占用约1.58位存储,结合8位整数激活值(W1.58A8配置),大幅压缩模型体积,通过创新的量化技术和架构设计,在性能、能效和... ...
去年底开始基于ESP32开发DIY的各种AI语音智能助手层出不穷,AI智能玩偶也比较火热。目前市面上也都有比较成熟的开发板集成了各种模块麦克风、OLED、功放、摄像头等几乎是开箱即用,普通开发者买了折腾一通总能搞点什么出来,当然对于批量推出市场的使用这种开发板成本比较高,通常比较少人这么用。 目前市 ...
背景Claude Sonnet 4是对Claude Sonnet 3.7的重大升级,在更精确地响应你的指令的同时,提供卓越的编码和推理能力。除了这些模型,我们还宣布了以下内容:扩展思考与工具使用(测试版):两款模型都可以在扩展思考过程中使用工具(如网络搜索),使Claude能够在推理和工具使用之间交 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
- 值得注意的内容: - 数据年龄问题,表面上越新越好,训练数据比评估数据旧就会导致性能下降。 - 但是,评估的内容是具有时间标签的,理所应当当然需要更新的模型来理解。 - 时间退化概念,本文之前就有人提出,2022年。 - 领域覆盖:多样性很重要。 - 质量和毒性的影响... ...
Sglang代码细读的最后一篇, 主要集中分析了框架中的二级显存池, cache复用相关的ChunkCache/RadixCache, 以及PD分离后KVCache是如何进行传输的 这三部分内容 ...
本人博客 https://www.konoxin.top/ 前提环境 Vercel账号 GitHub仓库 域名 大家也可以根据代码修改自己想要的效果 ✒️申请星火Spark-Lite 打开讯飞星火大模型API-大模型API-大模型接口-科大讯飞 下滑到如下,选择Spark-Lite,点击立即调用 会 ...
目录什么是 MCP 协议MCP 协议与 API 调用的区别MCP 协议的连接方式SSE(Server-Sent Events)stdio(标准输入输出)在 LangGraph 中使用 MCP 协议 什么是 MCP 协议 MCP(Model Context Protocol,模型上下文协议)是一种专为 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
Cline 是一款用于智能编程的 VSCode 插件,您可以集成阿里云百炼提供的通义千问或 DeepSeek 模型,完成复杂的编程任务。先看最终效果: Qwen3-235B-A22B 是阿里巴巴通义实验室发布的 Qwen3 系列旗舰级开源大模型,采用 混合专家架构(Mixture-of-Expert ...
SgLang代码细读-1.从req到batch 代码入口 & 初始化 sglang/python/sglang/srt/entrypoints/http_server.py launch_server 主要分4个步骤: 启动下列进程 (_launch_subprocesses): Tokenizer ...
之前,我们发布了时序数据库 IoTDB 团队自研的 Timer-XL 时序大模型,可以有效地为异常检测、数据填补、时序预测等时序数据场景提供解决方案。该模型已经内置在 IoTDB 的智能分析节点 AINode 中,用户能够非常方便地进行调用。 Timer-XL 时序大模型的论文成果:Timer-XL ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
Transformer模型结构: 示例:输入“我爱你”,输出“I love you”第一步:分词,将序列变为一个个token组成的向量,形状:[seq_len,]。本步涉及tokenizer相关技术 第二步:input embedding,将分词结果中的每一个token,编码成一个固定维数的embe ...