Fork me on GitHub
摘要: Dify 中的工具是指其平台内置或支持集成的功能插件,用于扩展 AI 应用的能力。 1.工具作用 扩展 LLM 的能力:工具可以赋予 LLM 连接外部世界的能力,例如联网搜索、科学计算、绘制图片等。例如,通过集成谷歌搜索工具,AI 助手可以回答实时问题。 完成复杂任务:工具可以帮助 LLM 进行任务 阅读全文
posted @ 2025-05-23 18:27 磊哥|www.javacn.site 阅读(127) 评论(0) 推荐(0)
摘要: 我们在运营某个圈子的时候,可能每天都要将这个圈子的“热门新闻”发送到朋友圈或聊天群里,但依靠传统的实现手段非常耗时耗力,我们通常要先收集热门新闻,再组装要新闻内容,再根据内容设计海报等。 那怎么才能简化并高效的完成以上工作呢? 答案是我们可以借助 AI 工具:Dify + Java 服务来实现热点新 阅读全文
posted @ 2025-05-22 20:23 磊哥|www.javacn.site 阅读(369) 评论(0) 推荐(1)
摘要: 在经历了八个里程碑式的版本之后(M1~M8),Spring AI 1.0 正式版本,终于在 2025 年 5 月 20 日正式发布了,这是另一个新高度的里程碑式的版本,标志着 Spring 生态系统正式全面拥抱人工智能技术,并且意味着 Spring AI 将会给企业带来稳定 API 支持。 1.核心 阅读全文
posted @ 2025-05-21 18:13 磊哥|www.javacn.site 阅读(624) 评论(0) 推荐(3)
摘要: 大模型应用课又更新了,除了之前已经完结的两门课(视频+图文): 《Spring AI 从入门到精通》 《LangChain4j 从入门到精通》 还有目前正在更新的 《Dify 从入门到实战》 本周也迎来了一大波内容更新,其中就包括今天要介绍的《AI 面试官》实战案例,接下来我们来看看它的主要功能,以 阅读全文
posted @ 2025-05-20 11:03 磊哥|www.javacn.site 阅读(67) 评论(0) 推荐(0)
摘要: 续 Spring AI M8 版本之后(5.1 发布),前几日 Spring AI 悄悄的发布了最新版 Spring AI 1.0.0 RC1(5.13 发布),此版本也将是 GA(Generally Available,正式版)发布前的最后一个版本,正式版计划在 5.20 日发布。 这个版本的改动 阅读全文
posted @ 2025-05-16 15:56 磊哥|www.javacn.site 阅读(345) 评论(0) 推荐(0)
摘要: AI 技术发展很快,同样 AI 配套的相关技术发展也很快。这不今天刚打开 Spring AI 的官网就发现它又又又又更新了,而这次更新距离上次更新 M7 版本才不过半个月的时间,那这次 Spring AI 给我们带来了哪些惊喜呢?一起来看。 重点升级点 我们先来判断 Spring AI M8 的重点 阅读全文
posted @ 2025-05-14 14:55 磊哥|www.javacn.site 阅读(765) 评论(0) 推荐(1)
摘要: LangChain4j 提供了 3 种 RAG(Retrieval-Augmented Generation,检索增强生成)实现,我们通常在原生或高级的 RAG 实现中,要对数据进行清洗,也就是将外接知识库中的原数据进行噪音去除,留下有价值的信息。 例如在带有 HTML 标签的文本中,HTML 标签 阅读全文
posted @ 2025-05-12 14:40 磊哥|www.javacn.site 阅读(195) 评论(0) 推荐(1)
摘要: LangChain4j 1.0.0-beta4 上周刚刚发布,并且计划这个月中旬发布 RC1,我觉得这次升级还是非常实用的,除了修复了一些关键的 BUG 之外,还有一个被我经常吐槽的功能也被更正了,具体是什么问题呢?我们下来一起看。 同时使用过 Spring AI 和 LangChain4j 的同学 阅读全文
posted @ 2025-05-09 10:30 磊哥|www.javacn.site 阅读(111) 评论(0) 推荐(0)
摘要: LangChain4j 和 Spring AI 是 Java 生态中实现大模型应用开发的两个最重要的框架,但二者的区别是啥?生产级别又该使用哪种框架?令很多人犯了难,所以本文就来浅聊一下,希望给大家在技术选型时有一个简单的参考。 1.功能对比 LangChain4j 和 Spring AI 的功能是 阅读全文
posted @ 2025-05-06 15:09 磊哥|www.javacn.site 阅读(462) 评论(0) 推荐(1)
摘要: 今日凌晨,通义千问团队正式开源了 Qwen3 大模型,并且一口气发布了 8 个型号,其中包括 0.6B、1.7B、4B、8B、14B、32B 以及 30B-A3B 和 235B-A22B,使用者可以根据自己的业务情况,选择合适的版本进行使用。 更让人惊喜的是,最新的 Qwen3 系列模型具备双模推理 阅读全文
posted @ 2025-04-29 16:42 磊哥|www.javacn.site 阅读(873) 评论(0) 推荐(0)
摘要: 向量数据库是大模型应用开发必备组件之一,因为它在知识库、语义搜索、检索增强生成(RAG)等人工智能应用中发挥着举足轻重的作用。但向量数据有很多,为什么要使用 Milvus 呢? 常见向量数据 常见的向量数据库有以下这些: Chroma Elasticsearch Milvus Neo4j OpenS 阅读全文
posted @ 2025-04-25 16:34 磊哥|www.javacn.site 阅读(541) 评论(0) 推荐(1)
摘要: 简单来说,“向量”Vector 是大模型(LLM)在搜索时使用的一种“技术手段”,通过向量比对,大模型能找出问题的相关答案,并且进行智能回答。 向量简介 Vector 是向量或矢量的意思,向量是数学里的概念,而矢量是物理里的概念,但二者描述的是同一件事。 定义:向量是用于表示具有大小和方向的量。 向 阅读全文
posted @ 2025-04-24 11:28 磊哥|www.javacn.site 阅读(109) 评论(0) 推荐(0)
摘要: 在 Spring AI 中,流式输出(Streaming Output)是一种逐步返回 AI 模型生成结果的技术,允许服务器将响应内容分批次实时传输给客户端,而不是等待全部内容生成完毕后再一次性返回。 这种机制能显著提升用户体验,尤其适用于大模型响应较慢的场景(如生成长文本或复杂推理结果)。 技术实 阅读全文
posted @ 2025-04-23 17:03 磊哥|www.javacn.site 阅读(444) 评论(0) 推荐(2)
摘要: 最近在深度体验和使用 Spring AI 和 LangChain4j,从开始的满怀期待五五开,但最后极具痛苦的使用 LangChain4j,让我真正体验到了正规军和草台班子的区别。 Spring AI VS LangChain4j Spring AI:使用简单、写法优雅、但功能提供的较少、成熟度稍高 阅读全文
posted @ 2025-04-21 16:01 磊哥|www.javacn.site 阅读(751) 评论(1) 推荐(3)
摘要: 昨天晚上直播,我们用 RAG(Retrieval-Augmented Generation,检索增强生成)实现了数据库 AI 助手,今天我们准备换一个技术使用 function call 来实现快递 AI 助手。 执行效果 快递 AI 助手的业务逻辑很清晰,就是我通过 LLM 大语言模型的对话来查询 阅读全文
posted @ 2025-04-17 16:22 磊哥|www.javacn.site 阅读(401) 评论(0) 推荐(0)
摘要: Spring AI 前两天(4.10 日)更新了 1.0.0-M7 版本后,原来的 SimpleVectorStore 内存级别的向量数据库就不能用了,Spring AI 将其全部源码删除了。 此时我们就需要一种成本更低的解决方案来解决这个问题,如何解决呢?我们一起来看。 解决方案:Redis 向量 阅读全文
posted @ 2025-04-16 16:05 磊哥|www.javacn.site 阅读(238) 评论(0) 推荐(0)
摘要: 不知道大家有没有发现?对于添加到 MCP 服务市场的成千上万个 MCP 服务(而且这个数字每天还在增加),我们可以不写一行代码,轻松实现调用,但背后的原因究竟是啥呢? MCP 虽然用起来很方便,但搞不懂背后的实现原理,总感觉这个知识点还没完全掌握,所以接下来,我们一起来看它的实现原理。 从某个 MC 阅读全文
posted @ 2025-04-11 16:33 磊哥|www.javacn.site 阅读(1022) 评论(0) 推荐(1)
摘要: 提示词(Prompt)是输入给大模型(LLM)的文本指令,用于明确地告诉大模型你想要解决的问题或完成的任务,也是大语言模型理解用户需求并生成准确答案的基础。因此 prompt 使用的好坏,直接决定了大模型生成结果的质量(是否符合预期)。 Prompt 基本使用 为了让大模型生成更符合预期的结果,我们 阅读全文
posted @ 2025-04-02 16:50 磊哥|www.javacn.site 阅读(264) 评论(0) 推荐(0)
摘要: 嵌入模型(Embedding Model)和向量数据库(Vector Database/Vector Store)是一对亲密无间的合作伙伴,也是 AI 技术栈中紧密关联的两大核心组件,两者的协同作用构成了现代语义搜索、推荐系统和 RAG(Retrieval Augmented Generation, 阅读全文
posted @ 2025-04-01 16:36 磊哥|www.javacn.site 阅读(346) 评论(0) 推荐(0)
摘要: MCP 这个概念相信大家已经听了无数次了,但不同人会有不同的解释,你可能也是听得云里雾里的。 不过没关系,今天这篇内容会通过 Spring AI 给你实现一个 MCP 的 Client 和 Server 架构,让你彻底搞懂 MCP 的概念,以及学会 MCP 的开发技能。 什么是MCP? MCP 是 阅读全文
posted @ 2025-03-27 12:02 磊哥|www.javacn.site 阅读(6985) 评论(0) 推荐(0)
摘要: MySQL 是面试中必问的模块,而 MySQL 中的优化内容又是常见的面试题,所以本文来看“工作中优化MySQL的手段有哪些?”。 工作中常见的 MySQL 优化手段分为以下五大类: 索引优化:确保高频查询字段有合适索引。 SQL优化:减少全表扫描、避免不必要计算。 事务与锁优化:避免长事务、使用批 阅读全文
posted @ 2025-03-24 15:11 磊哥|www.javacn.site 阅读(182) 评论(0) 推荐(0)
摘要: Reactor 模型是一种事件驱动的高性能网络编程模型,主要用于处理高并发的网络 I/O 请求。其核心思想是通过一个或多个线程监听事件,并将事件分发给相应的处理程序,从而实现高效的并发处理。 为什么要有Reactor模型? 在高并发下,只有多路复用技术,以及 NIO 是不行的,因为 NIO 只是 J 阅读全文
posted @ 2025-03-21 14:54 磊哥|www.javacn.site 阅读(52) 评论(0) 推荐(0)
摘要: 最近正是找实习的大好时机,互联网各家也分别官宣了他们的招聘计划。 京东宣布要招聘 10000 人,腾讯宣布要招聘 7000 人,字节宣布要招 4000 人,美团宣布了他们要招聘 5000 人,并且公布了 70% 的高转正率: (图片来自:美团公众号,侵权联系可删) 这不,这两天有同学面试美团,被拷打 阅读全文
posted @ 2025-03-18 17:17 磊哥|www.javacn.site 阅读(30) 评论(0) 推荐(0)
摘要: 项目的高可用、高并发和高扩展是当前开发中必须追求的三大目标,因此也是面试中经常被问到的内容,所以我们今天就来看看,如何才能保证项目的高可用性呢? 1.高可用的度量指标 项目的可用性的度量指标是以可用性百分比(N个9)来衡量的,也就是通过系统正常运行时间占比衡量的,例如: 99.9%(3个9):年故障 阅读全文
posted @ 2025-03-10 11:51 磊哥|www.javacn.site 阅读(137) 评论(0) 推荐(0)
摘要: JWT(JSON Web Token) 是一种开放标准(RFC 7519),用于在网络应用间安全传输信息,通常用于身份验证和信息交换。其核心特点是通过紧凑且自包含的 JSON 对象传递数据,无需服务端存储会话状态。 1.为什么需要JWT? 开发中需要 JWT 的主要原因是为了解决传统基于 Sessi 阅读全文
posted @ 2025-03-06 16:47 磊哥|www.javacn.site 阅读(70) 评论(0) 推荐(0)