摘要: 不得不说,将DeepSeek-R1接入WPS真的惊呆我了!这意味着什么?简单来说,文档编辑从“手动挡”进化成了“自动挡”!不管是生成内容、优化表达,甚至是逻辑推理分析,AI都能直接帮你搞定,爽到飞起! 今天就来给大家聊聊,如何在WPS里接入 DeepSeek-R1,一步步带你从零配置到实战,让AI真 阅读全文
posted @ 2025-02-11 14:17 雨梦山人 阅读(11103) 评论(1) 推荐(2)
摘要: 概述 Unsloth是一个支持Llama系列、DeepSeek R1系列更快速,更少占用内存的微调库。最近提供了DeepSeek-R1模型的复现与GRPO算法的高效实现,而GRPO算法是DeepSeek模型中最关键的RL算法,而Unsloth增强优化了GRPO算法,使其使用更少的huggingfac 阅读全文
posted @ 2025-02-10 11:39 雨梦山人 阅读(25825) 评论(5) 推荐(2)
摘要: 最近国产AI大模型DeepSeek爆火出圈,登顶中美App Store下载榜,还在性能、性价比上碾压了ChatGPT和Google Gemini等硅谷巨头,直接杀入科技圈C位,成为现象级应用! 然而,不少小伙伴在使用的时候,经常会出现响应迟缓甚至宕机的情况👇 这可怎么办? 万幸的是,DeepSee 阅读全文
posted @ 2025-02-07 11:05 雨梦山人 阅读(33697) 评论(2) 推荐(2)
摘要: 让模型听话,按照要求思考,关键就在Prompt。 前言 你在写prompt时候,是不是总觉得大模型它不听话。要么答非所问、要么一堆废话。扒开思考过程仔细阅读时而觉得它聪明绝顶,时而又觉得它愚蠢至极。明明已经对了怎么又推理到错的地方去了,明明在提示词中提醒过了不要这么思考它怎么就瞎想了。这也许就是每一 阅读全文
posted @ 2025-09-29 11:36 雨梦山人 阅读(1570) 评论(0) 推荐(0)
摘要: 你的 RAG 还在“垃圾进,垃圾出”?我用这套流程,把“废料”文档变成了黄金知识库 最近大家关注Dify的进展的话,应该知道它的版本更新直接从1.8.0 >2.0.1了。跨越了一个大的版本。它本次的主要更新就在于知识库构建的知识流水线。 我认为Dify2.0以后的知识流水线会极大地降低了构建知识库的 阅读全文
posted @ 2025-09-20 23:46 雨梦山人 阅读(116) 评论(0) 推荐(0)
摘要: 随着人工智能技术的迅速发展,AI Coding 工具已经成为我日常开发中提升效率的重要手段。前阵子参加了一个算法技术的 Hackathon 活动,全程使用 AI 进行写文档、出设计图、写代码,这次经历让我深刻体会到 AI 在加速开发流程中的巨大潜力。因此,我想分享一些自己在实际业务场景中使用 AI 阅读全文
posted @ 2025-08-20 16:39 雨梦山人 阅读(302) 评论(0) 推荐(0)
摘要: 目录 MCP 协议简介 MCP 主要架构 MCP 开发踩坑经历 关于 AI 的感想 最近 Model Context Protocol ( MCP ) 概念大火,刚好它可以用 Node 或 Python 来编写,作为一名 web 前端程序猿,怎么可以错过这个工具的探索。文章是记录本人做 MCP Se 阅读全文
posted @ 2025-06-10 16:05 雨梦山人 阅读(630) 评论(0) 推荐(0)
摘要: 随着人工智能的浪潮席卷全球,大语言模型(LLM)的应用正变得无处不在。在垂直领域的SFT微调(Supervised Fine-Tuning)作为提升模型专业能力的关键技术,吸引了无数目光。但你是否注意到一个奇怪的现象:相比经验丰富的专家,新手似乎对尝试SFT微调表现出了更大的热情?这究竟是为什么?是 阅读全文
posted @ 2025-05-06 13:57 雨梦山人 阅读(346) 评论(0) 推荐(0)
摘要: 随着人工智能的飞速发展,大语言模型(LLM)正在革命性地重塑用户与软件的交互范式。 想象一下这样的场景:用户无需钻研复杂的API文档或者在繁琐的表单间来回切换,只需通过自然语言直接与系统对话——“帮我查找所有2023年出版的图书”、“创建一个新用户叫张三,邮箱是zhangsan@example.co 阅读全文
posted @ 2025-04-22 15:22 雨梦山人 阅读(606) 评论(0) 推荐(0)
摘要: 本文主要介绍了 Anthropic 推出的开源协议 MCP(Model Context Protocol,模型上下文协议),能让你快速上手该协议,实现大型语言模型与外部数据源和工具的无缝集成。如果想要了解 MCP 协议可以收藏阅读! 1 基本概念 2 目标及优势 3 示例 - 工具 基本概念 MCP 阅读全文
posted @ 2025-03-28 09:28 雨梦山人 阅读(2280) 评论(0) 推荐(1)
摘要: Ollama 是一个开源的本地大语言模型运行框架,它提供了非常简单便捷的使用形式,让用户可以十分方便的在本地机器上部署和运行大型语言模型,从而实现免费离线的方式使用 LLM 能力,并确保私有数据的隐私和安全性。 1 Ollama 安装 Ollama 支持多种操作系统,包括 macOS、Windows 阅读全文
posted @ 2025-03-24 16:57 雨梦山人 阅读(3543) 评论(0) 推荐(0)
摘要: 智能总结: 这篇文章深入探讨了如何通过微调技术来优化大语言模型(如 DeepSeek)的表现,使其在特定领域或任务中更具优势。文章首先解释了微调的必要性及其在特定领域中的应用场景,并将微调与长文本处理、知识库的使用进行对比,帮助读者理解何时选择微调。接着,文章详细介绍了微调的基本流程,包括选择预训练 阅读全文
posted @ 2025-02-28 16:04 雨梦山人 阅读(1519) 评论(0) 推荐(0)
摘要: 前言 DeepSeek系列大模型由杭州深度求索人工智能基础技术研究有限公司提供,该系列大模型有以下这些优势: 高性价比:DeepSeek-V2模型以其史无前例的性价比著称,推理成本被降到每百万token仅1块钱,约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。 架构创新:D 阅读全文
posted @ 2025-02-17 09:58 雨梦山人 阅读(15738) 评论(5) 推荐(3)