会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
雨梦山人
博客园
首页
新随笔
联系
订阅
管理
1
2
3
4
5
下一页
[置顶]
将DeepSeek-R1接入WPS,手把手教程!
摘要: 不得不说,将DeepSeek-R1接入WPS真的惊呆我了!这意味着什么?简单来说,文档编辑从“手动挡”进化成了“自动挡”!不管是生成内容、优化表达,甚至是逻辑推理分析,AI都能直接帮你搞定,爽到飞起! 今天就来给大家聊聊,如何在WPS里接入 DeepSeek-R1,一步步带你从零配置到实战,让AI真
阅读全文
posted @ 2025-02-11 14:17 雨梦山人
阅读(11103)
评论(1)
推荐(2)
[置顶]
手把手教学,DeepSeek-R1微调全流程拆解
摘要: 概述 Unsloth是一个支持Llama系列、DeepSeek R1系列更快速,更少占用内存的微调库。最近提供了DeepSeek-R1模型的复现与GRPO算法的高效实现,而GRPO算法是DeepSeek模型中最关键的RL算法,而Unsloth增强优化了GRPO算法,使其使用更少的huggingfac
阅读全文
posted @ 2025-02-10 11:39 雨梦山人
阅读(25825)
评论(5)
推荐(2)
[置顶]
必看:DeepSeek-R1本地部署!超详细教程~
摘要: 最近国产AI大模型DeepSeek爆火出圈,登顶中美App Store下载榜,还在性能、性价比上碾压了ChatGPT和Google Gemini等硅谷巨头,直接杀入科技圈C位,成为现象级应用! 然而,不少小伙伴在使用的时候,经常会出现响应迟缓甚至宕机的情况👇 这可怎么办? 万幸的是,DeepSee
阅读全文
posted @ 2025-02-07 11:05 雨梦山人
阅读(33697)
评论(2)
推荐(2)
2025年9月29日
大模型提示词技巧Prompt Engineering,看这一篇就够了 - 知乎
摘要: 让模型听话,按照要求思考,关键就在Prompt。 前言 你在写prompt时候,是不是总觉得大模型它不听话。要么答非所问、要么一堆废话。扒开思考过程仔细阅读时而觉得它聪明绝顶,时而又觉得它愚蠢至极。明明已经对了怎么又推理到错的地方去了,明明在提示词中提醒过了不要这么思考它怎么就瞎想了。这也许就是每一
阅读全文
posted @ 2025-09-29 11:36 雨梦山人
阅读(1570)
评论(0)
推荐(0)
2025年9月20日
你的 RAG 还在“垃圾进,垃圾出”?我用这套流程,把“废料”文档变成了黄金知识库
摘要: 你的 RAG 还在“垃圾进,垃圾出”?我用这套流程,把“废料”文档变成了黄金知识库 最近大家关注Dify的进展的话,应该知道它的版本更新直接从1.8.0 >2.0.1了。跨越了一个大的版本。它本次的主要更新就在于知识库构建的知识流水线。 我认为Dify2.0以后的知识流水线会极大地降低了构建知识库的
阅读全文
posted @ 2025-09-20 23:46 雨梦山人
阅读(116)
评论(0)
推荐(0)
2025年8月20日
如何用AI Coding和Claude Code提升开发效率?看我的全流程复盘
摘要: 随着人工智能技术的迅速发展,AI Coding 工具已经成为我日常开发中提升效率的重要手段。前阵子参加了一个算法技术的 Hackathon 活动,全程使用 AI 进行写文档、出设计图、写代码,这次经历让我深刻体会到 AI 在加速开发流程中的巨大潜力。因此,我想分享一些自己在实际业务场景中使用 AI
阅读全文
posted @ 2025-08-20 16:39 雨梦山人
阅读(302)
评论(0)
推荐(0)
2025年6月10日
实操干货!MCP Server开发从0到1
摘要: 目录 MCP 协议简介 MCP 主要架构 MCP 开发踩坑经历 关于 AI 的感想 最近 Model Context Protocol ( MCP ) 概念大火,刚好它可以用 Node 或 Python 来编写,作为一名 web 前端程序猿,怎么可以错过这个工具的探索。文章是记录本人做 MCP Se
阅读全文
posted @ 2025-06-10 16:05 雨梦山人
阅读(630)
评论(0)
推荐(0)
2025年5月6日
为什么新手比专家更想做垂直领域SFT微调?
摘要: 随着人工智能的浪潮席卷全球,大语言模型(LLM)的应用正变得无处不在。在垂直领域的SFT微调(Supervised Fine-Tuning)作为提升模型专业能力的关键技术,吸引了无数目光。但你是否注意到一个奇怪的现象:相比经验丰富的专家,新手似乎对尝试SFT微调表现出了更大的热情?这究竟是为什么?是
阅读全文
posted @ 2025-05-06 13:57 雨梦山人
阅读(346)
评论(0)
推荐(0)
2025年4月22日
对话即服务:Spring Boot+MCP让你的CRUD系统秒变AI助手
摘要: 随着人工智能的飞速发展,大语言模型(LLM)正在革命性地重塑用户与软件的交互范式。 想象一下这样的场景:用户无需钻研复杂的API文档或者在繁琐的表单间来回切换,只需通过自然语言直接与系统对话——“帮我查找所有2023年出版的图书”、“创建一个新用户叫张三,邮箱是zhangsan@example.co
阅读全文
posted @ 2025-04-22 15:22 雨梦山人
阅读(606)
评论(0)
推荐(0)
2025年3月28日
MCP协议详解:一文读懂模型上下文协议
摘要: 本文主要介绍了 Anthropic 推出的开源协议 MCP(Model Context Protocol,模型上下文协议),能让你快速上手该协议,实现大型语言模型与外部数据源和工具的无缝集成。如果想要了解 MCP 协议可以收藏阅读! 1 基本概念 2 目标及优势 3 示例 - 工具 基本概念 MCP
阅读全文
posted @ 2025-03-28 09:28 雨梦山人
阅读(2280)
评论(0)
推荐(1)
2025年3月24日
离线部署大模型:ollama+deepseek+open-webui安装使用方法及常见问题解决
摘要: Ollama 是一个开源的本地大语言模型运行框架,它提供了非常简单便捷的使用形式,让用户可以十分方便的在本地机器上部署和运行大型语言模型,从而实现免费离线的方式使用 LLM 能力,并确保私有数据的隐私和安全性。 1 Ollama 安装 Ollama 支持多种操作系统,包括 macOS、Windows
阅读全文
posted @ 2025-03-24 16:57 雨梦山人
阅读(3543)
评论(0)
推荐(0)
2025年2月28日
【转】如何把 deepseek-R1 微调或蒸馏为某领域的一个专家?
摘要: 智能总结: 这篇文章深入探讨了如何通过微调技术来优化大语言模型(如 DeepSeek)的表现,使其在特定领域或任务中更具优势。文章首先解释了微调的必要性及其在特定领域中的应用场景,并将微调与长文本处理、知识库的使用进行对比,帮助读者理解何时选择微调。接着,文章详细介绍了微调的基本流程,包括选择预训练
阅读全文
posted @ 2025-02-28 16:04 雨梦山人
阅读(1519)
评论(0)
推荐(0)
2025年2月17日
DeepSeek微调教程(代码版)
摘要: 前言 DeepSeek系列大模型由杭州深度求索人工智能基础技术研究有限公司提供,该系列大模型有以下这些优势: 高性价比:DeepSeek-V2模型以其史无前例的性价比著称,推理成本被降到每百万token仅1块钱,约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。 架构创新:D
阅读全文
posted @ 2025-02-17 09:58 雨梦山人
阅读(15738)
评论(5)
推荐(3)
1
2
3
4
5
下一页
公告