会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
雨梦山人
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
下一页
2025年3月28日
MCP协议详解:一文读懂模型上下文协议
摘要: 本文主要介绍了 Anthropic 推出的开源协议 MCP(Model Context Protocol,模型上下文协议),能让你快速上手该协议,实现大型语言模型与外部数据源和工具的无缝集成。如果想要了解 MCP 协议可以收藏阅读! 1 基本概念 2 目标及优势 3 示例 - 工具 基本概念 MCP
阅读全文
posted @ 2025-03-28 09:28 雨梦山人
阅读(2472)
评论(0)
推荐(1)
2025年3月24日
离线部署大模型:ollama+deepseek+open-webui安装使用方法及常见问题解决
摘要: Ollama 是一个开源的本地大语言模型运行框架,它提供了非常简单便捷的使用形式,让用户可以十分方便的在本地机器上部署和运行大型语言模型,从而实现免费离线的方式使用 LLM 能力,并确保私有数据的隐私和安全性。 1 Ollama 安装 Ollama 支持多种操作系统,包括 macOS、Windows
阅读全文
posted @ 2025-03-24 16:57 雨梦山人
阅读(4211)
评论(0)
推荐(0)
2025年2月28日
【转】如何把 deepseek-R1 微调或蒸馏为某领域的一个专家?
摘要: 智能总结: 这篇文章深入探讨了如何通过微调技术来优化大语言模型(如 DeepSeek)的表现,使其在特定领域或任务中更具优势。文章首先解释了微调的必要性及其在特定领域中的应用场景,并将微调与长文本处理、知识库的使用进行对比,帮助读者理解何时选择微调。接着,文章详细介绍了微调的基本流程,包括选择预训练
阅读全文
posted @ 2025-02-28 16:04 雨梦山人
阅读(1587)
评论(0)
推荐(0)
2025年2月17日
DeepSeek微调教程(代码版)
摘要: 前言 DeepSeek系列大模型由杭州深度求索人工智能基础技术研究有限公司提供,该系列大模型有以下这些优势: 高性价比:DeepSeek-V2模型以其史无前例的性价比著称,推理成本被降到每百万token仅1块钱,约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。 架构创新:D
阅读全文
posted @ 2025-02-17 09:58 雨梦山人
阅读(16312)
评论(5)
推荐(3)
2025年2月11日
将DeepSeek-R1接入WPS,手把手教程!
摘要: 不得不说,将DeepSeek-R1接入WPS真的惊呆我了!这意味着什么?简单来说,文档编辑从“手动挡”进化成了“自动挡”!不管是生成内容、优化表达,甚至是逻辑推理分析,AI都能直接帮你搞定,爽到飞起! 今天就来给大家聊聊,如何在WPS里接入 DeepSeek-R1,一步步带你从零配置到实战,让AI真
阅读全文
posted @ 2025-02-11 14:17 雨梦山人
阅读(11407)
评论(1)
推荐(2)
2025年2月10日
手把手教学,DeepSeek-R1微调全流程拆解
摘要: 概述 Unsloth是一个支持Llama系列、DeepSeek R1系列更快速,更少占用内存的微调库。最近提供了DeepSeek-R1模型的复现与GRPO算法的高效实现,而GRPO算法是DeepSeek模型中最关键的RL算法,而Unsloth增强优化了GRPO算法,使其使用更少的huggingfac
阅读全文
posted @ 2025-02-10 11:39 雨梦山人
阅读(26154)
评论(5)
推荐(2)
漫谈DeepSeek及其背后的核心技术
摘要: 导读:本文深入探讨了DeepSeek大模型的核心技术,从公司背景、模型能力、训推成本到核心技术细节进行了全面分析。 一、关于DeepSeek公司及其大模型 1.1 公司概况 DeepSeek 2023年7月成立于杭州,是幻方量化旗下的子公司,全称是杭州深度求索人工智能基础技术研究有限公司。 "成立时
阅读全文
posted @ 2025-02-10 11:31 雨梦山人
阅读(1804)
评论(0)
推荐(0)
2025年2月7日
RAG 在智能答疑中的探索
摘要: 一、背景 二、简介 什么是RAG RAG应用的可落地场景 RAG应用的主要组成部分 4. RAG应用的核心流程 三、实现目标 四、整体流程 技术选型 准确性思考 用户提问结构化 4. 数据预处理与向量库的准备工作 5. CO-STAR结构 6. 相似性搜索 用户提问解答 8. Runnable的结合
阅读全文
posted @ 2025-02-07 11:13 雨梦山人
阅读(168)
评论(0)
推荐(0)
必看:DeepSeek-R1本地部署!超详细教程~
摘要: 最近国产AI大模型DeepSeek爆火出圈,登顶中美App Store下载榜,还在性能、性价比上碾压了ChatGPT和Google Gemini等硅谷巨头,直接杀入科技圈C位,成为现象级应用! 然而,不少小伙伴在使用的时候,经常会出现响应迟缓甚至宕机的情况👇 这可怎么办? 万幸的是,DeepSee
阅读全文
posted @ 2025-02-07 11:05 雨梦山人
阅读(34081)
评论(2)
推荐(2)
2024年10月16日
管理小团队和大团队,有什么区别?
摘要: 人越少越难管,人越少越麻烦。 人代表着资源,人越多越好管。 多代表着可试错的机会增多,同时可借势的机会增多。 往往人越少的团队在面对问题的时候越是争议不下,因为都不想自己吃亏。 01/团队组织框架不同 5个人和50个人明显的不同就是人数上的区别。 影响过来就是团队内部的职级设置肯定大有不同。 人多代
阅读全文
posted @ 2024-10-16 09:41 雨梦山人
阅读(465)
评论(0)
推荐(0)
上一页
1
2
3
4
5
下一页
公告