摘要: 大模型高效微调(Finetune)教程——理论篇 一、为什么需要微调😕? 在开始学习微调之前,首先还是要搞清楚为什么要微调?在什么情况下需要微调? 我们平常接触到的大模型如 GPT、Deepseek-R1等都是基于海量的通用数据训练而成的,它们具备非常强大的语言理解和生成能力,能够处理多种自然语言 阅读全文
posted @ 2025-07-02 16:05 _Boreas 阅读(799) 评论(0) 推荐(0)
摘要: 大模型高效微调(Finetune)实战教程——以DeepSeek-R1-Distill-Qwen-7B为例 Unsloth是一个开源工具,专门用来加速大语言模型(LLMs)的微调过程。它的主要功能和优势包括: 🔭 高效微调:Unsloth 的微调速度比传统方法快 2-5 倍,内存占用减少 50%- 阅读全文
posted @ 2025-03-28 11:42 _Boreas 阅读(1036) 评论(0) 推荐(0)
摘要: 宋红康JDBC课程学习记录2 第3章:使用PreparedStatement实现CRUD操作 3.1 操作和访问数据库 数据库连接被用于向数据库服务器发送命令和 SQL 语句,并接受数据库服务器返回的结果。其实一个数据库连接就是一个Socket连接。 在 java.sql 包中有 3 个接口分别定义 阅读全文
posted @ 2024-04-11 16:05 _Boreas 阅读(40) 评论(0) 推荐(0)
摘要: 宋红康JDBC课程学习记录1 第1章:JDBC概述 1.1 数据的持久化 持久化(persistence):把数据保存到可掉电式存储设备中以供之后使用。大多数情况下,特别是企业级应用,数据持久化意味着将内存中的数据保存到硬盘上加以”固化”,而持久化的实现过程大多通过各种关系数据库来完成。 持久化的主 阅读全文
posted @ 2024-04-09 18:23 _Boreas 阅读(37) 评论(0) 推荐(0)