上一页 1 ··· 12 13 14 15 16 17 18 19 20 ··· 24 下一页
摘要: 是的,在最简单的线性模型 y = wx + b 中,参数确实只有两个:权重 w 和偏置 b。这是深度学习中最基础的参数概念示例。我们可以通过 PyTorch 代码来验证这一点: python 运行 import torch import torch.nn as nn # 定义一个最简单的线性模型 c 阅读全文
posted @ 2025-06-18 01:43 m516606428 阅读(30) 评论(0) 推荐(0)
摘要: 在深度学习大模型的语境中,“671b 的大模型参数” 与 “671B 向量” 是两个完全不同的概念,二者在定义、物理意义和体现方式上存在显著差异。以下是具体解析: 一、核心概念区分:参数≠向量 1. 大模型参数(Parameters)的本质 定义:参数是模型中可学习的权重(Weight)和偏置(Bi 阅读全文
posted @ 2025-06-18 01:42 m516606428 阅读(83) 评论(0) 推荐(0)
摘要: import torchimport torch.nn as nnimport torch.optim as optimfrom torch.cuda.amp import autocast, GradScalerimport timeimport numpy as npimport os# 设置随 阅读全文
posted @ 2025-06-18 01:40 m516606428 阅读(13) 评论(0) 推荐(0)
摘要: import torchimport torch.nn as nnimport torch.optim as optimfrom torch.cuda.amp import autocast, GradScalerimport timeimport numpy as npimport os# 设置随 阅读全文
posted @ 2025-06-18 01:38 m516606428 阅读(333) 评论(0) 推荐(0)
摘要: 自注意力机制、Transformer 和 "Attention is All You Need" 大白话讲解 一、什么是注意力机制?—— 先理解人类的 “关注点” 比如你看一句话:“我今天去超市买了苹果和香蕉”。当你理解这句话时,大脑不会逐字扫描,而是会 “关注” 关键信息: 看到 “买了” 时,会 阅读全文
posted @ 2025-06-18 01:21 m516606428 阅读(94) 评论(0) 推荐(0)
摘要: 在 Python 中实现语音转文字(STT, Speech-to-Text)主要有两种方式:调用第三方 API(简单、准确,但可能有费用或限制)和本地部署模型(免费、隐私安全,但需要配置资源)。以下是具体实现方法: 一、使用第三方 API(以 OpenAI Whisper API 为例) 优点:准确 阅读全文
posted @ 2025-06-18 01:13 m516606428 阅读(310) 评论(0) 推荐(0)
摘要: 大模型训练调优,就是让预训练好的大模型(像 GPT、BERT 这些),通过一系列操作变得更适配特定任务或领域,大白话拆解关键要点: 一、核心步骤(给模型 “定制改造” 流程) 选任务与数据:先明确要让模型干啥,是分类、生成文案还是问答,接着准备对应高质量标注数据(几百到几千样本起步),还得把数据格式 阅读全文
posted @ 2025-06-18 01:11 m516606428 阅读(210) 评论(0) 推荐(0)
摘要: 这仨概念看着玄乎,用大白话拆成生活场景,秒懂它们咋给 AI “升级” : 一、微调(Fine - Tuning)—— 给 AI 上 “定制私教课” 场景类比:你请了个全科家教(大模型),但你想冲刺数学竞赛。于是把 “竞赛真题、解题技巧” 整理成资料,让家教针对性学这些,学完后教你数学竞赛题更厉害。 阅读全文
posted @ 2025-06-18 01:06 m516606428 阅读(79) 评论(0) 推荐(0)
摘要: 能否语音输入输出 prompt 能实现语音输入输出,需结合语音识别(ASR)、大模型推理、语音合成(TTS) 技术流程。 本地实现思路 语音转文本(ASR):用开源工具(如 PaddleSpeech、Whisper ),把麦克风采集的语音转成文字 prompt。 大模型推理:调用本地部署的大模型(如 阅读全文
posted @ 2025-06-18 00:55 m516606428 阅读(27) 评论(0) 推荐(0)
摘要: RAG(检索增强生成,Retrieval - Augmented Generation )本质不只是把 PDF 等信息切片成 context 输入大模型,它是先对 PDF 等文档进行拆分、向量化等处理构建检索库,当有请求时,从库中检索相关片段(context ),再结合大模型生成回答,核心是用外部知 阅读全文
posted @ 2025-06-18 00:54 m516606428 阅读(8) 评论(0) 推荐(0)
上一页 1 ··· 12 13 14 15 16 17 18 19 20 ··· 24 下一页