m516606428

2025年6月18日

摘要：是的，在最简单的线性模型 y = wx + b 中，参数确实只有两个：权重 w 和偏置 b。这是深度学习中最基础的参数概念示例。我们可以通过 PyTorch 代码来验证这一点： python 运行 import torch import torch.nn as nn # 定义一个最简单的线性模型 c 阅读全文

posted @ 2025-06-18 01:43 m516606428 阅读(30) 评论(0) 推荐(0)

核心概念区分：参数≠向量

摘要：在深度学习大模型的语境中，“671b 的大模型参数” 与 “671B 向量” 是两个完全不同的概念，二者在定义、物理意义和体现方式上存在显著差异。以下是具体解析：一、核心概念区分：参数≠向量 1. 大模型参数（Parameters）的本质定义：参数是模型中可学习的权重（Weight）和偏置（Bi 阅读全文

posted @ 2025-06-18 01:42 m516606428 阅读(83) 评论(0) 推荐(0)

gpu_benchmark.py

摘要： import torchimport torch.nn as nnimport torch.optim as optimfrom torch.cuda.amp import autocast, GradScalerimport timeimport numpy as npimport os# 设置随阅读全文

posted @ 2025-06-18 01:40 m516606428 阅读(13) 评论(0) 推荐(0)

：PyTorch GPU性能测试脚本

摘要： import torchimport torch.nn as nnimport torch.optim as optimfrom torch.cuda.amp import autocast, GradScalerimport timeimport numpy as npimport os# 设置随阅读全文

posted @ 2025-06-18 01:38 m516606428 阅读(333) 评论(0) 推荐(0)

自注意力机制、Transformer 和 "Attention is All You Need" 大白话讲解

摘要：自注意力机制、Transformer 和 "Attention is All You Need" 大白话讲解一、什么是注意力机制？—— 先理解人类的 “关注点” 比如你看一句话：“我今天去超市买了苹果和香蕉”。当你理解这句话时，大脑不会逐字扫描，而是会 “关注” 关键信息：看到 “买了” 时，会阅读全文

posted @ 2025-06-18 01:21 m516606428 阅读(94) 评论(0) 推荐(0)

语音转文字怎么做 python写

摘要：在 Python 中实现语音转文字（STT, Speech-to-Text）主要有两种方式：调用第三方 API（简单、准确，但可能有费用或限制）和本地部署模型（免费、隐私安全，但需要配置资源）。以下是具体实现方法：一、使用第三方 API（以 OpenAI Whisper API 为例）优点：准确阅读全文

posted @ 2025-06-18 01:13 m516606428 阅读(310) 评论(0) 推荐(0)

大模型训练调优

摘要：大模型训练调优，就是让预训练好的大模型（像 GPT、BERT 这些），通过一系列操作变得更适配特定任务或领域，大白话拆解关键要点：一、核心步骤（给模型 “定制改造” 流程）选任务与数据：先明确要让模型干啥，是分类、生成文案还是问答，接着准备对应高质量标注数据（几百到几千样本起步），还得把数据格式阅读全文

posted @ 2025-06-18 01:11 m516606428 阅读(210) 评论(0) 推荐(0)

微调蒸馏强化学习

摘要：这仨概念看着玄乎，用大白话拆成生活场景，秒懂它们咋给 AI “升级” ：一、微调（Fine - Tuning）—— 给 AI 上 “定制私教课” 场景类比：你请了个全科家教（大模型），但你想冲刺数学竞赛。于是把 “竞赛真题、解题技巧” 整理成资料，让家教针对性学这些，学完后教你数学竞赛题更厉害。阅读全文

posted @ 2025-06-18 01:06 m516606428 阅读(79) 评论(0) 推荐(0)

能否语音输入输出

摘要：能否语音输入输出 prompt 能实现语音输入输出，需结合语音识别（ASR）、大模型推理、语音合成（TTS）技术流程。本地实现思路语音转文本（ASR）：用开源工具（如 PaddleSpeech、Whisper ），把麦克风采集的语音转成文字 prompt。大模型推理：调用本地部署的大模型（如阅读全文

posted @ 2025-06-18 00:55 m516606428 阅读(27) 评论(0) 推荐(0)

RAG（检索增强生成，Retrieval - Augmented Generation ）

摘要： RAG（检索增强生成，Retrieval - Augmented Generation ）本质不只是把 PDF 等信息切片成 context 输入大模型，它是先对 PDF 等文档进行拆分、向量化等处理构建检索库，当有请求时，从库中检索相关片段（context ），再结合大模型生成回答，核心是用外部知阅读全文

posted @ 2025-06-18 00:54 m516606428 阅读(8) 评论(0) 推荐(0)

公告