合集-深度学习&机器学习 操作tips

摘要:原理分析: BiLSTM(双向长短期记忆网络) 是一种循环神经网络(RNN)的变体,它在自然语言处理任务中非常有效,其中包括给定一个长句子预测下一个单词。 这种效果的主要原因包括以下几点: 长短期记忆网络(LSTM)结构:LSTM 是一种特殊的 RNN,专门设计用于解决长序列依赖问题。相比于普通的 阅读全文
posted @ 2024-04-09 23:45 江左子固 阅读(4619) 评论(0) 推荐(2)
摘要:案例二:对文本进行分类,类别有财经、房产、股票、教育、科技、社会、时政、体育、游戏、娱乐 github代码链接点击此文本分类 原作者给出了好几种模型 此次仅针对BiLSTM模型分析。 核心代码如下: class Model(nn.Module): def __init__(self, config) 阅读全文
posted @ 2024-04-10 01:33 江左子固 阅读(672) 评论(0) 推荐(0)
摘要:ResNet (Residual net)是残差网络的通用概念,而 ResNet50 是一个具体的网络结构,其由50个卷积层组成。ResNet50 是指包含了50个卷积层(包括卷积层、池化层、全连接层等)的 ResNet 网络。ResNet50 是基于 ImageNet 数据集上的训练所提出的一个具 阅读全文
posted @ 2024-04-16 15:48 江左子固 阅读(1556) 评论(1) 推荐(0)
摘要:1. 张量 张量(Tensor)是一个数学对象,可以看作是向量和矩阵的推广。在数学和物理学中,张量被用来描述多维空间中的量,这些量可能具有多个方向和大小。 张量的定义和性质如下: 阶数(Order):张量的阶数表示张量的维度。一个标量(Scalar)是0阶张量,一个向量(Vector)是1阶张量,一 阅读全文
posted @ 2024-12-21 20:47 江左子固 阅读(208) 评论(0) 推荐(0)
摘要:1. 什么是回归问题 回归问题(Regression Problem)是机器学习中的一种任务,它的目标是预测一个连续值作为输出。这与分类问题不同,分类问题是预测离散的标签。回归问题在很多领域都有应用,比如房价预测、股票价格预测、天气预测等。 以下是回归问题的一些关键点: 目标变量(Target Va 阅读全文
posted @ 2024-12-26 00:39 江左子固 阅读(127) 评论(0) 推荐(0)
摘要:记录一下Python学习过程中的一些问题: 1. 在JupyterLab中查询当前文件的地址 import os print(os.getcwd()) #查询该文件的地址 2. 新建cell 在 JupyterLab 中新建一个单元格(cell)的方法有多种,以下是一些常用的方法: 使用快捷键: B 阅读全文
posted @ 2025-01-04 16:01 江左子固 阅读(337) 评论(0) 推荐(0)
摘要:1. class类的定义 在 Python 中,class 是一种用户自定义的数据类型,它允许你根据需要创建自己的对象。类提供了一种方式来封装数据和与数据相关的操作。以下是类的一些基本概念: 定义类:使用关键字 class 来定义一个类,后跟类名和一对圆括号,其中可以包含一个父类的名称(用于继承)。 阅读全文
posted @ 2025-01-04 20:16 江左子固 阅读(114) 评论(0) 推荐(0)
摘要:1. Python的整数支持任意长度 Python 的整数类型(int)支持任意长度,这意味着你可以根据需要创建任意大小的整数,不受固定位数的限制。这与某些编程语言(如 C 或 Java)中的整数类型不同,这些语言的整数类型有固定的位数,例如 32 位或 64 位,因此它们能表示的整数范围是有限的。 阅读全文
posted @ 2025-01-05 01:19 江左子固 阅读(60) 评论(0) 推荐(0)
摘要:1. Python中字符串的相加和相乘 在Python中,字符串可以通过加号(+)进行相加(连接),也可以通过乘号(*)进行相乘(重复)。以下是这两种操作的详细说明和示例: 字符串的相加(连接) 字符串的相加是通过使用加号(+)运算符来实现的。它将两个或多个字符串连接成一个单一的字符串。 str1 阅读全文
posted @ 2025-01-05 11:00 江左子固 阅读(178) 评论(0) 推荐(0)
摘要:1. Python的流程控制 tips:我使用的Python3.9版本,if、else是要加:的 Python的流程控制主要通过条件语句和循环语句来实现,它们允许程序根据特定的条件执行不同的代码块。以下是Python中常用的流程控制结构: 条件语句(if-elif-else) 条件语句允许程序根据条 阅读全文
posted @ 2025-01-05 18:24 江左子固 阅读(47) 评论(0) 推荐(0)
摘要:1. NumPy介绍 这张图片介绍了Python中两个非常重要的科学计算库:NumPy和SciPy,以及它们的核心功能和特性。 NumPy NumPy(Numerical Python)是一个开源的Python科学计算库,用于进行大规模数值和矩阵运算。以下是图片中提到的NumPy的关键特性: Num 阅读全文
posted @ 2025-01-06 00:07 江左子固 阅读(247) 评论(0) 推荐(0)
摘要:1. 介绍一下下面这张图 推荐系统自己还差点就去研究了 这张图片概述了几种数据分析和机器学习的应用场景,包括推荐系统、网页搜索、舆情分析、关联规则、社交网络分析以及天气预测。下面是对每个部分的详细解释: 推荐系统 用户u, 商品i:推荐系统旨在为特定用户(u)推荐商品(i)。 预测用户对商品i的感兴 阅读全文
posted @ 2025-01-06 01:06 江左子固 阅读(64) 评论(0) 推荐(0)
摘要:在许多现代计算任务中,尤其是在深度学习和自然语言处理领域,Q(Query)、K(Key)和V(Value)是处理信息的核心概念之一,通常用于自注意力机制(Self-Attention Mechanism),如Transformer模型。 下面我将详细介绍 Q、K 和 V 在这种背景下的含义: Q(Q 阅读全文
posted @ 2025-08-14 17:07 江左子固 阅读(222) 评论(0) 推荐(0)
摘要:问题总结:nan 问题 现象: 在训练过程中,训练损失(Train Loss)和测试损失(Test Loss)的值变为 nan(Not a Number)。这通常意味着训练过程中出现了数值计算错误或不稳定,导致无法计算出有效的损失值。同时,训练准确率和测试准确率(Train Accuracy 和 T 阅读全文
posted @ 2025-10-09 20:32 江左子固 阅读(29) 评论(0) 推荐(0)
摘要:在神经网络量化过程中,指数平滑法、直方图截断法和KL散度校准法都是用于优化量化过程中缩放因子的计算和选择的技术。这些方法通常旨在尽量减小量化误差,保持模型性能。下面分别解释这三种方法: 1. 指数平滑法(Exponential Smoothing) 基本思路:指数平滑法是一种时间序列分析方法,常用于 阅读全文
posted @ 2025-10-11 16:25 江左子固 阅读(15) 评论(0) 推荐(0)