会员
周边
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
csjywu01
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
7
8
9
10
11
12
13
14
15
下一页
2024年10月23日
传递更新
摘要: 根据你的需求,这里是对于如何基于 local_protein_ids 构建矩阵并进行消息传递的解释和注释。 任务概述 构建矩阵:基于 local_protein_ids,为每个局部蛋白质构建一个矩阵。矩阵中的每个元素表示两个残基的组合,通过 MLP 生成对应的特征向量。 有向特性:矩阵是有向的,因此
阅读全文
posted @ 2024-10-23 10:27 GraphL
阅读(51)
评论(0)
推荐(0)
2024年10月21日
Towards Explainable Traffic Flow Prediction with Large Language Models
摘要: 数据格式 prompt的三种格式 System prompts chain-of-thought Multi-modal spatial-temporal(ST) text prompts. <s>[INST]<<SYS>> Role: You are an expert traffic volum
阅读全文
posted @ 2024-10-21 13:29 GraphL
阅读(198)
评论(0)
推荐(0)
LORA
摘要: 所以我可以理解成这些是在定义LoRA 模块的网络么 是的,可以这么理解。这些参数实际上是在 定义 LoRA 模块要插入的网络位置。具体来说,通过 target_modules 参数,代码指定了 LoRA 应该注入 LLaMA 模型的哪些层,以实现轻量化微调。 LoRA 模块的网络定义:如何理解? L
阅读全文
posted @ 2024-10-21 11:20 GraphL
阅读(622)
评论(0)
推荐(0)
2024年10月18日
大模型中的回归通常是指什么,自回归又是指什么
摘要: 在大模型(如语言模型、时间序列模型等)中,回归(regression)通常指的是通过输入变量预测一个连续的输出变量。这种技术被广泛用于需要预测具体数值的场景,例如: 在语言模型中,回归可以用来预测句子的情感评分。 在时间序列模型中,可以用于预测未来的温度、股价等连续数值。 回归的目标是找到输入与输出
阅读全文
posted @ 2024-10-18 16:12 GraphL
阅读(916)
评论(0)
推荐(0)
OpenCity: Open Spatio-Temporal Foundation Models for Traffic Prediction
摘要: 1. 数据准备 在这个数据处理过程中,以数据集 PEMS07M 为例,整个数据抽取和划分过程如下: 初始数据维度: 原始训练数据 data_train 的维度为 (12672, 228, 3)。其中: 12672 表示时间步数,代表不同的时间点采样的数据。 228 表示空间节点数(例如不同的交通站点
阅读全文
posted @ 2024-10-18 15:33 GraphL
阅读(305)
评论(0)
推荐(0)
2024年10月12日
Spatial-Temporal Large Language Model for Traffic Prediction
摘要: 1. 输入数据 这符合时间序列预测的典型设置: 输入数据包含多个特征(如历史的流量、天气、时间等),这些特征用于帮助模型进行预测。 输出数据则通常是要预测的目标变量,比如未来某个时间步的流量或温度,这个目标变量是一个单一的值,因此输出通道数是 1。 x_train 包含多个特征(3 个通道),作为模
阅读全文
posted @ 2024-10-12 21:47 GraphL
阅读(240)
评论(0)
推荐(0)
Conv1d vs. Conv2d
摘要: 是的,您的理解完全正确!线性层(Linear)和卷积层(特别是1维卷积和2维卷积)的计算确实有本质上的区别,其中主要的区别之一是卷积有“滑动(rolling)”的概念,而线性层没有。以下是更详细的对比: 1. 线性层(Linear)的计算特点 线性层(Linear 层,或称为全连接层)直接将输入的每
阅读全文
posted @ 2024-10-12 21:20 GraphL
阅读(612)
评论(0)
推荐(0)
2024年10月11日
通道的比较
摘要: 感谢澄清!让我更详细地解释原来代码中的 torch.bmm(coord_diff, coord_diff.transpose(-1, -2)) 与后续改进后的实现之间的区别。 原始代码的含义 coord_diff = coord[row] - coord[col] # [n_edge, 14, 3]
阅读全文
posted @ 2024-10-11 17:21 GraphL
阅读(73)
评论(0)
推荐(0)
2024年10月8日
GET代码学习
摘要: 这段代码展示了如何将数据从 DataFrame 形式转化为 “blocks” 的过程。具体来说,它通过处理 DataFrame 的每一行(每一行代表一个原子),将它们按残基(residue)分组,每个组被称为一个 "block"。以下是对代码的详细分析,解释如何将数据转化为 "block"。 主要步
阅读全文
posted @ 2024-10-08 00:45 GraphL
阅读(146)
评论(0)
推荐(0)
2024年10月7日
大模型配置学习
摘要: 为什么在import里有一个GPT2,然后,在代码里面又有一个from pretrained gpt2 在 import 部分引入了 GPT2Model 后,在代码中使用 GPT2Model.from_pretrained("gpt2") 来加载预训练的模型。这样做的原因是,import 只是引入了
阅读全文
posted @ 2024-10-07 14:52 GraphL
阅读(599)
评论(0)
推荐(0)
上一页
1
···
7
8
9
10
11
12
13
14
15
下一页
公告