摘要:
1.Broadcasting Broadcasting能够实现Tensor自动维度增加(unsqueeze)与维度扩展(expand),以使两个Tensor的shape一致,从而完成某些操作,主要按照如下步骤进行: 从最后面的维度开始匹配(一般后面理解为小维度); 在前面插入若干维度,进行unsqu 阅读全文
摘要:
任务:构建字符级语言模型来生成新的名称 1.数据集与预处理 读取恐龙名称的数据集,创建一个唯一字符列表(a-z和\n),\n充当EOS名称结束的作用。 1 import numpy as np 2 import random 3 import time 4 import cllm_utils 5 6 阅读全文