摘要: 1.Broadcasting Broadcasting能够实现Tensor自动维度增加(unsqueeze)与维度扩展(expand),以使两个Tensor的shape一致,从而完成某些操作,主要按照如下步骤进行: 从最后面的维度开始匹配(一般后面理解为小维度); 在前面插入若干维度,进行unsqu 阅读全文
posted @ 2020-07-03 23:10 最咸的鱼 阅读(4209) 评论(0) 推荐(0) 编辑
摘要: 任务:构建字符级语言模型来生成新的名称 1.数据集与预处理 读取恐龙名称的数据集,创建一个唯一字符列表(a-z和\n),\n充当EOS名称结束的作用。 1 import numpy as np 2 import random 3 import time 4 import cllm_utils 5 6 阅读全文
posted @ 2020-07-03 16:40 最咸的鱼 阅读(399) 评论(0) 推荐(0) 编辑