09 2019 档案
摘要:1.从checkpoint中获取全部的变量名和变量值 tf.contrib.framework.list_variables(model_dir) tf.contrib.framework.load_variable(model_dir, var_name) 2.清除 tf.Session tf.r
阅读全文
摘要:1.BLEU 主要任务是为了将候选的n-gram和target的n-gram相比较,匹配相似度(与位置无关) 基本做法:比较翻译结果中和参考的n-gram个数,直接相除,问题是长句子会得分更高,限制句子长度加入惩罚参数,同时对不同的目标任务对n-gram赋予不同的权重 2.attention 的细节
阅读全文
摘要:1.离散采样不可导问题,使用gumbel采样方式将不可导部分拉出计算图 细节做法https://www.cnblogs.com/initial-h/p/9468974.html 2.关于NLLloss和cross entropy loss 的关系和区别 cross中是计算概率模型输出的概率p和真实的
阅读全文
摘要:1.在opennmt框架代码中ensemble的做法是在opennmt/utils/checkpoint.py 对模型中全部参数进行平均,平均后创建新的checkpoint 2.在nmt中https://github.com/tensorflow/nmt tensorflow的一个框架(工程师个人框
阅读全文

浙公网安备 33010602011771号