上一页 1 ··· 3 4 5 6 7
摘要: 本文主要介绍常见的二十三种设计模式,初窥一二 阅读全文
posted @ 2020-04-18 16:49 Aurelius84 阅读(136) 评论(0) 推荐(0)
摘要: 在训练深度学习模型时,常想一窥网络结构中的attention层权重分布,观察序列输入的哪些词或者词组合是网络比较care的。在小论文中主要研究了关于词性POS对输入序列的注意力机制。同时对比实验采取的是words的self-attention机制。 阅读全文
posted @ 2020-04-18 15:14 Aurelius84 阅读(5179) 评论(1) 推荐(1)
摘要: 对机器学习感兴趣的小伙伴,可以借助python,实现一个N-gram分词中的Unigram和Bigram分词器,来进行入门。 此项目并将前向最大切词FMM和后向最大切词的结果作为Baseline,对比分析N-gram分词器在词语切分正确率、词义消歧和新词识别等方面的优势。 阅读全文
posted @ 2020-04-18 15:10 Aurelius84 阅读(3496) 评论(0) 推荐(1)
摘要: 前言 本文翻译自 An overview of gradient descent optimization algorithms 概要 梯度优化算法,作为各大开源库(如Tensorflow,Keras,PyTorch等)中重要的黑盒子,在网络训练中至关重要,拥有很强的魔力(实用性),但官网一般很少介 阅读全文
posted @ 2020-04-17 12:53 Aurelius84 阅读(1639) 评论(0) 推荐(0)
上一页 1 ··· 3 4 5 6 7