为什么llama用RMSnorm而不是layernorm
    
  nlp如此迷人 2024-02-02 11:30
    阅读:284 
    评论:0 
    推荐:0 
    
  
                阅读排行榜
    刘知远团队 大模型公开课 
    
  nlp如此迷人 2022-09-14 20:30
    阅读:276 
    评论:0 
    推荐:0 
    
  
                
    推荐模型之特征交叉PLOY2模型(特征交叉的开始)【学习笔记】
    
  nlp如此迷人 2022-05-16 19:43
    阅读:261 
    评论:0 
    推荐:0 
    
  
                
    关于CRF层的学习率【转载以学习、回忆】
    
  nlp如此迷人 2022-05-23 15:41
    阅读:255 
    评论:0 
    推荐:0 
    
  
                
    Debiased Contrastive Learning of Unsupervised Sentence Representation无监督句子表示中的对比学习去偏
    
  nlp如此迷人 2022-05-22 17:43
    阅读:248 
    评论:0 
    推荐:1 
    
  
                 
 
         浙公网安备 33010602011771号
浙公网安备 33010602011771号