06 2024 档案

SentencePiece: A simple and language independent subword tokenizer and detokenizer for Neural Text Processing
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Abstract 本文介绍了一种用于基于神经的文本处理(包括神经机器翻译)的与语言相关的子词标记器(tokenizer)和去标记器(detokenizer)。它为子字单元提供了开源C++和Python实现。虽然现有的子词分割工具假设输入被 阅读全文

posted @ 2024-06-13 10:35 穷酸秀才大草包 阅读(167) 评论(0) 推荐(0)

Neural machine translation of rare words with subword units
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Abstract 神经机器翻译(NMT)模型通常使用固定的词汇,但翻译是一个开放的词汇问题。以前的工作是通过使用字典来翻译词汇表外的单词。在本文中,我们介绍了一种更简单有效的方法,通过将稀有且未知的单词编码为子单词单元序列,使NMT模型能 阅读全文

posted @ 2024-06-12 19:18 穷酸秀才大草包 阅读(110) 评论(0) 推荐(0)

LLaMA: Open and Efficient Foundation Language Models
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Abstract 我们介绍LLaMA,它是一组基础语言模型,参数范围从7B到65B。我们在数万亿的token上训练我们的模型,并表明完全使用公开可用的数据集训练最先进的模型是可能的,而无需求助于专有且不可访问的数据集。特别是,LLaMA- 阅读全文

posted @ 2024-06-12 16:55 穷酸秀才大草包 阅读(145) 评论(0) 推荐(0)

GLaMM : Pixel Grounding Large Multimodal Model
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Abstract 大型多模态模型(Large Multimodal Model, LMM)将大语言模型扩展到视觉领域。最初的LMM使用整体图像和文本提示词来生成无定位的文本响应。最近,区域级LMM已被用于生成视觉定位响应。然而,它们仅限于 阅读全文

posted @ 2024-06-08 19:20 穷酸秀才大草包 阅读(823) 评论(0) 推荐(0)

导航