摘要: 重点: ①有的模型只能进行instance级别的representation,本文是任意层级 ②选取positive pair 的原则是:模型根据不同上下文对于同一个时间戳的representation应当一致。 ③随机剪裁层保证了模型不会只学到绝对位置信息而忽视了上下文信息。 疑问 ①本模型在ET 阅读全文
posted @ 2021-11-01 18:27 邢云鹏19231177 阅读(1774) 评论(0) 推荐(0) 编辑