摘要: huggingface下载的.arrow数据集读取与使用说明 from datasets import load_from_disk from datasets import load_dataset dataset_cnn = load_dataset("ccdv/cnn_dailymail", 阅读全文
posted @ 2023-11-21 16:58 michaelchengjl 阅读(379) 评论(0) 推荐(0) 编辑
摘要: NLP QA数据集 数据文档 背景描述 CNN/Daily Mail(简称CNN/DM)作为单文本摘要语料库,每篇摘要包含多个摘要句。数据集最初是从美国有限新闻网(CNN)和每日邮报网(Daily Mail)收集的约100万条新闻数据作为机器阅读理解语料库。后来进行简单改动,形成用于单文本生成式摘要 阅读全文
posted @ 2023-11-21 11:08 michaelchengjl 阅读(55) 评论(0) 推荐(0) 编辑