2024 年 9月随笔档案 - 数据猎手小k

LawInstruct 数据集:由斯坦福大学、约翰霍普金斯大学和普林斯顿大学联合创建，最大法律大型指令数据集

摘要：2024-06-19，由斯坦福大学、约翰霍普金斯大学和普林斯顿大学等机构联合创建了LawInstruct数据集，这是目前法律智能领域最大的指令式数据集。该数据集覆盖了17个司法管辖区、24种语言，并包含了1200万条训练样本，旨在推动法律领域内机器学习模型的发展和评估。一、研究背景：随着人工智能阅读全文

posted @ 2024-09-29 16:26 数据猎手小k 阅读(73) 评论(0) 推荐(0)

BeanCounter数据集:一个新颖的、低毒性的、高质量的、大规模的商业领域特定数据集，足以训练数十亿参数的LLMs。

摘要：2024-09-26，芝加哥大学的研究者们发布了一个名为BeanCounter的大规模商业文本数据集。这个数据集的发布，不仅为语言模型的发展和评估提供了新的资源，还可能推动商业领域文本处理的进一步研究。一、研究背景在商业领域，准确的文本分析对于理解市场趋势、消费者行为、竞争情报等至关重要。然而，阅读全文

posted @ 2024-09-29 16:05 数据猎手小k 阅读(45) 评论(0) 推荐(0)

SUP-NeRF-ECCV2024数据集: 单目3D对象重建的新突破

摘要：2024-09-25，由Bosch Research North America和Michigan State University联合发布的SUP-NeRF，是一个基于单目图像进行3D对象重建的新型方法。一个无缝集成姿态估计和物体重建的统一网格。 ECCV：欧洲计算机视觉会议的缩写，它是计算机视觉阅读全文

posted @ 2024-09-27 18:11 数据猎手小k 阅读(104) 评论(0) 推荐(0)

CJEval:一个基于中国初中考试的多样化考试问题数据集

摘要：2024-09-26，由腾讯YouTu Lab和北京大学联合发布的CJEval，是一个基于中国初中生考试数据的评估基准，用于测试和分析大型语言模型（LLMs）在教育任务中的表现，从而提高在线教育平台的智能化水平。一、背景：在线教育平台已经显著改变了教育资源的传播，通过提供动态的数字化基础设施。阅读全文

posted @ 2024-09-27 17:31 数据猎手小k 阅读(47) 评论(0) 推荐(0)

DreamBench++：由清华大学和西安交通大学等联合创建：一种人机交互的个性化图像生成基准测试

摘要：2024-07-10，由清华大学和西安交通大学等机构联合创建的DreamBench++，这个任务目的是通过使用先进的多模态GPT模型来自动化评估，实现与人类评估一致的结果，从而提高个性化图像生成的可靠性和准确性。一、引言：个性化图像生成是人工智能中的一个活跃研究领域，其主要目标是根据用户提供的阅读全文

posted @ 2024-09-26 09:30 数据猎手小k 阅读(29) 评论(0) 推荐(0)

EMER：一个全新的视角来看待多模态情感识别问题

摘要：2024-07-10，由中国科学院自动化研究所、清华大学自动化系所联合创建EMER，这个任务目的通过提供预测情感的详细解释来提高情感识别的可靠性和准确性。一、引言：多模态情感识别是人工智能中的一个活跃研究领域，其主要目标是通过整合声音、视觉和语言等多种模态来识别人类的情绪状态。尽管近年来取得了显阅读全文

posted @ 2024-09-26 09:00 数据猎手小k 阅读(206) 评论(0) 推荐(0)

Vision Based Navigation ：针对航天领域的基于视觉导航机器学习应用生成训练数据集

摘要：2024-09-18 由欧洲空间局主导，由空客防务与空间公司参与创建Vision Based Navigation ，为空间任务中的基于视觉导航（VBN）机器学习应用生成训练数据集。目前遇到的困难和挑战 1、数据集的可用性和充分性：挑战：为机器学习算法提供足够的训练数据集，尤其是对于航天应用，阅读全文

posted @ 2024-09-21 21:22 数据猎手小k 阅读(47) 评论(0) 推荐(0)

最全高质量大模型 -偏好数据集（10/12号已更新）

摘要：大模型中的偏好数据集，就好比是给一个超级学霸特别定制的教材，这些教材里的内容都是这个学霸特别感兴趣或者特别擅长的。这样一来，学霸就能在这些领域里学得更快、更深入，而不是在所有科目上平均用力。简单来说，就是让大模型在它擅长或者感兴趣的领域里更加出色。偏好数据集的三个优点包括：提高效率：就像学霸专阅读全文

posted @ 2024-09-15 19:06 数据猎手小k 阅读(215) 评论(0) 推荐(0)

Kvasir-VQA：由挪威 SimulaMet 研究中心发布，用于胃肠诊断的全面图文对数据集

摘要：2024-09-04，由挪威 SimulaMet 研究中心更新提交Kvasir-VQA，该数据集扩展了现有的HyperKvasir和Kvasir-Instrument数据集，并增强了问答注释。目的是促进胃肠道（GI）诊断中的高级机器学习任务。背景介绍：人类胃肠道容易受到各种异常粘膜状况的阅读全文

posted @ 2024-09-12 09:00 数据猎手小k 阅读(76) 评论(0) 推荐(0)

数据集HumanVid：第一个针对人体图像动画的大规模高质量数据集

摘要：2024-07-28 ,由香港中文大学、上海市人工智能实验室共同创建HumanVid，是一项创新的大规模高质量数据集，专为人体图像动画而设计，它通过结合精心挑选的现实世界视频和合成数据，为视频和电影制作领域带来了突破性的工具。人类图像动画的任务目的：在从单个图像生成连贯的人类视频。为了增强可控阅读全文

posted @ 2024-09-11 09:00 数据猎手小k 阅读(92) 评论(0) 推荐(0)

H-ARC数据集：由纽约大学的心理学系和数据科学中心创建，分析和理解人类如何解决抽象推理问题

摘要：2024-09-03 ，由纽约大学的心理学系和数据科学中心创建H-ARC数据集，是一个包含所有提交和动作追踪的数据集，以分析和理解人类如何解决抽象推理问题。有助于揭示人类认知的复杂性，并为开发更智能、更接近人类思维方式的人工智能系统提供了重要的数据和见解。目前遇到困难和挑战：人工智能的挑战：阅读全文

posted @ 2024-09-10 10:25 数据猎手小k 阅读(50) 评论(0) 推荐(0)

MMMU-Pro:评估大规模多学科多模态理解和推理能力

摘要：2024-09-04，由MMMU 团队创建用于评估大规模多学科多模态模型的理解和推理能力的基准。目前遇到问题和挑战：文本依赖性问题：一些现有基准测试中的问题可以通过仅使用文本模型来回答，而不需要视觉信息。选项空间有限：在多项选择格式中，选项数量有限，模型可能通过猜测或利用选项之间的微妙线索来找阅读全文

posted @ 2024-09-09 09:00 数据猎手小k 阅读(238) 评论(0) 推荐(0)

GRAB：评估大型多模态模型在图分析任务上的性能

摘要：2024-08-22，由剑桥大学和香港大学联合创建GRAB，目标是通过包括广泛的图表类型和问题格式来全面评估前沿模型分析图形的能力。重点关注重要的分析任务，例如从图中提取关键属性和解释复杂的数据表示。目前遇到问题和挑战：现有基准测试的局限性：大型多模态模型在视觉任务上的表现已经非常出色，但现有阅读全文

posted @ 2024-09-08 15:25 数据猎手小k 阅读(45) 评论(0) 推荐(0)

CMM-Math：用于数学推理的中文多模态数据集

摘要：2024-09-05 ，由华东师范大学发布 CMM-Math ，是一个用于数学推理的多模态数据集，其中每个问题可能包含多个图像，专为 LMM 设计。目标是提升大型多模态模型的数学推理能力，展示了专门的数学语言模型在处理具有视觉背景的复杂数学问题方面的有效性。一、目前遇到问题和挑战： 1、中文多模态阅读全文

posted @ 2024-09-06 18:21 数据猎手小k 阅读(236) 评论(0) 推荐(0)

COIG-CQIA 由中科院深圳先进技术研究院、北京大学等联合发布高质量多样化中文指令微调数据集

摘要：2024-03-26 , 由中国科学院深圳先进技术研究院、北京大学、中国科学技术大学等联合发布数据集COIG-CQIA，这是一个高质量的中文指令微调数据集，包括问答和文章，以提供与人类互动一致的指令微调数据。一、目前遇到困难和挑战 1、语言和文化差异：中文具有独特的语言特征和文化深度，与英文存在阅读全文

posted @ 2024-09-06 16:47 数据猎手小k 阅读(78) 评论(0) 推荐(0)

IEPile:由浙江大学和蚂蚁集团等联合发布一个全面的双语信息抽取（IE）指令语料库

摘要：IEPile:由浙江大学和蚂蚁集团等联合发布一个全面的双语信息抽取（IE）指令语料库 2024-04-11 ，由浙江大学；蚂蚁集团；浙江大学-蚂蚁集团知识图谱联合实验室联合发布IEPile，一个全面的双语（英语和中文）IE指令语料库，包含约3.2亿个标记。现在目前遇到问题和挑战 1、大型语言模型（阅读全文

posted @ 2024-09-06 16:43 数据猎手小k 阅读(47) 评论(0) 推荐(0)

09 2024 档案

公告