AI学习 - 诊断结论信息抽取 - LabelStudio 标注 -- 结论标注
将结论存放 X.txt 中,每个结论一个文件,准备50条,进行结论标注
选择项目: Import

Upload More Files



修改标注模板
<View>
<!-- 实体标注部分 -->
<Labels name="entity" toName="text">
<Label value="指标名称" background="#FFA39E"/>
<Label value="数值" background="#D4380D"/>
<Label value="单位" background="#FFC069"/>
<Label value="日期时间" background="#FFD666"/>
<Label value="诊断结论" background="#95DE64"/>
<Label value="事件类型" background="#5CDBD3"/>
<Label value="占比/频率" background="#69C0FF"/>
</Labels>
<!-- 关系标注部分 -->
<Relations name="relation" toName="text">
<Relation value="测量值" background="#FFA39E"/>
<Relation value="发生时间" background="#69C0FF"/>
<Relation value="属于诊断" background="#95DE64"/>
<Relation value="包含事件" background="#5CDBD3"/>
<Relation value="统计占比" background="#FFD666"/>
</Relations>
<Text name="text" value="$text"/>
</View>
标注流程示例(针对你提供的文本):
第一步:标注实体
平均心率→ 指标名称71→ 数值次/分→ 单位最快心率→ 指标名称123→ 数值次/分→ 单位01-13 08:28:51→ 日期时间最慢心率→ 指标名称48→ 数值次/分→ 单位01-14 02:25:11→ 日期时间
第二步:标注关系(关键步骤)
- 从
平均心率连接到71→ 测量值 - 从
平均心率连接到次/分→ 测量值 - 从
最快心率连接到123→ 测量值 - 从
最快心率连接到次/分→ 测量值 - 从
最快心率连接到01-13 08:28:51→ 发生时间 - 从
最慢心率连接到48→ 测量值 - 从
最慢心率连接到次/分→ 测量值 - 从
最慢心率连接到01-14 02:25:11→ 发生时间 - 从
窦性心律(诊断结论)连接到心率波动于48次/分--123次/分之间→ 属于诊断 - 从
心动过速事件连接到持续时间占总时间的3.6%→ 统计占比
为什么需要关系标注?
- 保持语义完整性:
最快心率是123次/分,发生于01-13 08:28:51是一个完整的事实 - 支持下游应用:
- 知识图谱构建:实体作为节点,关系作为边
- 结构化存储:可以转换为JSON格式:
{ "最快心率": { "数值": 123, "单位": "次/分", "发生时间": "01-13 08:28:51" } }
- 符合医疗文档特点:医疗报告通常包含“指标-数值-单位-时间”的完整链条
实际操作建议:
- 先标注实体,再标注关系
- 关系标注时:点击第一个实体(起点),然后点击第二个实体(终点),选择关系类型
- 考虑数据的最终用途:
- 如果只需要提取离散值,简单的NER可能够用
- 如果需要理解“谁和谁相关”,必须用关系标注
这样标注后,你的数据可以更好地支持后续的分析、可视化或临床决策支持系统的开发。
本文来自博客园,作者:VipSoft 转载请注明原文链接:https://www.cnblogs.com/vipsoft/p/19500550
浙公网安备 33010602011771号