AI学习 - 诊断结论信息抽取 - LabelStudio 标注 -- 结论标注

将结论存放 X.txt 中,每个结论一个文件,准备50条,进行结论标注

选择项目: Import
image
Upload More Files
image
image
image

修改标注模板

<View>
  <!-- 实体标注部分 -->
  <Labels name="entity" toName="text">
    <Label value="指标名称" background="#FFA39E"/>
    <Label value="数值" background="#D4380D"/>
    <Label value="单位" background="#FFC069"/>
    <Label value="日期时间" background="#FFD666"/>
    <Label value="诊断结论" background="#95DE64"/>
    <Label value="事件类型" background="#5CDBD3"/>
    <Label value="占比/频率" background="#69C0FF"/>
  </Labels>

  <!-- 关系标注部分 -->
  <Relations name="relation" toName="text">
    <Relation value="测量值" background="#FFA39E"/>
    <Relation value="发生时间" background="#69C0FF"/>
    <Relation value="属于诊断" background="#95DE64"/>
    <Relation value="包含事件" background="#5CDBD3"/>
    <Relation value="统计占比" background="#FFD666"/>
  </Relations>

  <Text name="text" value="$text"/>
</View>

标注流程示例(针对你提供的文本):

第一步:标注实体

  • 平均心率指标名称
  • 71数值
  • 次/分单位
  • 最快心率指标名称
  • 123数值
  • 次/分单位
  • 01-13 08:28:51日期时间
  • 最慢心率指标名称
  • 48数值
  • 次/分单位
  • 01-14 02:25:11日期时间

第二步:标注关系(关键步骤)

  1. 平均心率 连接到 71测量值
  2. 平均心率 连接到 次/分测量值
  3. 最快心率 连接到 123测量值
  4. 最快心率 连接到 次/分测量值
  5. 最快心率 连接到 01-13 08:28:51发生时间
  6. 最慢心率 连接到 48测量值
  7. 最慢心率 连接到 次/分测量值
  8. 最慢心率 连接到 01-14 02:25:11发生时间
  9. 窦性心律(诊断结论)连接到 心率波动于48次/分--123次/分之间属于诊断
  10. 心动过速事件 连接到 持续时间占总时间的3.6%统计占比

为什么需要关系标注?

  1. 保持语义完整性最快心率是123次/分,发生于01-13 08:28:51 是一个完整的事实
  2. 支持下游应用
    • 知识图谱构建:实体作为节点,关系作为边
    • 结构化存储:可以转换为JSON格式:
      {
        "最快心率": {
          "数值": 123,
          "单位": "次/分",
          "发生时间": "01-13 08:28:51"
        }
      }
      
  3. 符合医疗文档特点:医疗报告通常包含“指标-数值-单位-时间”的完整链条

实际操作建议:

  1. 先标注实体,再标注关系
  2. 关系标注时:点击第一个实体(起点),然后点击第二个实体(终点),选择关系类型
  3. 考虑数据的最终用途
    • 如果只需要提取离散值,简单的NER可能够用
    • 如果需要理解“谁和谁相关”,必须用关系标注

这样标注后,你的数据可以更好地支持后续的分析、可视化或临床决策支持系统的开发。

posted @ 2026-01-19 10:34  VipSoft  阅读(2)  评论(0)    收藏  举报