网站地图 | Tags | 热门标准 | 最新标准 | 订阅

DB14/T 3443-2025 人工智能 汉语框架语义技术标注规范 第2部分:句子语义标注

  • 名  称:DB14/T 3443-2025 人工智能 汉语框架语义技术标注规范 第2部分:句子语义标注 - 下载地址2
  • 类  别:地方标准规范
  • 下载地址:[下载地址2]
  • 提 取 码
  • 浏览次数:3
下载帮助: 发表评论 加入收藏夹 错误报告目录
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表
新闻评论(共有 0 条评论)

资料介绍

《DB14/T 3443-2025 人工智能汉语框架语义技术标注规范 第2部分:句子语义标注》主要内容的详细总结:


一、范围

  • 适用对象​:
    • 数据标注方:开展汉语框架句子语义标注的训练数据标注活动。
    • 数据需求方/第三方机构:参照执行数据验收、安全性评估等活动。
  • 核心内容​:规定句子语义标注的术语定义、标注内容、格式、流程及方法。

二、规范性引用文件

  • 基础标准​:
    • 必须引用《DB14/T 3442-2025 人工智能汉语框架语义技术标注规范 第1部分:框架构建》。
  • 起草依据​:遵循GB/T 1.1-2020《标准化工作导则》。

三、术语和定义

  1. 句子语义标注
    • 基于框架语义,对句子中词或短语的语义角色进行标记的过程。
  2. 短语
    • 语义和语法可搭配的两个及以上词的组合。
  3. 连谓结构
    • 谓词或谓词结构连用的格式(如“去吃饭”“有权利反对”)。

四、标注内容

  • 三大要素​:
    1. 目标词​:激起特定框架的核心词(如动词“拥有”)。
    2. 框架​:目标词对应的图式化场景(如“[拥有]框架”)。
    3. 语义角色​:句子成分在框架中扮演的元素(如“所有者”“拥有物”)。
  • 示意图​(图1):
    • 展示目标词、框架名称、句子成分与语义角色的关联关系。

五、标注格式

  1. 目标词标记​:
    • 格式:<tgt=框架名称 目标词>
    • 示例:<tgt=拥有 怀着>
  2. 语义角色标记​:
    • 格式:<框架元素缩写 标注成分>
    • 示例:<owner 每个人>
  3. 格式规范​:
    • 尖括号<>包裹标注内容,元素缩写与成分间需空格。
    • 标注符号与原文文字间需空格分隔(如<owner 每个人> 都)。

六、标注流程​(图2)

  1. 步骤​:
    • 确定目标词​:识别句子中可激发框架的词(如动词、名词)。
    • 匹配框架​:根据目标词语义选定对应框架(如“拥有”匹配[拥有]框架)。
    • 标注语义角色​:为相关句子成分标注框架元素(如“每个人”标注为owner)。
  2. 多目标词处理​:
    • 句子含多个目标词时,需分别独立标注。

七、标注方法

1. 标注范围

  • 必须标注所有与目标词语义相关的句子成分。

2. 连谓结构的特殊标注

语义关系 标注规则 示例
动作先后(后者为目的) 后者标注为目的 “去(目标词)吃饭” → 标注“吃饭”为目的
伴随动作 另一动词标注为并行事件 “边走边唱” → “唱”标注为并行事件
携带/陪同类动词 动词及宾语标注为伴随者 “带孩子看病” → “带孩子”标注为伴随者
“有+抽象名词” 前者及宾语标注为根据 “有权利反对” → “有权利”标注为根据

3. 无需标注的情况

  • 语言成分​:
    • 无实义词(如虚词“的”“了”)、否定副词(如“不”)、古汉语句式。
  • 目标词场景​:
    • “去”无实义(例:去改变中“去”不标注)。
    • 携带类动词(如“带”)做目标词时,其他谓词不标注。
    • 无合适框架匹配的目标词。
  • 结构限制​:
    • 连谓结构超过两个谓语时,不标注额外成分。

附录A:框架信息示例

  • 示例框架​:[拥有](Possession)
    元素类型 中文名称 缩写 定义
    核心元素 所有者 owner 拥有某物的实体(如“每个人”)
    核心元素 拥有物 possio 被拥有的东西(如“梦想”)
    非核心元素 形容 depic 描述所有者/拥有物的状态
  • 词元示例​:
    • “有”(动词):他有五辆汽车。 → 激活[拥有]框架。

核心逻辑总结

  1. 以框架为中心​:目标词决定语义框架,句子成分按框架角色标注。
  2. 中文特异性处理​:重点规范连谓结构等中文特殊句式的标注规则。
  3. 操作标准化​:通过格式、流程、附录示例确保标注一致性和可操作性。

此标准为汉语语义分析提供了结构化标注方案,尤其适用于AI训练数据构建及自然语言处理任务。

1721367834172
下载排行 | 下载帮助 | 下载声明 | 信息反馈 | 网站地图  360book | 联系我们谢谢