您当前的位置:首页 > DB14/T 3443-2025 人工智能 汉语框架语义技术标注规范 第2部分:句子语义标注 > 下载地址2
DB14/T 3443-2025 人工智能 汉语框架语义技术标注规范 第2部分:句子语义标注
- 名 称:DB14/T 3443-2025 人工智能 汉语框架语义技术标注规范 第2部分:句子语义标注 - 下载地址2
- 类 别:地方标准规范
- 下载地址:[下载地址2]
- 提 取 码:
- 浏览次数:3
发表评论
加入收藏夹
错误报告
目录| 新闻评论(共有 0 条评论) |
资料介绍
《DB14/T 3443-2025 人工智能汉语框架语义技术标注规范 第2部分:句子语义标注》主要内容的详细总结:
一、范围
- 适用对象:
- 数据标注方:开展汉语框架句子语义标注的训练数据标注活动。
- 数据需求方/第三方机构:参照执行数据验收、安全性评估等活动。
- 核心内容:规定句子语义标注的术语定义、标注内容、格式、流程及方法。
二、规范性引用文件
- 基础标准:
- 必须引用《DB14/T 3442-2025 人工智能汉语框架语义技术标注规范 第1部分:框架构建》。
- 起草依据:遵循GB/T 1.1-2020《标准化工作导则》。
三、术语和定义
- 句子语义标注
- 基于框架语义,对句子中词或短语的语义角色进行标记的过程。
- 短语
- 语义和语法可搭配的两个及以上词的组合。
- 连谓结构
- 谓词或谓词结构连用的格式(如“去吃饭”“有权利反对”)。
四、标注内容
- 三大要素:
- 目标词:激起特定框架的核心词(如动词“拥有”)。
- 框架:目标词对应的图式化场景(如“[拥有]框架”)。
- 语义角色:句子成分在框架中扮演的元素(如“所有者”“拥有物”)。
- 示意图(图1):
- 展示目标词、框架名称、句子成分与语义角色的关联关系。
五、标注格式
- 目标词标记:
- 格式:
<tgt=框架名称 目标词> - 示例:
<tgt=拥有 怀着>
- 格式:
- 语义角色标记:
- 格式:
<框架元素缩写 标注成分> - 示例:
<owner 每个人>
- 格式:
- 格式规范:
- 尖括号
<>包裹标注内容,元素缩写与成分间需空格。 - 标注符号与原文文字间需空格分隔(如
<owner 每个人> 都)。
- 尖括号
六、标注流程(图2)
- 步骤:
- 确定目标词:识别句子中可激发框架的词(如动词、名词)。
- 匹配框架:根据目标词语义选定对应框架(如“拥有”匹配[拥有]框架)。
- 标注语义角色:为相关句子成分标注框架元素(如“每个人”标注为
owner)。
- 多目标词处理:
- 句子含多个目标词时,需分别独立标注。
七、标注方法
1. 标注范围
- 必须标注所有与目标词语义相关的句子成分。
2. 连谓结构的特殊标注
| 语义关系 | 标注规则 | 示例 |
|---|---|---|
| 动作先后(后者为目的) | 后者标注为目的 | “去(目标词)吃饭” → 标注“吃饭”为目的 |
| 伴随动作 | 另一动词标注为并行事件 | “边走边唱” → “唱”标注为并行事件 |
| 携带/陪同类动词 | 动词及宾语标注为伴随者 | “带孩子看病” → “带孩子”标注为伴随者 |
| “有+抽象名词” | 前者及宾语标注为根据 | “有权利反对” → “有权利”标注为根据 |
3. 无需标注的情况
- 语言成分:
- 无实义词(如虚词“的”“了”)、否定副词(如“不”)、古汉语句式。
- 目标词场景:
- “去”无实义(例:
去改变中“去”不标注)。 - 携带类动词(如“带”)做目标词时,其他谓词不标注。
- 无合适框架匹配的目标词。
- “去”无实义(例:
- 结构限制:
- 连谓结构超过两个谓语时,不标注额外成分。
附录A:框架信息示例
- 示例框架:[拥有](Possession)
元素类型 中文名称 缩写 定义 核心元素 所有者 owner拥有某物的实体(如“每个人”) 核心元素 拥有物 possio被拥有的东西(如“梦想”) 非核心元素 形容 depic描述所有者/拥有物的状态 - 词元示例:
- “有”(动词):
他有五辆汽车。→ 激活[拥有]框架。
- “有”(动词):
核心逻辑总结
- 以框架为中心:目标词决定语义框架,句子成分按框架角色标注。
- 中文特异性处理:重点规范连谓结构等中文特殊句式的标注规则。
- 操作标准化:通过格式、流程、附录示例确保标注一致性和可操作性。
此标准为汉语语义分析提供了结构化标注方案,尤其适用于AI训练数据构建及自然语言处理任务。

