网站地图 | Tags | 热门标准 | 最新标准 | 订阅

GB/T 20532-2025 信息处理用现代汉语词类标记规范

  • 名  称:GB/T 20532-2025 信息处理用现代汉语词类标记规范 - 下载地址2
  • 下载地址:[下载地址2]
  • 提 取 码
  • 浏览次数:3
下载帮助: 发表评论 加入收藏夹 错误报告目录
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表
新闻评论(共有 0 条评论)

资料介绍

  ICS 01. 040. 01 CCS A 22

  中 华 人 民 共 和 国 国 家 标 准

  GB/T 20532—2025代替 GB/T20532—2006

  信息处理用现代汉语词类标记规范

  Specification ofpartofspeech(POS) tag ofcontemporaryChinese for

  Chineseinformation processing(CIP)

  2025-08-29发布 2026-03-01实施

  国家市场监督管理总局国家标准化管理委员会

  

  发

  

  布

  GB/T 20532—2025

  目 次

  前言 Ⅲ

  1 范围 1

  2 规范性引用文件 1

  3 术语和定义 1

  4 总则 1

  5 词类及其他切分单位分类 2

  6 标记代码的组合应用 6

  7 标记代码表 7

  8 证实方法 10

  参考文献 11

  Ⅰ

  GB/T 20532—2025

  前 言

  本文件按照 GB/T 1. 1—2020《标准化工作导则 第 1部分 :标准化文件的结构和起草规则》的规定起草 。

  本文件代替 GB/T 20532—2006《信 息 处 理 用 现 代 汉 语 词 类 标 记 规 范》, 与 GB/T 20532—2006相比 ,除结构和编辑性改动外 ,主要技术变化如下 。

  a) 更改了范围(见第 1 章 ,2006年版的第 1 章) 。

  b) 在术语与定义方面 ,更改术语 “汉语信息处理 ”为 “中文信息处理 ”,并更改了定义(见 3. 1,2006年版的 2. 1) ;增 加 了 “现 代 汉 语 ”的 术 语 和 定 义 (见 3. 2) ; 更 改 “Parts of Speech”为 “Part of Speech”(见 3. 3,2006年版的 2. 3) 。

  c) 在词类划分依据方面 ,删除 “参考了《中学教学语法系统提要》”(见 2006年版的 3. 2) ;增加 “也参考了其他语言文字规范标准和常用语文工具书 、汉语语料库等的词类划分体系 。”(见 4. 2) 。

  d) 在名词类方面 ,增加了名词小类的人名标记为姓和名的单独标记 ,分别标记为 nhf和 nhs(见5. 3. 3) ;更改了名词小类中人名示例(见 5. 3. 3,2006年版的 4. 1. 1. 5) ;更改了名词小类中机构名示例(见 5. 3. 5,2006年版的 4. 1. 1. 8) ;更改名词小类中其他专有名词示例(见 5. 3. 6, 2006年版的 4. 1. 1. 9) ;更改了名词小类时间名词为时间词 ,作为基本词类 ,标记为 t(见 5. 4,2006年版的4. 1. 1. 2) ; 更 改 了 名 词 小 类 方 位 名 词 为 方 位 词 , 作 为 基 本 词 类 , 标 记 为 l(见 5. 5, 2006年 版 的4. 1. 1. 3) ;删除了处所名词示例中的 “边疆 ”一词(见 2006年版的 4. 1. 1. 4) ;删除了名词小类中的族名(见 2006年版的 4. 1. 1. 7) 。

  e) 在动词类方面 ,更改了趋向动词示例(见 5. 6. 5,2006年版的 4. 1. 2. 5) ;增加了形式动词作为动词小类 ,标记为 vf(见 5. 6. 6) ;增加了心理动词作为动词小类 ,标记为 vs(见 5. 6. 7) 。

  f) 在数词类修订内容方面 ,增加了基数词作为数词小类 ,标记为 mc(见 5. 9. 1) ;增加了序数词作为数词小类 ,标记为 mo(见 5. 9. 2) 。

  g) 在代词类方面 ,增加了人称代词作为代词小类 ,标记为 rp(见 5. 11. 1) ;增加了指示代词作为代词小类 ,标记为 rd(见 5. 11. 2) ;增加了疑问代词作为代词小类 ,标记为 ri(见 5. 11. 3) 。

  h) 在新增基本词类方面 ,增加了语气词作为基本词类 ,标记为 y(见 5. 16) ; 在其他切分单位修订内容方面 ,删除了名词性习用语 、动词性习用语 、形容词性习用语 、连词性习用语 4个习用语小类 ,采用组合方式进行标记(见 2006年版的 4. 2. 1) ;删除了名词性缩略语 、动词性缩略语 、形容词性缩略语 3个缩略语小类 ,采用组合方式标记(见 2006年 版 的 4. 2. 2) ; 删 除 了 名 词 性 语 素字 、动 词 性 语 素 字 、形 容 词 性 语 素 字 3 个 语 素 字 小 类 , 采 用 组 合 方 式 标 记 (见 2006 年 版 的4. 2. 5) 。

  i) 在新增 “标记代码的组合原则与应用 ”方面 ,增加了 “标记代码的组合原则 ”(见 4. 4) ;增加了 “标记代码的组合应用 ”(见第 6章) ;增加了非汉字字符串的语法功能标注 ,采用组合方式进行标记(见 6. 5) 。

  j) 在其他修订内容方面 ,更改“其他 ”为“其他符号 ”(见 5. 19. 7,2006年版的 4. 2. 7) ;更改了“q”(量词)的代码说明“quantity”为 “依据通常做法 ”(见第 7章 ,2006年版的第 5 章) ;增加了 “词类标记代码表 ”(见 7. 1) ;增加了 “其他切分单位标记代码表 ”(见 7. 2) ; 增加了 “词类标记组合代码表 ”(见 7. 3) ;增加了 “证实方法 ”(见第 8章) 。

  Ⅲ

  GB/T 20532—2025

  本文件由教育部(语言)提出 。

  本文件由全国语言文字标准化技术委员会(SAC/TC500)归 口 。

  本文件起草单位 :北京师范大学中文信息处理研究所 、教育部语言文字应用研究所 。

  本文件主要起草人 :杨丽姣 、肖航 、靳光瑾 、富丽 、刘智颖 、宋培彦 、胡韧奋 、李洪政 、李慧 、李娟 。本文件及其所代替文件的历次版本发布情况为 :

  — 2006年首次发布为 GB/T 20532—2006;

  — 本次为第一次修订 。

  Ⅳ

  GB/T 20532—2025

  信息处理用现代汉语词类标记规范

  1 范围

  本文件规定了信息处理中现代汉语词类及其他切分单位的标注类别与标记代码 。

  本文件适用于中文信息处理与语言资源建设 ,现代汉语教学与研究 、国际中文教育 、汉语方言与古代汉语信息处理等参照使用 ,支持智能化信息处理与语言治理能力现代化的发展需求 。

  2 规范性引用文件

  本文件没有规范性引用文件 。

  3 术语和定义

  下列术语和定义适用于本标准 。

  3. 1

  中文信息处理 Chinese information processing; CIP

  利用计算机技术与人工智能方法 ,对中文音 、形 、义等信息进行输入 、输出 、提取 、分析 、理解 、生成与应用等处理的过程 。

  3.2

  现代汉语 contemporaryChinese

  自 “五四运动 ”以来逐步确立并广泛使用的汉民族共同语 。1) 3.3

  切分单位 segmentunit

  中文信息处理使用的 、具有确定语法功能的基本单位 。2) 3.4

  词类 partofspeech; POS

  词的语法分类 ,主要是根据语法功能划分出来的类 。

  3.5

  标记 tag

  对文本中切分单位的类别进行标注的代码 。

  4 总则

  4. 1 切分单位的范围

  本文件的切分单位包括词 、短语和其他切分单位 ,如习用语 、缩略语 、前接成分 、后接成分 、语素字 、

  1) 现代汉语 :包括以普通话为代表的口语形式以及以现代白话文为主的书面语形式 。它 是 当 前 中 文 信 息 处 理 的主要语言对象 。

  2) 切分单位 :包括本标准的规则所限定的词 、短语及其他单位 。

  1

  GB/T 20532—2025

  非语素字 、标点符号 、非汉字符号等 。

  4.2 词类划分的依据

  本文件的词类分类体系参考了吕叔湘 、朱德熙 、胡裕树 、黄伯荣等先生的语法体系 。

  本文件根据中文信息处理的特点和要求 ,主要依据语法功能原则划分词类 ,也参考了其他语言文字规范标准和常用语文工具书 、汉语语料库等的词类划分体系 。

  4.3 标记代码的制定原则

  依据国际通常做法 ,标记代码主要采用英文术语的字母 。例如 ,“名词 ”,采用英文术语“noun”的首字母“n”作为标记代码 ; “数词 ”,采用英文术语“numeral”的第三个字母“m”作为标记代码 。

  汉语独有的或使用 英 文 术 语 字 母 不 便 的 , 依 据 国 内 通 常 做 法 , 标 记 代 码 采 用 汉 语 拼 音 字 母 。 例如 ,“缩略语 ”,采用汉字 “简 ”的汉语拼音首字母“j”作为标记代码 ; “语素字 ”,采用汉字 “根 ”的汉语拼音首字母“g”作为标记代码 。

  4.4 标记代码的组合原则

  本文件规定词类 、其他切分单位的标记代码可以组合使用 。例如 ,用 “v-n”标记名动共类 ;用 “n(i) ”标记名词性习用语 , 以处理单个标记无法涵盖的情况 。

  5 词类及其他切分单位分类

  5. 1 概述

  本文件将现代汉语词类划分为 16个基本类和 20个小类 ,并为非词级切分单位设定 7个基本类 , 以满足语言信息处理需求 。为提升词类体系的灵活性与可拓展性 ,用户可结合具体应用场景 ,按照本规范所确立的分类原则与标记代码 ,对相关类目进行适当扩展或细化 , 以更好地服务于特定的研究任务或工程实践 。

  5.2 词类定义及标记代码

  本文件规定了词类的名称 、含义及其对应的标记代码 , 同时 ,也可为类目扩展或衍生标记提供参照框架 。

  5.3 名词 ,标记为 n,表示人或事物的名称 ,在句子中主要充当主语或宾语 。

  5.3. 1 普通名词 ,标记为 ng,表示事物的名称 。

  示例 :

  人 马 书 教师 飞机 电冰箱 阿姨 桌子 木头

  道德 理论 历 史 思想 文化 因素 作风 哲学

  5.3.2 处所名词 ,标记为 nl,表示处所 。

  示例 :

  空中 高处 隔壁 门 口 附近 一旁 野外5.3.3 人名 ,标记为 nh,表示人物名称的专有名词 。

  示例 :

  张雷 铁木尔 孙悟空 欧阳修 松赞干布 卡尔 · 马克思

  姓 ,标记为 nhf,表示汉族式人名中的姓氏 。

  示例 :

  (他姓)赵 司马(老师)

  2

  GB/T 20532—2025

  名 ,标记为 nhs,表示汉族式人名中的名字部分 。

  示例 :

  (秦王)政 巧儿(姑娘)

  5.3.4 地名 ,标记为 ns,表示地理区域名称的专有名词 。

  示例 :

  亚洲 大西洋 地中海 阿尔卑斯山 加拿大

  中 国 北京 浙江 景德镇 呼和浩特 中关村

  5.3.5 机构名 ,标记为 ni,表示团体 、组织 、机构名称的专有名词 。

  示例 :

  联合国 教育部 丝路文化交流促进会 中国科学院

  5.3.6 其他专有名词 ,标记为 nz。

  示例 :

  论语 嫦娥六 号 宫保鸡丁

  5.4 时间词 ,标记为 t,表示特定的时间点或时间段 。

  示例 :

  年 月 日

  现在 过去 昨天 去年 将来 宋朝 星期 一

  5.5 方位词 ,标记为 l,表示位置的相对方向 。

  示例 :

  上 下 左 右 前 后 里 外 中 东 西 南 北

  前边 左面 里头 中 间 外部

  5.6 动词 ,标记为 v,表示动作 、行为 , 心理活动 、生理状态及事物的存现 、变化等 , 在句子中主要充当谓语 。

  5.6. 1 及物动词 ,标记为 v,能够带宾语 。

  示例 :

  吃 打 擦 洗 喂 借 送 买 捧 提 填

  喜欢 告诉 接受 羡慕 考虑 解决 同意 发动

  5.6.2 不及物动词 ,标记为 vi,不能够带宾语 。

  示例 :

  休息 咳嗽 瘫痪 游泳 睡觉

  5.6.3 联系动词 ,标记为 vl,表示关系的判断 。

  示例 :

  是

  5.6.4 能愿动词 ,标记为 vu,表示可能 、意愿 。

  示例 :

  能够 能 应该 可以 可能 情愿 愿意 要

  5.6.5 趋向动词 ,标记为 vd,表示趋向 。

  示例 :

  (走)上 (趴)下 (进)来 (看)上

  (跑)上来 (掉)下去 (提)起来 (吃)起来

  5.6.6 形式动词 ,标记为 vf,本身没有实在意义 ,后面常跟动词 。

  示例 :

  进行(研究) 加以(讨论) 予以(重视)

  5.6.7 心理动词 ,标记为 vs,表示心理活动 。

  3

  GB/T 20532—2025

  示例 :

  觉得 认为 相信 喜欢 同意

  5.7 形容词 ,标记为 a,表示性质 、状态 ,在句子中主要充当谓语 、定语 、状语和补语 。

  5.7. 1 性质形容词 ,标记为 aq,表示性质 。

  示例 :

  好 高 美 大 勇敢 危险 漂亮 干净 伟大

  5.7.2 状态形容词 ,标记为 as,表示状态 。

  示例 :

  雪白 黢黑 通红 冰凉 绿油油 亮堂堂 白花花 冷冰冰

  5.8 区别词 ,标记为 f,表示事物的区别性特征 ,在句子中只能做定语修饰名词 ,或跟助词 “的 ”组成 “的 ”字结构 。

  示例 :

  男 女 公 母 雌 雄 微型 国产 军用

  5.9 数词 ,标记为 m ,表示数目和次序 。

  5.9. 1 基数词 ,标记为 mc,表示事物数量的多少 。

  示例 :

  零 一 半 百 千 百万 一百零八

  5.9.2 序数词 ,标记为 mo,表示事物的顺序 。

  示例 :

  第 一 第十八

  5. 10 量词 ,标记为 q,表示人 、事物或动作的单位 。

  示例 :

  个 条 片 匹 辆 尺 斤 两 吨 支 回 次 遍 千瓦时 分 秒

  5. 11 代词 ,起替代和复指作用 ,标记为 r。

  5. 11. 1 人称代词 ,标记为 rp,表示称代 。

  示例 :

  我 你 他 我们 你们 他们 咱们 自 己 大家 人家

  5. 11.2 指示代词 ,标记为 rd,表示指别 。

  示例 :

  这 那 每 各 某 这个 那个 这里 那里 这样 那样

  5. 11.3 疑问代词 ,标记为 ri,表示特指疑问 。

  示例 :

  谁 几 什 么 多 少 哪里 怎 么 怎么样

  5. 12 副词 ,标记为 d,修饰或限制动词和形容词 ,表示范围 、程度等 ,在句子中做状语 。

  示例 :

  都 只 就 仅 很 将 不 却 再 三 屡次

  总共 正在 常常 重新 曾 经 竟然 居然

  5. 13 介词 ,标记为 p,引介名词性成分 ,不单独充当句子成分 。

  示例 :

  把 被 从 向 对 凭

  按照 对于 为 了 自从 关于

  5. 14 连词 ,标记为 c,连接词 、短语或句子 ,表示两者之间所具有的某种关系 。

  示例 :

  和 同 与 及 并 或

  4

  GB/T 20532—2025

  并且 而且 或者 因为 所以

  5. 15 助词 ,标记为 u,附着在词 、短语 、句子后面 ,表示某种附加意义 。

  示例 :

  的 地 得 了 着 过 等等 似的 一样

  5. 16 语气词 ,标记为 y,附着在句尾或句中停顿处 ,表示某种语气 。

  示例 :

  了 呢 吧 吗 啊

  5. 17 叹词 ,标记为 e,表示感叹 、呼唤或应答 ,可独立成句或在句子中充当独立成分 。

  示例 :

  啊 嗯 唉 哎 哼 哦 哎哟 哎呀

  5. 18 拟声词 ,标记为 o,模拟自然界事物的某种声音 ,一般不能单独成句 。

  示例 :

  砰 滴答 扑通 咕咚 叮叮当当

  5. 19 其他切分单位划分及标记代码 。

  5. 19. 1 习用语 ,标记为 i,表示一种相沿习用的定型短语 。

  示例 :

  跑龙套 打官腔 海市蜃楼 井底之蛙 总而言之 贵人多忘事 行行出状元

  5. 19.2 缩略语 ,标记为 j,表示专有名词或常用语的简缩形式 。

  示例 :

  人大 五四 采编 离退休 短平快 高精尖

  5. 19.3 前接成分 ,标记为 h,表示词根前面的附加构词成分 。

  示例 :

  阿 老 初 第

  5. 19.4 后接成分 ,标记为 k,是指词根后面的附加构词成分 。

  示例 :

  子 儿 头 化 们 式 性 者

  5. 19.5 语素字 ,标记为 g,是指汉字字符集中一般不单独使用的汉字 。

  示例 :

  民 农 材 抒 究 涤 遥 伟

  5. 19.6 非语素字 ,标记为 x,是指汉字字符集中不单独使用且本身没有实在意义的汉字 。

  示例 :

  垃 琵 蜘 踌 鸯 蜻

  5. 19.7 其他符号 ,标记为 w,包括标点符号 、非汉字字符串以及其他未知的符号 。

  5. 19.7. 1 标点符号

  标点符号 ,标记为 wp,是指辅助文字记录语言的符号 ,是书面语的有机组成部分 ,用来表示语句的停顿 、语气以及标示某些成分(主要是词语)的特定性质和作用 , 中文标点通常采用全角 。

  示例 :

  , 。 、 ; ? ! : “” … …

  5. 19.7.2 非汉字字符串 ,是指以汉字以外的其他语言形式出现的 、有特定意义的字符串 ,标记为 ws。

  示例 :

  abcd windows

  5. 19.7.3 其他未知的符号 ,标记为 wu。

  5

  GB/T 20532—2025

  6 标记代码的组合应用

  6. 1 兼有两种词类的组合标记

  6. 1. 1 名动共类 ,标记为 v-n,表示在语境中兼具名词 、动词功能的词 。

  示例 :

  工作 出版 改革

  6. 1.2 名形共类 ,标记为 a-n,表示在语境中兼具名词 、形容词功能的词 。

  示例 :

  困难 寂寞 平凡

  6.2 习用语、缩略语、语素字等其他切分单位的组合标记

  6.2. 1 名词性习用语 ,标记为 n(i) ,是指具有名词性特征的习用语 ,包括成语 、俗语等 。

  示例 :

  海市蜃楼 井底之蛙 蛛丝马迹

  6.2.2 动词性习用语 ,标记为 v(i) ,是指具有动词性特征的习用语 ,包括成语 、俗语等 。

  示例 :

  跑龙套 打官腔 吃老本 与时俱进 励精图治

  6.2.3 形容词性习用语 ,标记为 a(i) ,是指具有形容词性特征的习用语 ,包括成语 、俗语等 。

  示例 :

  丰富多彩 艰苦朴素 光明正大

  6.2.4 连词性习用语 ,标记为 c(i) ,是指具有连词性特征 、用于保持篇章连贯性的习用语 。

  示例 :

  总而言之 由此可见 综上所述

  6.2.5 名词性缩略语 ,标记为 n(j) ,表示较复杂的名词或名词短语的缩略形式或简称 。

  示例 :

  人大 五四 劳模

  6.2.6 动词性缩略语 ,标记为 v(j) ,表示较复杂的动词或动词短语的缩略形式或简称 。

  示例 :

  教改 离退休

  6.2.7 形容词性缩略语 ,标记为 a(j) ,表示较复杂的形容词或形容词短语的缩略形式或简称 。

  示例 :

  短平快 高精尖

  6.2. 8 名词性语素字 ,标记为 n(g) ,是指具有名词性语义且在构词时主要充当名词性成分的语素字 。

  示例 :

  民 农 材

  6.2.9 动词性语素字 ,标记为 v(g) ,是指具有动词性语义且在构词时主要充当动词性成分的语素字 。

  示例 :

  抒 究 涤

  6.2. 10 形容词性语素字 ,标记为 a(g) ,是指具有形容词性语义且在构词时主要充当形容词性成分的语素字 。

  示例 :

  殊 遥 伟

  6

  GB/T 20532—2025

  6.3 按语法功能区分的代词标记组合

  6.3. 1 代名词 ,标记为 n-r,功能与普通名词 、处所名词 、时间词等相当 。

  示例 :

  你 我 她 谁 什 么 哪里 多会儿 这会儿

  6.3.2 代谓词 ,标记为 v-r,功能与动词 、形容词相当 。

  示例 :

  怎样 怎么样 这样 那样

  6.3.3 代数词 ,标记为 m-r,功能与数词相当 。

  示例 :

  多 少 几

  6.3.4 代副词 ,标记为 d-r,功能与副词相当 。

  示例 :

  怎 么 这么 那么

  6.4 数量词标记

  数量词 ,标记为 m-q,数词 、量词可组合进行标记 ,表示特定的语法功能 。

  示例 :

  一阵 一点儿 一丝 一团

  6.5 其他组合标记

  为非汉字字符串(ws)标注语法功能 。

  示例 :

  windows标注为名词性成分 ,标记为 n(ws)

  用户可根据需要自行增补 。

  7 标记代码表

  7. 1 词类标记代码见表 1。

  7.2 其他切分单位标记代码见表 2。

  7.3 词类标记组合代码见表 3。

  7.4 词类与其他切分单位标记组合代码见表 4。

  表 1 词类标记代码表

  序号

  标记代码

  类别名称

  代码说明

  1

  n

  名词

  noun

  2

  ng

  普通名词

  noun-general

  3

  nl

  处所名词

  noun-location

  4

  nh

  人名

  noun-human

  5

  ns

  地名

  noun-space

  6

  ni

  机构名

  noun-institution

  7

  GB/T 20532—2025

  表 1 词类标记代码表 (续)

  序号

  标记代码

  类别名称

  代码说明

  7

  nz

  其他专有名词

  noun-“专 ”的汉语拼音首字母

  8

  t

  时间词

  noun oftime

  9

  l

  方位词

  noun oflocality

  10

  v

  动词

  verb

  11

  vt

  及物动词

  verb-transitive

  12

  vi

  不及物动词

  verb-intransitive

  13

  vl

  联系动词

  verb-linking

  14

  vu

  能愿动词

  verb-auxiliary

  15

  vd

  趋向动词

  verb-direction

  16

  vf

  形式动词

  verb-form

  17

  vs

  心理动词

  verb-psychologicalstate

  18

  a

  形容词

  adjective

  19

  aq

  性质形容词

  adjective-quality

  20

  as

  状态形容词

  adjective-state

  21

  f

  区别词

  difference

  22

  m

  数词

  numeral

  23

  mc

  基数词

  numeral-cardinal

  24

  mo

  序数词

  numeral-ordinal

  25

  q

  量词

  依据通常做法

  26

  r

  代词

  pronoun

  27

  rp

  人称代词

  pronoun-personal

  28

  rd

  指示代词

  pronoun- demonstrative

  29

  ri

  疑问代词

  pronoun-interrogative

  30

  d

  副词

  adverb

  31

  p

  介词

  preposition

  32

  c

  连词

  conjunction

  33

  u

  助词

  auxiliary

  34

  y

  语气词

  “语 ”的汉语拼音首字母

  35

  e

  叹词

  exclamation

  36

  o

  拟声词

  onomatopoeia

  8

  GB/T 20532—2025

  表 2 其他切分单位标记代码表

  序号

  标记代码

  类别名称

  代码说明

  1

  i

  习用语

  idiom

  2

  j

  缩略语

  “简 ”的汉语拼音首字母

  3

  h

  前接成分

  head

  4

  k

  后接成分

  依据通常做法

  5

  g

  语素字

  “根 ”的汉语拼音首字母

  6

  x

  非语素字

  依据通常做法

  7

  w

  其他

  依据通常做法

  8

  wp

  标点符号

  依据通常做法

  9

  ws

  非汉字字符串

  “w”-string

  10

  wu

  其他未知符号

  “w”-unknown

  表 3 词类标记组合代码表

  序号

  标记代码组合

  类别名称

  代码说明

  1

  v-n

  名动共类

  verb-noun

  2

  a-n

  名形共类

  adjective-noun

  3

  n-r

  代名词

  noun-pronoun

  4

  v-r

  代谓词

  verb-pronoun

  5

  m-r

  代数词

  numeral-pronoun

  6

  d-r

  代副词

  adverb-pronoun

  7

  m-q

  数量词

  依据通常做法

  表 4 词类与其他切分单位标记组合代码表

  序号

  标记代码组合

  类别名称

  代码说明

  1

  n(i)

  名词性习用语

  noun(idiom)

  2

  v(i)

  动词性习用语

  verb(idiom)

  3

  a(i)

  形容词性习用语

  adjective(idiom)

  4

  c(i)

  连词性习用语

  conjunction(idiom)

  5

  n(j)

  名词性缩略语

  noun(“简 ”的汉语拼音首字母)

  6

  v(j)

  动词性缩略语

  verb(“简 ”的汉语拼音首字母)

  7

  a(j)

  形容词性缩略语

  adjective(“简 ”的汉语拼音首字母)

  8

  n(g)

  名词性语素字

  noun(“根 ”的汉语拼音首字母)

  9

  v(g)

  动词性语素字

  verb(“根 ”的汉语拼音首字母)

  10

  a(g)

  形容词性语素字

  adjective(“根 ”的汉语拼音首字母)

  9

  GB/T 20532—2025

  8 证实方法

  通过文献查阅 、示范性语料库一致性检验等手段 ,对第 5 章 ~ 第 7 章中词类划分 、词类标记以及词类标记的组合应用进行证实 。

  10

  GB/T 20532—2025

  参 考 文 献

  [1] GB/T 13715 信息处理用现代汉语分词规范

  [2] GB/T 16159 汉语拼音正词法基本规则

  [3] 全国科学技术名词审定委员会 . 语言学名词[M] . 北京 :商务印书馆 ,2011.

  [4] 黄伯荣 , 廖序东 . 现代汉语(第七版)[M] . 北京 :高等教育出版社 ,2024.

  11

29139095929
下载排行 | 下载帮助 | 下载声明 | 信息反馈 | 网站地图  360book | 联系我们谢谢