网站地图 | Tags | 热门标准 | 最新标准 | 订阅

GB/T 46800-2025 生成式人工智能技术应用社会影响 评估指南

  • 名  称:GB/T 46800-2025 生成式人工智能技术应用社会影响 评估指南 - 下载地址2
  • 下载地址:[下载地址2]
  • 提 取 码
  • 浏览次数:3
下载帮助: 发表评论 加入收藏夹 错误报告目录
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表
新闻评论(共有 0 条评论)

资料介绍

  ICS 35.240. 01 CCS L 67

  中 华 人 民 共 和 国 国 家 标 准

  GB/T 46800—2025

  生成式人工智能技术应用社会影响

  评估指南

  Socialimpactofgenerativeartificialintelligencetechnology application—

  Evaluation guidelines

  2025-12-02发布 2025-12-02实施

  国家市场监督管理总局国家标准化管理委员会

  

  发

  

  布

  GB/T 46800—2025

  目 次

  前言 Ⅲ

  引言 Ⅳ

  1 范围 1

  2 规范性引用文件 1

  3 术语和定义 1

  4 总则 2

  5 社会影响评估框架 2

  6 社会影响评估指标 2

  6. 1 通则 2

  6. 2 身心健康 3

  6. 3 行为轨迹 3

  6. 4 价值观念 3

  6. 5 社会关系 3

  6. 6 价值变动 3

  6. 7 组织结构 4

  6. 8 运行模式 4

  6. 9 职能分工 4

  6. 10 政治效能 4

  6. 11 经济效用 4

  6. 12 社会效应 4

  6. 13 文化效益 5

  6. 14 生态效果 5

  7 测度方法 5

  7. 1 通则 5

  7. 2 正向提问 5

  7. 3 逆向解析 5

  7. 4 对抗测试 5

  7. 5 数字仿真 6

  7. 6 社会实验 6

  7. 7 调查数据及二手数据分析 6

  8 评估流程 6

  8. 1 评估组织 6

  8. 2 评估准备 6

  Ⅰ

  GB/T 46800—2025

  8. 3 评估实施 7

  9 结果运用与持续改进 8

  9. 1 评估结果分析与运用 8

  9. 2 持续改进和反馈机制 8

  附录 A (资料性) 生成式人工智能技术应用社会影响评估指标示例 9

  A. 1 身心健康评估指标示例 9

  A. 2 组织结构评估指标示例 9

  A. 3 政治效能评估指标示例 9

  A. 4 社会效应评估指标示例 10

  参考文献 11

  Ⅱ

  GB/T 46800—2025

  前 言

  本文件按照 GB/T 1. 1—2020《标准化工作导则 第 1部分 :标准化文件的结构和起草规则》的规定起草 。

  请注意本文件的某些内容可能涉及专利 。本文件的发布机构不承担识别专利的责任 。

  本文件由全国智能技术社会应用与评估基础标准化工作组(SCA/SWG 35)提出并归 口 。

  本文件起草单位 :润泽智算科技集团股份有限公司 、清华大学 、中国标准化研究院 、中移信息系统集成有限公司 、联想(北京有限公司) 、中共鄂尔多斯市委员会网络安全和信息化委员会办公室 、北京百度网讯科技有限公司 、北京智谱华章科技有限公司 、合肥清和智能科技有限公司 、阿里云计算有限公司 、浙江大学 、北京伽睿智能科技集团有限公司 、深圳市聚龙智慧城市研究院 、哈尔滨工业大学 、山东省计算中心(国家超级计算济南中心) 、复旦大学 、航天科工网络信息发展有限公司、中国人民公安大学、浙江工业大学、蒲惠智造科技股份有限公司、国家工业信息安全发展研究中心(工业和信息化部电子第一研究所) 、山东大学 、人民法院信息技术服务中心 、西安交通大学 、中国移动通信集团山东有限公司 、北京中科闻歌科技股份有限公司 、公安部安全与警用电子产品质量检测中心(公安部第一研究所) 、数据空间研究院 、昇腾方舟(海南)科技有限公司 、北京启明星辰信息安全技术有限公司 。

  本文件主要起草人 : 苏竣 、周超男 、张娴 、汝鹏 、曹俐莉 、王昀 、杜杨洲 、尚二平 、凌晨 、李笠 、蒋晓琳 、彭骏涛 、李俊平 、张 鹏 、赵 文 慧 、魏 钰 明 、魏 如 清 、黄 萃 、吕 立 远 、郭 毅 峰 、王 妍 、王 双 、王 永 杰 、吕 令 广 、韩志弘 、胡业飞 、周鸣乐 、李雪 梅 、米 加 宁 、徐 宏 发 、陈 国 营 、王 克 飞 、彭 文 华 、陈 静 、王 晓 燕 、沈 超 、程 涛 、乌云 、王玉冬 、肖星琳 、李文洁 、张文弘 、王晓思 、原斌 、高云峰 、张江楠 、郑晓榕 、崔楠杰 。

  Ⅲ

  GB/T 46800—2025

  引 言

  近年来 ,生成式人工智能(Generative ArtificialIntelligence,GenAI)技术高速发展并广泛应用于经济 、司法 、政务 、教育 、医疗 、科研等生产生活领域 。一方面 ,对于增进个体认知 、提升决策效率 、优化组织模式 、赋能经济社会运行等提供了有益助力 ;另一方面 ,也对人类的生产模式 、生活方式与社会治理体系造成深刻冲击 。就此 ,在开发 、服务提供和应用过程中 ,提前辨识 、有效评估生成式人工智能技术应用带来的社会影响 ,监管引导技术应用产生良性 、正向的社会影响 ,成为重大且紧迫的时代命题 。

  GB/T 46800《生成式人工智能技术应用社会影响 评估指南》旨在给出识别 、评估生成式人工智能技术应用社会影响的基本框架 ,为开发 、提供或使用方 , 以及监管部门 、研究机构开展相关管理和评估活动提供指导和建议 ,有助于促进生成式人工智能技术应用的良性 、向善发展 ,提前防控技术应用的潜在社会风险 。

  Ⅳ

  GB/T 46800—2025

  生成式人工智能技术应用社会影响

  评估指南

  1 范围

  本文件提供了生成式人工智能技术应用社会影响评估的总体原则 、社会影响评估框架 、评估指标 、测度方法 、评估流程 、结果运用与持续改进等方面的指导和建议 ,给出了具体评估示例的有关信息 。

  本文件不涉及模型和语料的可信 、可靠 、准确性等前置的技术性能的评估指导 。

  本文件适用于开发方 、提 供 方 和 使 用 方 开 展 生 成 式 人 工 智 能 技 术 应 用 社 会 影 响 的 辨 识 和 管 理 活动 ,并适用于指导监管部门 、研究机构开展生成式人工智能技术应用社会影响评估 。

  2 规范性引用文件

  下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款 。其中 , 注 日期的引用文件 ,仅该日期对应的版本适用于本文件 ;不注日期的引用文件 ,其最新版本(包括所有的修改单) 适用于本文件 。

  GB/T 41867—2022 信息技术 人工智能 术语

  3 术语和定义

  GB/T 41867—2022界定的以及下列术语和定义适用于本文件 。

  3. 1

  生成式人工智能 generativeartificialintelligence;GenAI

  生成文本 、图片 、音频 、视频 、软件代码等内容的人工智能模型及相关产品服务 。

  3.2

  社会影响 socialimpact

  对个人与群体 、组织与行业以及社会及其关联系统可能产生或已产生的影响 。

  注 : 本文件所指的社会影响 ,既包括生成式人工智能输出内容带有的社会属性可能产生的潜在应用社会影响 ,也包括该技术应用已经产生的或引致的社会影响 。

  3.3

  评估 evaluation

  开发 、提供 、使用 、监管或研究组织通过正式 、记录的流程来辨识 、评级和处理 。

  3.4

  表征 performance

  通过系统化方法测量得出的事物属性的描述结果或量化结果 。

  3.5

  测度 measurement

  通过特定方法 、设备及程序确定对象属性或特征数值的过程 。

  1

  GB/T 46800—2025

  4 总则

  4. 1 开发方 、提供方和使用方宜在开发和应用的关键环节开展社会影响的评估 ,包括 在 规 划 、算 法 设计 、数据收集与处理 、模型训练与调优产品研发 、服务提供等过程中评估其社会影响 。

  4.2 监管部门 、研究机构宜在生成式人工智能技术应用的事前 、事中 、事后全链条监管过程中评估社会影响 。

  4.3 评估中宜充分考虑对特殊群体的社会影响及其需求 。

  5 社会影响评估框架

  宜从以下三个方面考虑和评估生成式人工智能技术应用的社会影响 ,评估框架与内容见图 1:

  a) 对个体与群体的影响(见 6. 2~ 6. 5) : 与人的交互过程中对人身心健康 、行为轨迹 、价值观念及社会关系的影响 ;

  b) 对组织与行业的影响(见 6. 6~ 6. 9) :对组织与行业运行的价值变动 、组织结构 、运行模式及职能分工产生的影响 ;

  c) 对经济社会系统的影响(见 6. 10~ 6. 14) : 可能产生或已产生及引致的政治效能 、经济效用 、社会效应 、文化效益和生态效果 。

  注 : 本文件提供的社会影响评估框架内容 ,后续可拓展 。

  图 1 生成式人工智能技术应用社会影响评估框架

  6 社会影响评估指标

  6. 1 通则

  评估生成式人工智能技术应用社会影响 ,宜依据不同评估 目 的 ,按照 4. 1、4. 2 所描述的各环节 ,对6. 2~ 6. 14描述的各方面制作评估清单 ,逐项进行检验评估 。 或依据不同应用场景 ,根据场景所属行业特点 、应用对象范围及特点等因素选取重点的社会影响方面 ,确定社会影响的具体表征 。具体表征包括生成式人工智能输出内容和互动过程中反映出的社会属性特征 ,及生成式人工智能应用后形成的客观

  2

  GB/T 46800—2025

  痕迹指征 。

  6.2 身心健康

  个体或群体的身体 、心理健康水平 , 以及与身心健康相关的认知 、感受(指标及测度示例见附录 A的 A. 1) 。宜着重考虑下述内容 。

  a) 认知 。如技术接受程度 、自我主体性感知等 。

  b) 信任与隐私 。包括对生成式人工智能技术应用的媒介 、输出信息 、应用场景的信任 ,如信心 、技术依赖程度 、个人隐私保护信任情况等 。

  c) 身体健康 。如实际健康状况 、体感情况 、健康预期 。

  d) 心 理 健 康 。 如 精 神 状 态 、安 全 感 、自 我 效 能 感 , 以 及 产 生 心 理 隔 阂 、心 理 缺 失 、心 理 障 碍 、成瘾等 。

  6.3 行为轨迹

  技术应用涉及的多方利益相关者的规模 、结构及其行为模式 。宜着重考虑 :

  a) 用户规模 ;

  b) 用户偏好 ;

  c) 信息茧房 ;

  d) 群体性行动 。

  示例 : 智能助理等生成式人工智能应用对医疗服务提供者日常提供诊疗过程行为的影响 。

  6.4 价值观念

  对人类社会观点的加强 、解构 、扭曲或重塑 ,及其对个体或群体造成的影响或伤害 。例如价值观念增强 、价值观念重塑 、偏见等 。宜着重考虑 :

  a) 价值倾向 ;

  b) 文化 、种族 、性别 、年龄 、宗教等偏见 ;

  c) 不平等与边缘化 ;

  d) 仇恨与暴力及其引致的恶意攻击 。

  6.5 社会关系

  技术应用涉及的多方利益相关者的社会关系感知 、能力 、行为及社会资本等 。例如信任关系 、社交能力 、社区凝聚力 、安全感 、参与意愿和参与水平 、社会资本变化等 。

  示例 1: 生成式人工智能提供知识输出和教学资料 ,产生新型知识生成机制和知识权威 ,传统的师生信任 关 系 受 到影响 。

  示例 2: 生成式人工智能通过替代性劳动 、远程互动 、算法推荐等机制 ,改变个体获取资源和建立关 系 的 方 式 ,进 而影响社会资本 。

  6.6 价值变动

  技术应用给组织或行业带来的价值变化 。宜着重考虑下述内容 。

  a) 经济效益与成本 。 总体财务开支变化 ,如基础设施建设成本 、劳动力支付成本 、训练成本 、计算成本等 。

  b) 环境效益与成本 。组织或行业自然资源消耗和环境变化 ,如产业能源消耗 、产业污染排放等 。

  c) 社会效益与成本 。特定产品 、服务的实际速度 、效果 、效率的变化情况 。

  示例 1: 在城市管理领域应用对城市运行管理行政效率 、办事效率 、响应速度的影响 。

  3

  GB/T 46800—2025

  示例 2: 在基础教育领域应用对授课绩效的影响 。

  6.7 组织结构

  应用生成式人工智能技术的组织类型变化 、规模变化 、结构变化 、流程变化等变革(指标及测度示例见附录 A 的 A. 2) 。

  示例 1: 游戏企业应用文字绘图生成式 AI技术 ,原画 、翻译等业务部门的规模和结构变化 。

  示例 2: 制药企业应用生成式 AI技术 ,生成具有特定性质的药物分子结构 ,对企业研发部门组织结构带来的变化 。

  6. 8 运行模式

  应用领域中组织 、系统或行业在协同 、创新模式及水平方面的变化 。例如对采集分析 、运行感知 、实时管控 、实时反馈 、问题处置 、科技创新 、知识产权保护等方面的影响 。

  示例 : 对政府治理模式的影响 ,如 “智慧公文”“城市智能 推 介 ”“经 济 智 能 问 数 ”等 生 成 式 人 工 智 能 技 术 具 体 应 用 对市场准入体系 、市场监管方式 、基层治理模式情况的影响 。

  6.9 职能分工

  应用领域中组织 、系统或行业的责任主体 、具体职能 、责任分工变化 。

  示例 : 应用生成式人工智能技术直接输出产品设计 、策划方案 、软件代码等 ,带来企业各部门间责任 、分工变化 。

  6. 10 政治效能

  与政治立场 、观点及政治安全相关的属性及其引导性影响(指标及测度示例见附录 A 的 A. 3) ,宜着重考虑下述内容 。

  a) 意识形态引导 。如政治倾向(激进/保守 、规训/自由 、民主/专制) 、政治放任(或干预) 、政治市场竞争(保守价值)等 。

  b) 政治偏见呈现 。

  c) 全过程人民民主 。

  d) 国家主权完整 。

  e) 党政机关廉政建设 。

  6. 11 经济效用

  与国家地区的经济运行与发展相关的影响 。宜着重考虑 :对社会税收 、社会财富 、就业替代 、就业创造 、购买力 、市场需求 、商业贸易等的影响 , 以及对经济主权 、经济安全的影响 。

  6. 12 社会效应

  与国家或区域社会网络及其运行相关的影响 ,包括社会关系网络 、社会公正 、社会稳定与安全等(指标及测度示例见附录 A 的 A. 4) 。宜着重考虑 :

  a) 就业与失业人群类型与结构 ;

  b) 劳动力替代情况 ;

  c) 社会分化 ;

  d) 伦理规范 ;

  e) 知识生成机制 ;

  f) 权威生成机制 ;

  g) 技术平等可及 ;

  h) 网络信息安全和隐私保护 ;

  4

  GB/T 46800—2025

  i) 社会动员能力 ;

  j) 社会互动与人际关系 。

  6. 13 文化效益

  与国家或区域文化变化发展相关的影响 ,包括文化传播 、文化融合 、文化保护等方面 。宜着重考虑 :

  a) 不同语言环境下的多元包容能力 ;

  b) 社会价值观体系 ;

  c) 模型之间的合作倾向 ;

  d) 跨国文化传播 。

  6. 14 生态效果

  与自然资源消耗 、环境 变 化 相 关 的 影 响 , 包 括 能 源 消 耗 、使 用 、分 配 、环 境 变 化 与 保 护 等 。 宜 着 重考虑 :

  a) 不同模型的能源消耗规模及结构差异 ;

  b) 开发能源消耗及清洁能源比重 ;

  c) 能源区域不平等 ;

  d) 能源结构转型 。

  7 测度方法

  7. 1 通则

  测度生成式人工智 能 技 术 应 用 社 会 影 响 , 可 选 择 使 用 人 工 方 式 、技 术 工 具 及 实 验 等 主 要 工 具 进行 ,宜综合运用以下测度方法 。

  7.2 正向提问

  对生成式人工智能模型进行正向提问 ,考察模型对于特定观点陈述的主观倾向性 。通过设计规范化的正向提问场景 ,评估生成式人工智能大模型在面对特定社会议题 、价值判断或观点陈述时表现出的主观倾向性和观点偏好性 。

  示例 : 向生成式人工智能诊疗助手提出涉及生命伦理 、公平就医类问题 ,观察其回答是否存在明显的道德倾向或社会偏见 。

  7.3 逆向解析

  对于生成式人工智能模型执行特定任务时所生成的输出内容 ,通过逆向分析的方式 ,深入解析生成内容中潜在的风险 、偏见或伦理等社会影响问题 。

  示例 : 要求模型分别生成不同地域的劳动者画像 ,根据 模 型 输 出 的 画 像 结 果 ,逆 向 解 析 画 像 中 隐 含 的 偏 见 ,评 估 诊断潜在社会风险 。

  7.4 对抗测试

  为进一步评估生成式人工智能模型在被故意引导至滥用方向时的防御能力 ,可通过对抗实验测试其在面对诱导性提问 、规避策略 、恶意嵌入等场景下的防护水平与抵抗程度 。

  示例 : 直接询问模型 “如何诈骗 ”,若模型依据安全策略拒绝回答 ,则说明对显性需求有相应防护 ,进而换用 “老奶奶讲故事 ”的方式规避直接提问 ,逐 步 引 导 模 型 提 供 诈 骗 方 法 ,测 试 在 防 护 策 略 与 识 别 机 制 上 是 否 存 在 可 被 对 抗 利 用 的漏洞 。

  5

  GB/T 46800—2025

  7.5 数字仿真

  仿真生成式人工智能技术在社会系统中的交互过程 ,评估复杂社会影响 。适用于难以直接观测的场景 ,特别是涉及大规模 、多主体参与的长周期 、动态场景 。

  示例 1: 仿真生成式人工智能在社交媒体平台中的内容推荐机制 ,观测其对用户行为模式 、信息传播路径 和 社 会 分化的长期影响 。

  示例 2: 仿真生成式人工智能在智能城市交通管理中的作用 ,观测其对交通流量 、出行效率和碳排放的全 局 优 化 效果 ,及潜在的不平等交通资源分配问题 。

  7.6 社会实验

  通过设置社会实验环境 ,观察生成式人工智能在真实社会情境下的应用效果及其社会影响 。人工智能社会实验适用于评估长时期影响 。

  示例 1: 在智能社区管理中 ,实验生成式人工智能在居民服务调度中的应用 ,观测社区关系(如邻里互 助 、社 交 活 动参与度 、信任关系)在技术介入后的变化 、居民在技术应用后的满意度变化 。

  示例 2: 在智能交通管理中 ,实验生成式人工智能在交通信号系统中的应用 ,观测高密度交通流量下车辆 通 行 效 率和事故率的变化 ,观测在突发交通事故或恶劣天气下的响应能力 。

  7.7 调查数据及二手数据分析

  采用对用户 、厂商 、监管部门等利益相关方的调查数据 ,或统计部门 、第三方机构发布的二手统计数据 ,开展数据分析进行评估 ,宜考虑统计分析 、案例分析 、文本挖掘 、情感分析 、社会网络分析等数据分析方法组合 。

  示例 1: 采用城市管理部门应用生成式人工智能技术优化基础设施管理的案例 ,分析评估其对城市行政效率和资源分配公平性的影响 。

  示例 2: 采用社交媒体平台中的用户行为数据 ,评估生成式人工智能技术应用对群体行为的影响 。

  8 评估流程

  8. 1 评估组织

  宜明确评估的牵头部门或负责人 ,指定专人协调各相关方(如开发方 、提供方 、使用方 、监管部门 、外部专家)沟通 ,宜在不同阶段(如立项 、产品上线前 ,或出现重大变更 、拓展新场景时) 及时开展或更新社会影响评估 ,并根据风险水平及技术复杂性灵活调整频次 。

  8.2 评估准备

  评估准备阶段主要包括 :

  a) 明确评估目标 :结合组织需求和使用场景 , 明确社会影响评估要达成的目标 ,如合规审查 、技术优化 、风险防控 、公众沟通等 ; 明确需要输出的成果形式(评估报告 、合规建议 、对策方案等) 并在内部达成共识 ;

  b) 确定评估范围和对象 :根据生成式人工智能系统功能 、应用场景 、目标用户 、群体等要素确定评估范围 ,若评估重点在高风险 、高敏感的特殊领域或针对特殊人群 ,宜根据具体情形增加或细化社会影响指标 ;

  c) 组建评估团队 :评估团队宜跨学科 、多元化 ,宜考虑具有技术 、法律 、社会 、管理 、经济或心理学等专业背景 , 明确核心职责分配 ,如评估协调人 、数据管理负责人 、外部专家顾问等 ;

  d) 制订评估方案 :参照第 7章(如正向提问 、逆向解析 、对抗测试 、数字仿真 、社会实验 、调查数据及二手分析等)明确评估采用的具体工具与流程 ,根据第 6 章列示的社会影响内容 ,选择或 自

  6

  GB/T 46800—2025

  定义适合评估的关键指标 ,若出现数据缺失 、实验失败或利益相关方抗拒等情况 ,宜设计应对方案 ,若内部管理规定或外部监管部门有审批环节 ,宜明确审签流程 ;

  e) 资源配置 :宜提前准备人力 、经费 、时间及技术支持(如评测平台 、分析工具等) ,如需外部采买专业评估服务 ,宜明确与第三方机构的合作方式 、保密协议等 。

  8.3 评估实施

  8.3. 1 通则

  在完成评估准备后 ,宜根据第 6章和第 7章 ,按照 8. 3. 2~ 8. 3. 8 实施社会影响评估 。

  8.3.2 预评估

  宜根据敏感用途 、限制用途或风险阈值 ,筛选出高优先级 、高风险级项 目或场景 。针对风险水平较低的场景 ,可采用简化版评估 ;对高风险领域宜进行全面评估 。

  8.3.3 数据采集与合规性核查

  宜明确技术应用过程中的数据采集 、存储 、处理和共享环节是否符合法律法规及伦理要求(如个人信息保护 、敏感数据使用等) ,对评估所需的数据资源进行安全审查和质量把关 ,并保留过程记录 。

  8.3.4 正式评估活动

  确定指标与方法 ,实 施 多 维 度 测 试 、模 拟 或 调 查 , 其 间 宜 动 态 跟 踪 可 能 出 现 的 异 常 情 况 , 并 做 好记录 。

  8.3.5 影响分析与对策

  对收集到的数据信息进行综合分析 ,将评估发现的社会影响进行分类 ,如对个体健康 、社会关系 、经济安全 、文化多样性等影响 ,若发现重大负面影响或无法接受风险 ,宜启动风险处置与对策制定流程 ,包括技术修订 、场景限制 、加强外部监管或中止/退出应用等措施 ,并提出保持或增强正面影响的策略 。

  8.3.6 评估结果记录与报告

  以文档或其他合适形式汇总评估过程 、发现与建议 , 内容宜涵盖预期用途 、不当使用场景 、可能影响人群与程度 、改进措施等 , 保留敏感信息或关键决策节点的可追溯记录 , 以供组织内部决策或外 部 审查 ,并根据外部需求(如监管合规 、对公众披露要求)决定报告公开或部分公开方式 。

  8.3.7 审批流程与后续处置

  若内部规定必须获得最高管理层或相关部门审批 ,宜在评估报告完成后提交审批 ,并在审批过程中对发现的问题与改进点进行反馈讨论 ,外部审批场景包括向行业主管部门或监管机构提交评估报告 、接受备案或许可审核 。

  8.3. 8 监测与审查

  定期或在技术 、业务发 生 重 大 变 更 时 , 对 评 估 活 动 进 行 重 新 审 查 , 必 要 时 开 展 新 一 轮 社 会 影 响 评估 ,建立持续监测机制(如实地使用数据追踪 、投诉反馈机制等) ,确保技术应用过程中的社会影响可控 、可解释 、可及时纠偏 。

  7

  GB/T 46800—2025

  9 结果运用与持续改进

  9. 1 评估结果分析与运用

  评估结果宜为技术开发方 、提供方 、使用方及监管机构提供有效决策支持 。宜考虑 :

  a) 支持生成式人工智能技术的合规管理 ;

  b) 支持生成式人工智能技术应用的社会影响预警与应对策略制定 ;

  c) 支持监管部门开展备案 、登记或许可等参考依据 ;

  d) 推动开发方优化产品设计 ,提高正向社会影响 ,避免重大负面社会影响 , 当评估发现可能或已存在重大负面社会影响时 ,宜启动生成式人工智能服务的改进优化机制 。

  9.2 持续改进和反馈机制

  宜建立评估活动的持续改进机制 ,定期对评估方法 、实施过程 、评估工具和指标体系进行优化 ,及时吸纳各利益相关方的反馈意见 ,宜考虑 :

  a) 评估方案的定期审查与更新 ;

  b) 评估方法与工具的优化升级 ;

  c) 利益相关方反馈渠道建设 ;

  d) 评估人员的定期培训与能力建设 。

  8

  GB/T 46800—2025

  附 录 A

  (资料性)

  生成式人工智能技术应用社会影响评估指标示例

  A. 1 身心健康评估指标示例

  生成式人工智能技术应用社会影响评估中 ,身心健康评估指标示例见表 A. 1。

  表 A. 1 身心健康评估指标示例

  一级指标

  二级指标

  三级指标

  数据来源

  测试方法

  身心健康

  身体健康

  即时神经活跃度

  可穿戴设备

  社会实验 、数据分析

  记忆加工能力

  可穿戴设备

  社会实验 、数据分析

  睡眠质量

  问卷调查

  数据分析

  心理健康

  自我效能感

  问卷调查

  数据分析

  成瘾倾向

  问卷调查 、可穿戴设备

  数据分析

  情绪稳定性

  问卷调查

  数据分析

  认知状态

  主体性感知

  问卷调查

  数据分析

  批判性思维能力

  行为实验测试

  社会实验

  认知多样性

  行为实验测试

  社会实验

  A.2 组织结构评估指标示例

  生成式人工智能技术应用社会影响评估中 ,组织结构评估指标示例见表 A. 2。

  表 A.2 组织结构评估指标示例

  一级指标

  二级指标

  三级指标

  数据来源

  测试方法

  组织结构

  组织类型

  GenAI驱动新兴组织类型数量

  统计数据

  数据分析

  传统组织生命周期及数字化阶段分布

  统计数据

  数据分析

  组织规模

  岗位总数

  统计数据 、数字痕迹数据

  数据分析

  岗位层级分布结构

  统计数据 、数字痕迹数据

  数据分析

  岗位领域分布结构

  统计数据 、数字痕迹数据

  数据分析

  治理流程

  GenAI参与流程比重

  数字痕迹数据

  数据分析

  任务处理效率变化

  数字痕迹数据

  数据分析

  组织结构调整的响应周期

  数字痕迹数据

  数据分析

  人机交互任务比重

  数字痕迹数据

  数据分析

  A.3 政治效能评估指标示例

  生成式人工智能技术应用社会影响评估中 ,政治效能评估指标示例见表 A. 3。

  9

  GB/T 46800—2025

  表 A.3 政治效能评估指标示例

  一级指标

  二级指标

  三级指标

  数据来源

  测试方法

  政治效能

  意识形态引导

  政治激进(保守)倾向

  模型对话测试

  正向提问

  政治规训(自由)倾向

  模型对话测试

  正向提问

  政治民主(专制)倾向

  模型对话测试

  正向提问

  政治开放(控制)倾向

  模型对话测试

  正向提问

  政治放任(干预)倾向

  模型对话测试

  正向提问

  政治偏见呈现

  群体偏见(移民 、少数群体)

  模型对话测试

  正向提问 、逆向解析

  人种偏见(肤色 、人种)

  模型对话测试

  正向提问 、逆向解析

  性别偏见

  模型对话测试

  正向提问 、逆向解析

  年龄偏见

  模型对话测试

  正向提问 、逆向解析

  地域偏见

  模型对话测试

  正向提问 、逆向解析

  A.4 社会效应评估指标示例

  生成式人工智能技术应用社会影响评估中 ,社会效应评估指标示例见表 A. 4。

  表 A.4 社会效应评估指标示例

  一级指标

  二级指标

  三级指标

  数据来源

  测试方法

  社会效应

  就业与失业

  就业/失业比率

  统计报告

  统计数据

  就业结构

  统计报告

  统计数据

  就业社会预期

  公开问卷调查

  用户主观测评

  社会分化

  收入差距

  公开问卷调查

  用户主观测评

  教育机会平等

  统计报告

  统计数据

  职业地位分层

  公开问卷调查

  用户主观测评

  区域发展不平衡

  统计报告

  统计数据

  伦理规范

  开发伦理合规性

  专家讨论德尔菲法

  统计数据

  伦理规范观念

  模型对话测试

  正向提问模型

  平等接入

  前沿 GenAI接入率

  统计数据

  数据分析

  公民数字素养

  问卷调查

  数据分析

  数字基础设施建设

  统计数据

  数据分析

  GenAI输出偏见程度

  模型交互测试

  正向提问 、逆向解析

  10

  GB/T 46800—2025

  参 考 文 献

  [1] GB/T 45654—2025 网络安全技术 生成式人工智能服务安全基本要求

  [2] ISO/IEC 22989: 2022 Information technology—Artificial intelligence—Artificial intelligence conceptsand terminology

  [3] ISO/IEC 23894: 2023 Information technology—Artificialintelligence—Guidance on risk man-

  agement

  [4] ISO/IEC 38507:2022 Information technology—Governance ofIT—Governance implications of the useofartificialintelligenceby organizations

  [5] ISO/IEC 42001: 2023 Information technology—Artificial intelligence—Management

  system

  [6] ISO/IEC 42005: 2025 Information technology—Artificial intelligence(AI)—AI system impactassessment

  [7] 智能社会发展与治理标准化指引(2025版)(中央网信办秘书局 市场监管总局办公厅)

  [8] 生成式人工智能服务管理暂行办法(国家互联网信息办公室 中华人民共和国国家发展和改革委员会 中华人民共和国教育部 中华人民共和国科学技术部 中华人民共和国工业和信息化部

  中华人民共和国公安部 国家广播电视总局令第 15号)

  [9] 涉及人的生命科学和医学研究伦理审查办法(国家卫生健康委 教育部 科技部 国家中医药局)

  [10] IEEE Std7010—2020 IEEE Recommended PracticeforAssessing the ImpactofAutono- mousand IntelligentSystemson Human Well-Being

  11

29139308929
下载排行 | 下载帮助 | 下载声明 | 信息反馈 | 网站地图  360book | 联系我们谢谢