GB/T 46801-2025 人工智能社会实验 设计指南
- 名 称:GB/T 46801-2025 人工智能社会实验 设计指南 - 下载地址1
- 下载地址:[下载地址1]
- 提 取 码:
- 浏览次数:3
发表评论
加入收藏夹
错误报告
目录| 新闻评论(共有 0 条评论) |
资料介绍
ICS 35.240. 01 CCS L 67
中 华 人 民 共 和 国 国 家 标 准
GB/T 46801—2025
人工智能社会实验 设计指南
Artificialintelligencesocialexperiment—Design guidelines
2025-12-02发布 2025-12-02实施
国家市场监督管理总局国家标准化管理委员会
发
布
GB/T 46801—2025
目 次
前言 Ⅲ
引言 Ⅳ
1 范围 1
2 规范性引用文件 1
3 术语和定义 1
4 总体原则 2
4. 1 遵循科研伦理 2
4. 2 遵照实验逻辑 2
4. 3 执行随机处理 2
4. 4 规范设计流程 2
5 实验方法选取 2
5. 1 自然实验 2
5. 2 实地实验 2
5. 3 调查实验 3
5. 4 计算实验 3
6 实验干预设计 3
6. 1 明确干预变量 3
6. 2 开展预实验 3
6. 3 科学选取实验对象 3
6. 4 随机化分组 3
6. 5 干预效果评估 3
7 实验指标测量设计 4
7. 1 统计类指标 4
7. 2 调查类指标 4
7. 3 行为痕迹类指标 4
8 实验数据处理设计 4
8. 1 样本描述分析设计 4
8. 2 因果效应分析设计 5
8. 3 因果机制分析设计 5
参考文献 6
Ⅰ
GB/T 46801—2025
前 言
本文件按照 GB/T 1. 1—2020《标准化工作导则 第 1部分 :标准化文件的结构和起草规则》的规定起草 。
GB/T 46801《人工智能社会实验 设计指南》与 GB/T 46802《人工智能社会实验 实施指南》和GB/T 46799《人工智能社会实验 评价指南》共同构成支撑人工智能社会实验开展的国家标准体系 。
请注意本文件的某些内容可能涉及专利 。本文件的发布机构不承担识别专利的责任 。
本文件由全国智能技术社会应用与评估基础标准化工作组(SAC/SWG 35)提出并归 口 。
本文件起草单位 :浙江大学 、合肥清和智能科技有限公司 、清华大学 、中共鄂尔多斯市委员会网络安全和信息化委员会办公室 、中国标准化研究院 、润泽智算科技集团股份有限公司 、浙江省人民医院 、上海计算机软件技术开发中心 、深圳市坪山区政务服务和数据管理局 、之行智库(杭州) 有限公司 、灵心巧手(北京)科技有限公司 、贵州大学 、枣庄市网络安全保障中心 、哈尔滨工业大学(深圳) 、青岛通产智能科技股份有限公司 。
本文件主要起草人 : 黄萃 、苏竣 、周超男 、钟军 、魏钰明 、尚二平 、王永杰 、张芳 、汝鹏 、陈俊华 、刘洋 、金东 、李笠 、张娴 、祝敬 、沈诚 、曹岗 、池 浩 、王 宇 、李 翰 林 、吕 立 远 、岑 晓 腾 、杨 庆 丰 、陈 敏 刚 、王 旭 、郭 腾 、何道敬 、郭小璇 。
Ⅲ
GB/T 46801—2025
引 言
人类社会正迈向以人工智能为关键技术支撑的智能社会 。 总结形成智能社会发展与治理的经验规律和理论 ,超前探索智能社会发展与治理的标准规范 ,完善适应智能社会发展与治理的体制机制 ,将有效支撑国家治理体系和治理能力现代化建设 。
人工智能社会实验是探索智能社会发展与治理路径的关键方法 ,也是智能社会发展与治理标准化的基础方法之一 。通过开展长周期 、宽区域 、多学科的人工智能社会实验 , 系统识别 、界定 、观测和评估特定智能技术社会应用场景的影响 ,分析可能带来的治理挑战 ,总结应对措施 ,形成解决方案和规范 ,对于合理规制技术应用社会风险 ,促进技术良性发展具有重要意义 。
我国已经建立了支撑人工智能社会实验开展的国家标准体系 。 在该标准体系中 ,GB/T 46801《人工智能社会实验 设计指南》目的在于提供人工智能社会实验设计的基本方法准则 ,给出人工智能社会实验方法体系 、设计原则 、适用场景 、操作建议 ,为从事人工智能社会实验工作的相关技术主体 、应用主体 、研究主体提供参考 ,指导人工智能社会实验相关工作的开展 ,从而提高实验设计的科学性 、规范性 。
Ⅳ
GB/T 46801—2025
人工智能社会实验 设计指南
1 范围
本文件确立了人工智能社会实验设计的总体原则和阶段程序 ,提供了人工智能社会实验方法体系 、设计原则 、适用场景 、操作方案等方面的指导和建议 ,并给出了示例 。
本文件适用于指导人工智能社会实验应用主体 、研究主体和技术主体等相关方开展人工智能社会实验的设计工作 。
2 规范性引用文件
本文件没有规范性引用文件 。
3 术语和定义
下列术语和定义适用于本文件 。
3. 1
人工智能社会实验 artificialintelligencesocialexperiment
将特定人工智能技术引入社会活动 ,形成人工智能应用场景 ,通过设计实验 ,将应用场景中的泛意性影响转变为内涵清晰 、概念准确的可测度变量 ,并采用科学的方法进行跟踪和分析微观个体 、中观组织 、宏观社会系统的发展变化 , 以全面评估人工智能应用的实际影响和潜在风险 ,进而提出对策建议的过程 。
注 1: 人工智能社会实验主要采用 自然实验 、实地实验 、调查实验和计算实验四类方法 。
注 2: 人工智能社会实验通常包括组织应用 、科学测量 、综合反馈三个实验阶段 。
3.2
自然实验 naturalexperiment
借助由 自然事件 、重大政策 、偶然事件等外生因素创设的人工智能应用场景 , 寻找其对于社会群体的近似随机干预效果 ,进而将样本划分为实验组和对照组 ,观测和采集不同分组受试者的表征数据 , 比较分析实验组和对照组的组间差异 ,判断人工智能应用对被试对象产生影响程度的社会实验方法 。
3.3
实地实验 field experiment
由实验者自主构造人工智能应用场景 ,并随机将其分配给被试对象 ,确定实验组和对照组 ,采集和观测不同分组受试者的表征数据 , 比较分析实验组和对照组的差异 ,评估人工智能应用对被试对象产生影响效应的社会实验方法 。
3.4
调查实验 survey experiment
研究者通过将自主构 造 的 人 工 智 能 应 用 场 景 描 述 信 息 嵌 入 到 问 卷 调 查 中 , 并 随 机 分 配 给 被 试 对象 ,确定实验组和对照组 ,观测和采集不同分组受试者应答问卷的表现差异 ,判断基于描述信息模拟的
1
GB/T 46801—2025
人工智能应用场景对被试对象产生影响程度的社会实验方法 。
3.5
计算实验 computationalexperiment
通过计算仿真建模 ,对难以在真实社会中构造或开展追踪观测的人工智能应用场景进行模拟 ,再现社会系统的基本环境 、不同类型主体的行为特征与交互关系 ,通过对模拟样本动态变化的比较分析 ,揭示人工智能技术应用影响社会活动演化规律的社会实验方法 。
4 总体原则
4. 1 遵循科研伦理
宜严格谨慎遵循尊重 、不伤害 、有利 、公正等基本科研伦理 ,充分尊重被试对象的 自主性 ,确保被试者的知情同意权 、数据信息隐私权得到有效保护 , 降低被试对象需要承担的风险和伤害 ,充分保障研究的程序公正 、回报公正 、分配公正 ,强化对弱势群体的保护 , 防止引发新的不平等现象 。
4.2 遵照实验逻辑
宜严格遵照 “控制—对照—比较 ”的实验推理逻辑 , 明确区分实验组和对照组 。 实验组和对照组被试对象之间的关键差异 为 是 否 受 到 待 检 验 人 工 智 能 应 用 场 景 干 预 的 影 响 , 并 在 其 他 变 量 上 实 现 高 度匹配 。
4.3 执行随机处理
宜通过被试对象的随机化处理 ,消除实验组和对照组在实验前存在的系统性差异 ,增强人工智能社会实验内外部效度与信度 ,具体包括 :
a) 在实验方案设计阶段 ,宜根据问题类型 ,综合运用简单随机化 、分层随机化 、区块随机化等随机化方法 ,设计随机化处理方案 ;
b) 在执行实验设计阶段 ,宜检查是否存在实验组未接受干预和对照组接受干预等异常情况 ,并对相关被试对象进行处理 ;
c) 对于自然实验等难以实现完全随机化的实验类型 ,宜关注影响被试对象接受干预的因素 ,并在数据分析过程中加以控制 。
4.4 规范设计流程
宜根据不同场景和研究问题的特点,选择适配的实验方法(见第 5 章) ,并有序开展实验干预设计(见第 6章) 、指标测量设计(见第 7章)和数据处理设计(见第 8章) 。
5 实验方法选取
5. 1 自然实验
自然实验适用于智能技术作用在宏观社会系统 、中观组织和微观个人层面影响分析 。如人工智能应用场景政策规划的社会影响评估 、各类人工智能应用平台上线的效果评估 、人工智能应用相关突发事件的社会影响评估 。
5.2 实地实验
实地实验适用于智能技术作用在中观组织和微观个人层面影响分析 。如在机构 、行业或特定社会
2
GB/T 46801—2025
单元部署 ,对不同人工智能应用功能的效能效果评估 ;在不同人工智能应用条件中 ,对用户行为和心理认知的评估研究 。
5.3 调查实验
调查实验适用于智能技术作用在微观个人层面的影响分析 。如微观个人对于现实世界中尚不存在的假想人工智能应用场景的态度与认知研究 ;微观个人对于现实世界中大规模推广成本较高或暂未实现大规模推广 ,仅在小规模试点应用的人工智能应用场景的态度与认知研究 。
5.4 计算实验
计算实验适用于智能技术作用在宏观社会系统和中观组织层面影响分析 。如人工智能应用场景的社会舆情演化 、经济效益模拟 、行业生态模拟研究 , 以及人工智能应用场景下微观个人心理认知对宏观社会系统和中观组织的影响机制研究 。
6 实验干预设计
6. 1 明确干预变量
宜根据不同地区 、不同领域 、不同场景条件 ,设计相匹配的人工智能应用场景干预手段 。 干预变量可以为人工智能应用本身或基于人工智能应用衍生的新兴制度 、商业模式 、政策措施等环境变量 。干预形式可以为被试者在物理空间中接受的真实干预 ,或借助网页 、视频等现代信息手段构建的模拟干预 。
6.2 开展预实验
正式开展实验前 ,宜专门设计覆盖一定规模样本的预实验环节 ,用以了解样本对实验干预的潜在反应是否符合预期 ,避免样本因感知实验干预过于困难 、过于简单 、过于不切实际等问题而出现异常实验反应 。
6.3 科学选取实验对象
宜根据实验的主要目的和内容 ,结合研究对象的特征和可用资源 ,科学选取被试对象 。如研究人工智能应用场景对特定地区或特定领域总人口产生影响的社会实验 ,宜在综合考虑总人口规模 、分布等因素基础上 ,运用科学的抽样方法 ,选定具有代表性的被试对象 。
6.4 随机化分组
宜根据研究问题和被试对象的特点,设计适当的随机化分组处理方案 ,设计要点包括 :
a) 宜优先采用完全随机化分组 ,通过随机数生成等机制 ,确保每个被试对象被分配到实验组或对照组的概率完全相同 ,最大限度消除选择偏差 ;
示例 1: 研究人工智能教学软件对 100名学生学习效果的影响 ,可使用随机数表将学生编号 1~ 100,抽取奇数进入实验组(使用智能教学软件) ,偶数进入对照组(不使用智能教学软件) 。
b) 若不能实现完全随机化分组 ,宜根据被试对象的某些重要特征进行分层选取 ,在分层内实现随机化分组 。
示例 2: 研究人工智能诊疗系统对医院诊疗效果的影响时 , 可 先 按 医 院 等 级(三 甲/二 甲) 分 层 ,再 在 各 等 级 内 随 机分配医院至实验组或对照组 ,避免医院水平等级差异干扰评估结果 。
6.5 干预效果评估
宜设计专门环节 ,对实验干预效果进行评估 , 以确保实验干预的科学性 、有效性 。针对不同类型的
3
GB/T 46801—2025
人工智能社会实验方法 ,实验干预效果评估关注的要点分别包括 :
— 开展自然实验时 ,宜重点关注被试对象分组的随机化程度 , 即是否有混淆因素显著影响了被试接受干预的概率 , 以及实际中的分组情况与理论上预期的分组情况存在多大程度的差异 ;
— 开展实地实验时 ,宜重点关注被试对象对于实验干预的遵从程度 , 即受试者在多大程度上完全遵循实验者的安排 ;
— 开展调查实验时 ,宜重点关注被试对象在阅读实验干预材料时的专注程度和对实验干预材料的理解程度 ,确保实验对象准确理解干预材料试图传递的干预信息 ;
— 开展 计 算 实 验 时 , 宜 重 点 关 注 仿 真 模 型 基 础 参 数 设 定 的 来 源 、依 据 及 其 与 真 实 情 况 的 拟 合程度 。
7 实验指标测量设计
7. 1 统计类指标
统计类指标宜作为研 究 特 定 人 工 智 能 应 用 场 景 对 宏 观 社 会 系 统 、中 观 组 织 所 产 生 影 响 的 测 量 指标 ,也可在研究人工智能应用场景对中观组织和微观个人所产影响时 ,用以测量中观组织和微观个人所处的外部环境特征 。统计类指标包括但不限于 :
a) 宏观社会经济发展指标 ,如国民经济统计指标 、社会发展统计指标 、人口普查统计指标等 ;
b) 中观组织 、行业层面的专业数据统计指标 ,如工商企业注册相关数据统计指标 、全国税收相关数据统计指标 、上市公司相关数据统计指标 、专利相关数据统计指标 。
7.2 调查类指标
调查类指标宜作为研究特定人工智能应用场景对中观组织和微观个人所产生影响的测量指标 。调查类指标包括但不限于 :
a) 被试对象的人口统计特征指标 : 如被试对象的年龄 、性别 、地区 、职业 、政治面貌 、婚姻状况等指标 ;
b) 被试对象的心理认知指标 :如被试对象的态度 、认知 、偏好与观点类指标 ,宜充分利用现有科学文献已经编制成熟并经过反复检测的量表进行测量 。
7.3 行为痕迹类指标
行为痕迹类指标宜作为研究特定人工智能应用场景对中观组织和微观个人的行为所产生影响的直接观测指标 。行为痕迹类指标包括但不限于 :
a) 结构化的行为痕迹指标 ,如微观个人被试对象使用智能技术应用的时长 、地理空间足迹 、社交媒体好友关系 , 中观组织被试对象的研发投入 、纳税额 、专利申请等 ;
b) 非结构化的行为痕迹指标 ,如被试对象对新闻消息的评论数据 、被试对象在社交媒体发布的信息数据等 。
8 实验数据处理设计
8. 1 样本描述分析设计
对实验数据的处理 ,宜首先对被试对象的分组规则和基本统计结果进行描述和分析 ,证明实验组与对照组在控制变量层面无显著差异 ,并验证实验干预对被试对象的结果变量产生了影响 。分析项 目包括但不限于 :
4
GB/T 46801—2025
a) 观测样本数目 ;
b) 各组变量数据的均值 、中位数 、四分位数 、最大值 、最小值 ;
c) 各组变量数据的标准差 、方差 ;
d) 各组变量数据分布的偏度 、峰度 ;
e) 实验组和对照组被试对象涉及的不同变量数据的平均值比较和显著性差异检验结果 。
8.2 因果效应分析设计
对人工智能应用场景干预的因果效应的分析 ,宜根据实验场景和研究问题的特点,选择适当的数理统计分析模型 ,如双重差分模型 、断点回归模型 、工具变量模型 、合成控制模型等 。
8.3 因果机制分析设计
在分析人工智能应用场景干预的因果效应基础上 ,宜进一步揭示人工智能应用场景发挥作用的机制 ,如利用中介效应 、调节效应 、因果机器学习 、多智能体仿真等定量分析方法 ,分析人工智能应用场景的作用机理 ,或通过参与式观察 、内容分析 、深度访谈等定性研究方法 ,深度挖掘人工智能应用场景的作用机制 。
5
GB/T 46801—2025
参 考 文 献
[1] 中央网信办秘书局 、市场监管总局办公厅 . 智能社会发展与治理标准化指引(2025版)
[2] 苏竣 ,黄萃 . 社会实验理论与方法评价[M] . 北京 : 清华大学出版社 ,2023.
6
相关推荐
- GB∕T 18993.5-2020 冷热水用氯化聚氯乙烯(PVC-C)管道系统 第5部分:系统适用性
- GB/T 23370-2009 硬质合金 压缩试验方法
- GB/T 24067-2024 温室气体 产品碳足迹 量化要求和指南
- GB/T 24338.4-2018 轨道交通 电磁兼容 第3-2部分:机车车辆 设备
- GB/T 13534-2009 颜色标志的代码
- GB/T 41900-2022 罐头食品代号 含2024年第1号修改单
- GB/T 18856.4-2008 水煤浆试验方法 第4部分:表观粘度测定
- GB/T 21405-2008 往复式内燃机 发动机功率的确定和测量方法 排气污染物排放试验的附加要求
- GB/T 37618-2019 渗氮钢
- GB/T 25022.3-2023 轨道交通 机车车辆电连接器 第3部分:通信控制连接器

