人机交互中的体态语言理解作者:徐光祐,陶霖密,邸慧军 著出版时间:2014年版内容简介 以人为中心的人机交互,要求人机交互需要从目前占主导的,由用户直接操作进行的“显式交互”方式扩展到通过体态语言进行的“隐式交互”方式。体态语言理解是其中的关键问题。本书论述了与此相关的心理学和脑神经学基本概念,通过多模态信息处理来识别和理解体态语言是从非结构化的多模态传感器数据到高层语义的多层次特征检测和推理过程,也是一个约束不充分的逆向求解问题。本书对觉察上下境计算支撑的视觉处理和理解做了系统的论述,同时也介绍了上下境定义、上下境模型和觉察上下境计算的基本概念。主要包括:基于广义弹性运动跟踪的人体动作分析,三维空间人体定位与体态估计,容忍视角和距离变化的人体动作识别,日常生活中动作(ADL)识别和理解,基于动态上下境模型的群体交互行为分析,支持觉察上下镜计算的分布式多模态信息处理系统。典型应用是面向老人生活和健康看护的“日常生活动作识别”(ADL),和以会议自动分析为代表的群体行为分析。本书创新性强,内容系统、全面,深入浅出。目前国内相关领域的理论著作尚属于空白,在国际上也还缺乏系统的理论。本书的出版将对我国人机交互领域、体态语言理解的理论研究和学科发展具有重要的参考价值和指导意义。目录第1章 以人为中心的人机交互与体态语言理解 11.1 以人为中心的人机交互 11.1.1 普适计算和背景智能 31.1.2 物理―信息对偶空间 41.1.3 隐式人机交互和觉察上下境计算 111.2 非语言行为和体态语言 161.2.1 人际通信中的非语言行为 161.2.2 体态语言传递什么样的信息 191.2.3 体态语言与语言通信的关系 201.2.4 体态语言的信息集群 211.3 非语言通信与社交行为 221.3.1 非语言行为线索与社交信号 241.3.2 面对面的社交行为 261.4 社交信息处理和社交智能 271.4.1 社交能力与动作理解 271.4.2 社交信息处理 281.4.3 社交智能 301.5 以人为中心的人机交互正在走向现实 321.5.1 “人―机器人交互” 321.5.2 计算机为媒介的远程交互系统 351.5.3 背景智能和智能辅助生活 38参考文献 38第2章 动作理解的心理和神经机制基础 482.1 动作理解中所涉及的问题 492.2 共同编码理论简介 542.3 动作的表示和内容 592.3.1 动作是什么和动作的产生 602.3.2 运动想象是进入动作表示阶段的窗口 612.3.3 动作意图、规划、准备和执行之间的关系 652.3.4 人类视觉系统中的子系统 662.3.5 动作表示内容 672.4 镜面神经系统和它在动作识别中的作用 692.4.1 猴子和人体中的镜面神经系统 702.4.2 镜面神经系统在动作识别和理解中的功能 712.5 动作的共享表示 752.5.1 动作表示的不同层次 752.5.2 语义表示和实用表示 762.5.3 共享的是感知表示还是运动表示 772.5.4 动作表示的方式 782.6 人体与物体的交互与可承受性 802.6.1 Gibson的可承受性理论 812.6.2 可承受性与动作理解 832.6.3 可承受性和与物体交互 872.7 人类动作理解中的功能机理和神经网络 892.7.1 视觉理解理论简介 902.7.2 对基于计算机视觉的动作理解的启发 92参考文献 95第3章 基于觉察上下境计算的体态语言理解 1033.1 体态语言理解问题的本质 1043.1.1 体态语言是人类的自然行为 1043.1.2 体态语言线索、体态语言信号和体态语言 1053.1.3 体态语言理解需要觉察上下境计算的支持 1073.2 体态语言线索检测 1083.3 体态语言信号检测 1103.4 上下境和上下境模型 1123.4.1 上下境信息在体态语言理解中的作用 1123.4.2 上下境的定义 1133.4.3 上下境模型 1163.5 觉察上下境计算与系统 1193.5.1 觉察上下境系统组成 1213.5.2 觉察上下境系统的应用和性能 1243.5.3 人体行为理解的研究现状和存在问题 1253.6 视觉信息处理中上下境的影响 1283.6.1 人类视觉系统中上下境影响的研究 1293.6.2 基于上下境的计算机视觉处理 1323.6.3 觉察上下境的计算机视觉处理 1373.7 基于觉察上下境计算的体态语言理解 1393.7.1 基于动态上下文模型的群体交互行为分析 1393.7.2 基于觉察上下境计算的人体日常活动识别和理解 1423.7.3 支持觉察上下境计算的分布式多模态信息处理系统 145参考文献 146第4章 基于广义弹性运动跟踪的人体运动分析 1554.1 研究现状 1574.1.1 弹性运动跟踪的研究现状以及本章研究思路的提出 1574.1.2 与广义弹性运动跟踪相关的研究工作 1584.2 基础弹性运动模型 1594.2.1 弹性运动的纤维束表示 1594.2.2 基于纤维束的融合思路 1604.2.3 混合的变换隐马尔科夫模型(MTHMM) 1614.2.4 模型的推理算法 1654.2.5 实验结果与讨论 1704.2.6 小结 1764.3 具有分类机制的弹性运动模型 1774.3.1 弹性运动的分段纤维束表示以及分类机制的思路 1774.3.2 具有分类机制的混合变换隐马尔科夫模型(MTHMM-C) 1794.3.3 模型的推理算法 1814.3.4 实验结果与讨论 1874.3.5 小结 1934.4 广义弹性运动跟踪的应用 1944.4.1 (半)自动建模 1944.4.2 人头姿态估计 1954.4.3 基于广义弹性运动跟踪的运动描述 196参考文献 198第5章 人体定位与体态估计 2015.1 基于多摄像机的人体粗定位 2025.1.1 多摄像机环境下的几何约束 2035.1.2 多摄像机人体定位算法 2055.1.3 实验结果 2075.1.4 小结 2115.2 多摄像机下人体头肩部轮廓跟踪与朝向估计 2125.2.1 多视角轮廓约束 2135.2.2 头肩部轮廓的形状表示和概率模型 2155.2.3 多视角联合跟踪模型 2245.2.4 度量表示与图像度量模型 2295.2.6 实验结果分析 2305.2.7 小结 2335.3 基于梯度朝向直方图的头部姿势估计 2345.3.1 基于梯度朝向直方图的二阶统计特征 2375.3.2 线性子空间方法 2385.3.3 实验结果 2395.3.4 小结 248参考文献 249第6章 可容忍视角、位置变化的人体动作识别 2516.1 基于时空表示的动作识别研究现状 2516.1.1 基于多视角样本 2556.1.2 基于不变量表示和不变量约束 2566.2 容忍视角变化的体态表示――包容形状 2586.2.1 动作识别中的视角变化 2586.2.2 预备分析 2596.2.3 包容形状的定义和推导 2606.2.4 动作识别实验 2636.2.5 非正交下双摄像机配置下的包容形状 2686.3 容忍位置变化和遮挡的自适应包容形状 2716.3.1 容忍位置变化的多摄像机系统 2726.3.2 容忍遮挡的自适应包容形状 2796.4 动作识别系统 2846.4.1 动作识别系统流程 2846.4.2 人体检测和特征提取 2856.4.3 体态表示和数据预处理 2866.5 结论和展望 291参考文献 292第7章 日常生活动作识别与行为分析 2957.1 基于计算机视觉的日常活动(ADL)识别和理解 2967.1.1 ADL识别和理解所面临的技术挑战 2967.1.2 ADL识别方法研究的现状 3007.1.3 基于计算机视觉的ADL识别的关键课题 3057.1.4 日常生活行为理解 3117.1.5 上下境信息的建模和使用 3167.2 容忍视角和距离变化的动作识别 3177.2.1 分层的动作识别 3187.2.2 多视角数据库IXMAS 3197.2.3 关注“焦点运动”的动作识别 3217.2.4 特征提取与动作表示 3237.2.5 基于VSI-Surf表示的动作识别方法 3327.3 支持觉察上下境计算的活动分析模型 3367.3.1 日常生活场景中的上下境 3387.3.2 觉察上下境的行为分析模型 3417.4 基于ADL-DBN模型的行为在线推理 3477.4.1 研究平台与应用场景 3487.4.2 底层视觉特征的提取 3507.4.3 环境上下境 3537.4.4 多层次动态贝叶斯网模型 3547.4.5 实验结果 3597.5 结论与展望 364参考文献 365第8章 基于动态上下境模型的群体行为分析 3768.1 群体交互行为分析的关键问题及研究现状 3768.1.1 会议群体动作分析中的关键问题 3778.1.2 会议动作自动分析的研究现状 3808.1.3 基于动态上下境模型的会议动作自动分析 3828.2 面向群体交互行为分析的动态上下境模型 3838.2.1 群体交互行为分析中的上下境定义 3848.2.2 动态上下境的分层结构 3858.2.3 动态上下境的模型的结构 3888.2.4 动态上下境模型的运行机制 3908.3 觉察上下境的多目标检测与跟踪算法 3918.3.1 方法概述 3938.3.2 人体检测 3968.3.3 人体跟踪 3998.3.4 高层上下境推理 4028.3.5 个体局部特征检测 4038.3.6 实验结果 4048.4 事件驱动的多层次DBN模型 4108.4.1 群体交互场景中的事件检测 4118.4.2 事件驱动的多层次DBN模型 4128.4.3 实验结果 4208.5 基于动态上下境的多层次事件自适应检测方法 4268.5.1 群体交互场景中的事件层次与处理粒度 4278.5.2 多层次事件自适应检测方法 4288.5.3 多层次事件自适应检测方法在会议分析中的应用 4338.6 小结 445参考文献 446第9章 支持觉察上下境计算的分布式多模态信息系统 4519.1 引论 4519.2 面向应用的服务共享模型(A-SSM) 4529.2.1 模型总体框架 4529.2.2 模型组成定义 4539.2.3 基于本体论的计算服务资源管理 4559.3 基于服务质量(QoS)的计算服务资源选择策略 4589.3.1 QoS计算参考公式 4589.3.2 基于层次分析法(AHP)理论估计属性权重 4599.3.3 计算服务资源选择算法 4609.4 适应服务共享模型的觉察上下境计算 4619.4.1 觉察上下境计算的“基元” 4619.4.2 觉察上下境计算算法的“基元”化组织 4669.5 分布式觉察上下境计算系统的总体结构设计 4679.6 分布式处理的总体结构设计 4689.6.1 数据/信息处理分析 4689.6.2 服务进程设计 4699.7 通用化平台的实现 4719.8 日常行为理解与隐式交互实例研究 4739.8.1 系统测试实验 4739.8.2 隐式交互实验环境及硬件配置 4759.8.3 实验数据的采集 4769.8.4 实验数据的标注 4799.8.5 知识辅助行为推理方法的实施 4809.9 小结 482参考文献 483附录A 三维圆柱人体模型 486附录B 摄像机偏离引起的包容形状误差分析 488 上一篇: 人机交互中人体工效模型的建立及其应用的研究 [周晓磊 著] 2014年版 下一篇: 人机工程学基础与应用 夏敏燕 著 2017年版