网络话题中的web文本挖掘技术作者:翁彧 编出版时间:2012年版内容简介 互联网作为当今世界最大的数据存储空间,以其迅捷的速度、海量的资源、灵活方便的访问方式,逐渐受到社会大众广泛的喜爱。互联网中信息资源的健康程度,严重影响着网民心理取向的良性发展。本研究针对目前网络环境中不断出现的社会不良敏感信息,以校园暴力、不良心理等校园网络文化现象作为切入点,借助话题识别与追踪、文本倾向性分析以及网络舆情评估等Web文本挖掘前沿技术,抽取并发现海量Web数据中有悖于正常社会文化趋向的敏感话题,分析话题传播及扩散程度,动态评估网络警情发生、发展变化态势,协同调度不同网域环境中最新话题检测结果,建立一套网络协同环境下敏感话题检测与评估系统,为相关网络监管部门建立有效的预警机制提供理论依据与数据支撑,主要研究进展。目录第1章 引言11 技术背景12 研究内容13 主要贡献14 本书结构第2章 相关研究综述21 话题检测与追踪研究进展22 文本倾向性分析方法23 网络舆情监控系统现状24 本章小结第3章 网络敏慼话题检测摸型框架及描述31 问题描述32 整体框架33 概念定义与数据流分析第4章 敏感话题检测与识别41 问题描述及模型工作流程42 主题特征抽取与发现43 事件特征动态追踪44 敏感话题语义知识库构建45 讨论与比较46 本章小结…… 上一篇: 一本书读懂大数据(全彩图解版) 下一篇: 图解大数据 [日] 大河原克行著