浏览量:0

基于多模态数据的突发公共安全事件检测方法

专利类型:发明专利 

语 言:中文 

申 请 号:CN201910371529.7 

申 请 日:20190506 

发 明 人:尹宏鹏柴毅周瀚孙川 

申 请 人:重庆大学 

申请人地址:400044 重庆市沙坪坝区沙正街174号 

公 开 日:20190913 

公 开 号:CN110232158A 

代 理 人: 

代理机构: 

摘  要:本发明公开一种基于多模态数据的突发公共安全事件检测方法。该方法包括以下步骤,步骤一:建立突发公共安全事件的词表;步骤二:爬虫获取社交媒体数据,获取数据属性特征;步骤三:基于提取信息,利用多模态稀疏自编码机学习统一特征,随后将每条数据结构化为三元组;步骤四:采用增量聚类的方法,生成事件簇;步骤五:基于建立的突发公共安全事件词表,对得到的事件簇进行筛选,提取突发公共安全事件。本发明所述方法特征提取过程中考虑到多模态信息,可从多个角度对社交媒体数据进行理解。此外,采用增量聚类算法进行事件检测能处理社交媒体数据流,检测出社交媒体中所含有的突发公共安全事件,为进一步的舆论分析提供一定支持。 

主 权 项:1.一种基于多模态数据的突发公共安全事件检测方法,包括如下步骤:步骤1:建立突发公共安全事件的词表。步骤2:爬虫收集大量含有成对文本、图像的社交媒体数据,抽取每条数据的时间、地点属性,以及文本特征、图像特征。步骤3:将Wk中的文本特征向量Tk与图片特征向量Ik输入由两个稀疏自编码机组成的多模态稀疏自编码机中,获取能同时表达文本和图像的统一特征,Gk即为第k条数据的内容特征,将每条数据结构化为<时间,地点,内容>三元特征组。步骤4:将每条数据的三元组依次与已有的事件簇进行相似度比较,若相似高于阈值,则将该条数据并入相似度最高的事件簇,否则以该条数据为基础,生成一个新的事件簇。步骤5:对得到的事件簇进行筛选,获取该簇中的关键词,与构造的突发公共安全词表进行对比,若该簇的关键词中含有大量突发公共安全词语,则将该事件簇记为突发公共安全事件。 

关 键 词: 

法律状态: 

IPC专利分类号:G06F16/9536;G06Q50/26