专利类型:发明专利
语 言:中文
申 请 号:CN201310037662.1
申 请 日:20130131
发 明 人:张小洪杨丹李珩谢娟成正斌洪明坚葛永新杨梦宁徐玲胡海波
申 请 人:重庆大学
申请人地址:400044 重庆市沙坪坝区沙正街174号
公 开 日:20130522
公 开 号:CN103116625A
代 理 人:
代理机构:
摘 要:本发明公开了一种基于Hadoop平台的海量RDF数据分布式查询处理方法,属于计算机领域。所述方法主要包括以下步骤,步骤a:将RDF数据上传至HDFS中,通过Hadoop平台的MapReduce框架读取数据并存储在分布式数据库HBase中;步骤b:对用户提交的SPARQL查询语句段进行预处理,对语句进行解析并提取出其中的前缀声明、结果变量、图模式子句;c:还原图模式子句中的前缀字符,将还原后的图模式子句转化为树模型;d:分解树模型,以自底向上、自左向右的方式遍历树节点并生成匹配各节点的查询计划,将最终的查询计划发送到Hadoop平台;e:通过MapReduce框架从HBase中读取数据,按照查询计划执行分布式查询,最后按结果变量返回查询结果。
主 权 项:一种基于Hadoop的海量RDF数据分布式查询处理方法,利用MapReduce框架对存储于分布式数据库HBase中的RDF数据进行SPARQL查询,所述方法包括:步骤a:将RDF数据上传至HDFS中,通过Hadoop平台的MapReduce框架读取数据将其并行存储在HBase中;步骤b:对用户提交的SPARQL查询语句段进行预处理,对语句进行解析并提取出其中的前缀声明、结果变量、图模式子句;步骤c:还原图模式子句中的前缀字符,将还原后的图模式子句转化为树模型,以树的结构来表示查询语句的完整图模式;步骤d:分解树模型,以自底向上、自左向右的方式遍历树节点并生成匹配各节点的查询计划,并将查询计划发送到Hadoop平台;步骤e:通过MapReduce框架从HBase中读取数据,按照查询计划执行分布式查询,最后按结果变量返回查询结果。
关 键 词:
法律状态:生效
IPC专利分类号:G06F17/30(2006.01)I