专利类型:发明专利
语 言:中文
申 请 号:CN201310184705.9
申 请 日:20130517
发 明 人:冯永刘晶
申 请 人:重庆大学
申请人地址:400044 重庆市沙坪坝区沙正街174号
公 开 日:20161228
公 开 号:CN103246740B
代 理 人:郭云
代理机构:重庆市前沿专利事务所(普通合伙) 50211
摘 要:本发明提出一种迭代的基于用户点击的优化搜索和满意度提升方法和系统,属于优化搜索领域。该方法为;A、根据搜索关键字,从查询日志中提取该关键字的点击的页面,从查询日志中提取点击这些页面的关键字,重复以上过程直至收敛,将这些关键字和相应点击页面构建成二部图,将此图作为输入,利用IA?CLICK方法进行相似度迭代计算;B、基于步骤A求出的页面对的相似度集合,利用相关度R(q,d)衡量公式求出用户提供的查询关键字和页面的相关度,进行搜索结果的重排序;C、利用用户对重排序搜索结果的点击情况,利用用户满意度us衡量公式进行搜索评价;本发明具有用户负担小、关联性强、评价框架简洁高效等特点;提高了方法的效果的真实性和灵活性。
主 权 项:一种迭代的基于用户点击的优化搜索和满意度提升方法,其特征在于,包括如下步骤:步骤1,根据用户搜索关键字得到的搜索结果汇总形成查询日志,利用查询日志构建查询关键字二部图,将查询关键字二部图作为输入,利用IA?CLICK相似度方法进行搜索结果迭代计算得到查询相似度和页面相似度;步骤1?1,根据用户搜索关键字得到的搜索结果,从查询日志中提取该关键字的点击的页面,从查询日志中提取点击这些页面的关键字,重复以上过程直至收敛,将所查询的关键字和相应点击页面构建查询关键字二部图;步骤1?2,将构建的查询关键字二部图作为输入,进行IA?CLICK相似度计算,利用页面相似度计算查询相似度,利用查询相似度计算页面相似度,直至所述查询相似度和所述页面相似度收敛;步骤1?3,利用页面相似度计算查询相似度时,对查询关键字qs和qt的相似度的计算如下:其中SQ[qs,qt]是查询关键字qs和qt的相似度,下标Q代表查询关键字相似度,qs和qt是查询关键字二部图中的任意二个不同的查询关键字,s、t为正整数,s、t的取值不同,其最小取值是1,最大取值为查询关键字二部图中查询关键字的个数;|AO(q)|是查询关键字q点击的页面的总次数,而O(q)是查询关键字q点击的页面集合,C是谐波因子,W是每对页面相似度的影响权重;SD[di,dj]是页面di和dj的相似度,下标D代表页面相似度,di和dj分别是查询关键字qs和qt点击的页面,其中i、j的取值不同,i、j为正整数,其最小取值是1,最大取值为查询关键字二部图中查询关键字的个数;步骤1?4,利用查询相似度计算页面相似度时,W计算如下,其中t(q,d)是查询关键字q点击页面d的次数:页面di和dj的相似度的计算如下:其中SD[di,dj]是页面di和dj的相似度,di和dj是所述建立的查询关键字二部图中的任意二个不同的页面,i、j为正整数,i、j的取值并不相同,其取值最小是1,最大是查询关键字二部图中的页面的个数;|AO(d)|是页面d被点击的总次数,而O(d)是点击页面d的查询关键字的集合,C是谐波因子,W是每对查询相似度的影响权重,SQ[qs,qt]是查询关键字qs和qt的相似度,查询关键字qs和qt分别是点击了页面di和dj的查询关键字,其中s、t的取值不同,s、t为正整数,其最小取值是1,最大取值为查询关键字二部图中查询关键字的个数;实现IA?CLICK迭代过程的算法初值如下:其中S0[di,dj]是页面di和dj的相似度,di和dj是所述建立的查询关键字二部图中的任意二个不同的页面,i、j为正整数,i、j的取值并不相同,其取值最小是1,最大取值是查询关键字二部图中的页面的个数;步骤2,基于步骤1求出的查询关键字二部图中查询相似度和页面相似度的IA?CLICK相似度数据,构造查询相似度和页面相似度集合,分别求出系统默认相关度和用户定义相关度,然后利用相关度R[q,d]衡量公式求出综合相关度,并根据所述综合相关度的大小重新依次排布搜索结果;步骤3,根据重排序搜索结果的查询次数和用户点击情况,利用用户满意度us衡量公式计算得到优化搜索结果的性能评价。
关 键 词:
法律状态:公开
IPC专利分类号:G06F17/30(2006.01)I