浏览量:0

一种左右递归新词发现方法

专利类型:发明专利 

语 言:中文 

申 请 号:CN201611152464.X 

申 请 日:20161130 

发 明 人:尹云飞刘欢曾亚飞 

申 请 人:浪潮电子信息产业股份有限公司重庆大学 

申请人地址:250101山东省济南市浪潮路1036号浪潮科技园S05楼 

公 开 日:20170510 

公 开 号:CN106649666A 

代 理 人: 

代理机构: 

摘  要:本发明公开了一种左右递归新词发现方法,属于搜索引擎技术领域,来源于词法分析和快速检索使用和研发实践。该方法用信息熵来衡量一个字符串的左邻集合和右邻集合的随机性、将新词分为实体名词、派生词、缩略词、复合词和数字组合词,其处理步骤包括语料预处理、位置集合计算、集合遍历、收纳性判断、词频计算、左递归、右递归、合并。??全部 

主 权 项: 

关 键 词: 

法律状态: 

IPC专利分类号:G06F17/30(2006.01)I