浏览量:0
专利类型:发明专利
语 言:中文
申 请 号:CN201611152464.X
申 请 日:20161130
申 请 人:浪潮电子信息产业股份有限公司重庆大学
申请人地址:250101山东省济南市浪潮路1036号浪潮科技园S05楼
公 开 日:20170510
公 开 号:CN106649666A
代 理 人:
代理机构:
摘 要:本发明公开了一种左右递归新词发现方法,属于搜索引擎技术领域,来源于词法分析和快速检索使用和研发实践。该方法用信息熵来衡量一个字符串的左邻集合和右邻集合的随机性、将新词分为实体名词、派生词、缩略词、复合词和数字组合词,其处理步骤包括语料预处理、位置集合计算、集合遍历、收纳性判断、词频计算、左递归、右递归、合并。??全部
主 权 项:
关 键 词:
法律状态:
IPC专利分类号:G06F17/30(2006.01)I