专利类型:发明专利
语 言:中文
申 请 号:CN201910452154.7
申 请 日:20190528
申 请 人:重庆大学
申请人地址:400044 重庆市沙坪坝区沙正街174号
公 开 日:20190906
公 开 号:CN110209767A
代 理 人:陶俊洁
代理机构:北京康盛知识产权代理有限公司
摘 要:本申请涉及一种用户画像构建方法,涉及评论文本分析和自然语言处理技术领域,包括:提取评价文本中的目标词和意见词;量化意见词,得到意见词的量化结果;将所述目标词进行分类:将各类别词和各所述目标词分别带入向量训练模型,得到有向量形式的类别词和有向量形式的目标词;计算各目标词与类别词之间的余弦距离;将最大余弦距离值所对应的目标词归入对应的类别中;对各类别下的目标词所对应意见词的量化结果进行求和,得到各类别的分值;根据各类别的分值得到用户画像。面对繁杂庞大的评价文本,通过量化意见词、对目标词进行分类并计算出各类别分值,准确地体现用户的喜厌程度,精准地得到用户画像,给用户带来更好的体验。
主 权 项:1.一种用户画像构建方法,其特征在于,包括步骤:提取评价文本中的目标词和意见词;量化意见词,得到意见词的量化结果;将所述目标词进行分类:将各类别词和各所述目标词分别带入向量训练模型,得到有向量形式的类别词和有向量形式的目标词;计算各目标词与类别词之间的余弦距离;将最大余弦距离值所对应的目标词归入对应的类别中;对各类别下的目标词所对应意见词的量化结果进行求和,得到各类别的分值;根据各类别的分值得到用户画像。
关 键 词:
法律状态:
IPC专利分类号:G06F16/33;G06F16/35;G06F17/27