| 专利名称 | 一种用户生成内容中欺骗性垃圾意见检测方法 | 申请号 | CN201110430978.8 | 专利类型 | 发明专利 | 公开(公告)号 | CN103176984A | 公开(授权)日 | 2013.06.26 | 申请(专利权)人 | 中国科学院计算机网络信息中心 | 发明(设计)人 | 杨风雷;黎建辉 | 主分类号 | G06F17/30(2006.01)I | IPC主分类号 | G06F17/30(2006.01)I | 专利有效期 | 一种用户生成内容中欺骗性垃圾意见检测方法 至一种用户生成内容中欺骗性垃圾意见检测方法 | 法律状态 | 实质审查的生效 | 说明书摘要 | 本发明公开了一种用户生成内容中欺骗性垃圾意见检测方法,属于信息技术领域。本方法为:1)对设定用户生成内容信息源中的信息进行爬取并生成用户生成内容网页集合,然后对用户生成内容网页进行标注,得到候选欺骗性垃圾意见集合;2)对集合中的样本进行过滤,形成准确欺骗性垃圾意见集合;3)从意见作者、意见内容、内容分布、链接四个纬度对准确欺骗性垃圾意见集合及无标注用户生成内容网页集合样本进行特征提取,生成每一维度的特征向量;4)采用机器学习方法建立每一维度的欺骗性垃圾意见检测模型;5)利用所述欺骗性垃圾意见检测模型等对新爬取的用户生成内容网页进行欺骗性垃圾意见检测。本发明大大提高了欺骗性垃圾意见的检测效率。 |
1、源头对接,价格透明
2、平台验证,实名审核
3、合同监控,代办手续
4、专员跟进,交易保障