专利名称 | 一种挖掘查询语句子话题并聚类的信息搜索方法 | 申请号 | CN201210004772.3 | 专利类型 | 发明专利 | 公开(公告)号 | CN102419778A | 公开(授权)日 | 2012.04.18 | 申请(专利权)人 | 中国科学院软件研究所 | 发明(设计)人 | 孙乐;江雪 | 主分类号 | G06F17/30(2006.01)I | IPC主分类号 | G06F17/30(2006.01)I | 专利有效期 | 一种挖掘查询语句子话题并聚类的信息搜索方法 至一种挖掘查询语句子话题并聚类的信息搜索方法 | 法律状态 | 实质审查的生效 | 说明书摘要 | 本发明提供一种挖掘查询语句的子话题,并对子话题进行聚类的信息搜索方法。该方法将原始查询语句和历史查询语句分别分词,得到查询词序列,计算原查询语句与历史查询语句的相似度。进一步可将原查询通过语义词典进行扩展,计算扩展查询语句与历史查询语句的相似度,并修正历史查询语句与原始查询语句的相似度;还可通过历史查询语句的点击信息进一步修正历史查询语句与原始查询语句的相似度。然后通过相似度的预设阀值选出最终子话题,并对其进行聚类以及构建树形的层次结构。用户通过选择树形层次结构的不同叶子节点来获得不同分类粒度的检索结果,方便用户按照话题类别来浏览检索结果。 |
1、源头对接,价格透明
2、平台验证,实名审核
3、合同监控,代办手续
4、专员跟进,交易保障