专利名称 | 用于对倒排索引进行压缩的文档序号重排方法及其系统 | 申请号 | CN201210401317.7 | 专利类型 | 发明专利 | 公开(公告)号 | CN102929988A | 公开(授权)日 | 2013.02.13 | 申请(专利权)人 | 中国科学院计算技术研究所 | 发明(设计)人 | 史亮;王斌;卫冰洁;张帅;张冠元 | 主分类号 | G06F17/30(2006.01)I | IPC主分类号 | G06F17/30(2006.01)I | 专利有效期 | 用于对倒排索引进行压缩的文档序号重排方法及其系统 至用于对倒排索引进行压缩的文档序号重排方法及其系统 | 法律状态 | 实质审查的生效 | 说明书摘要 | 本发明公开了用于对倒排索引进行压缩的文档序号重排方法及其系统,该方法包括:步骤1,对已经分配好文档序号的文档进行词语划分得到词项,对所述词项按照其在所述文档中的出现频率进行排列,得到第一顺序的词项;步骤2,利用所述第一顺序的词项对所述文档进行重新排序,获得所述文档的最终排序;步骤3,新的文档序号按照所述文档的最终排序进行重新分配。本发明在运行过程中通过对词项进行排序,挖掘文档之间的相似度关系,仅占用少量内存空间,大大降低了算法的时间复杂度和空间复杂度。 |
1、源头对接,价格透明
2、平台验证,实名审核
3、合同监控,代办手续
4、专员跟进,交易保障