| 专利名称 | 一种大数据多区间查询条件下的基数估计方法及装置 | 申请号 | CN201310484503.6 | 专利类型 | 发明专利 | 公开(公告)号 | CN103544258A | 公开(授权)日 | 2014.01.29 | 申请(专利权)人 | 国家计算机网络与信息安全管理中心;中国科学院信息工程研究所 | 发明(设计)人 | 云晓春;徐小琳;王明华;刘阳;李志辉;吴广君;王树鹏;王勇;常为领 | 主分类号 | G06F17/30(2006.01)I | IPC主分类号 | G06F17/30(2006.01)I | 专利有效期 | 一种大数据多区间查询条件下的基数估计方法及装置 至一种大数据多区间查询条件下的基数估计方法及装置 | 法律状态 | 实质审查的生效 | 说明书摘要 | 本发明涉及一种大数据多区间查询条件下的基数估计方法及装置,包括以下步骤:按照数值属性对大数据预先划分成多个分区;建立树形索引结构,每个分区作为树形索引结构的一个节点;获取待写入树形索引结构的数据源,对支持区间查询条件的数据源进行倒排索引处理;将经过倒排索引处理的数据源写入树形索引结构中的节点内,将数据源的相应部分分别写入数据文件及基数估算器内;根据区间查询条件在树形索引结构中查询满足区间查询条件的节点,得到节点中的基数估算器,对基数估算器进行逻辑处理,得到基数估算值。本发明通过降低数据的计算精度提高基数统计效率,在任意多区间查询条件下,具备较高的查询效率,使用了大数据增量更新技术提高索引数据在线更新效率。 |
1、源头对接,价格透明
2、平台验证,实名审核
3、合同监控,代办手续
4、专员跟进,交易保障