| 专利名称 | 基于特征空间分解的文本大数据主题挖掘方法和装置 | 申请号 | CN201310049504.8 | 专利类型 | 发明专利 | 公开(公告)号 | CN103116636A | 公开(授权)日 | 2013.05.22 | 申请(专利权)人 | 中国科学院软件研究所 | 发明(设计)人 | 李文波;孙乐 | 主分类号 | G06F17/30(2006.01)I | IPC主分类号 | G06F17/30(2006.01)I | 专利有效期 | 基于特征空间分解的文本大数据主题挖掘方法和装置 至基于特征空间分解的文本大数据主题挖掘方法和装置 | 法律状态 | 公开 | 说明书摘要 | 本发明涉及一种基于特征空间分解的文本大数据主题挖掘方法和装置。该方法主要包含两个关联的部分:一是基于主题特征的空间分解方法;二是基于多子空间的模型求解并行加速方法。空间分解方法的关键在于利用模型特征对数据样本和主题集合进行解耦合,从而同时实现对数据空间和主题空间的切分和消解,得到了多个相对于全模型空间更小的子模型空间,有效降低了求解算法的存储空间复杂度;同时可以利用子空间之间的相对独立性,将其映射到各种并行实体上,从而有效降低了求解算法的计算时间复杂度。本发明方法能够充分利用计算设备的并行处理能力,实现对大型主题建模空间、大规模数据集合的并行可扩展处理。 |
1、源头对接,价格透明
2、平台验证,实名审核
3、合同监控,代办手续
4、专员跟进,交易保障