专利详情-喀斯玛汇智科技服务平台

专利名称

文本聚类方法

申请号

CN201310754063.1

专利类型

发明专利

公开（公告）号

CN103714171A

公开（授权）日

2014.04.09

申请（专利权）人

深圳先进技术研究院

发明（设计）人

蔡业首;陈小军;管婷婷;黄哲学

主分类号

G06F17/30(2006.01)I

IPC主分类号

G06F17/30(2006.01)I

专利有效期

文本聚类方法至文本聚类方法

法律状态

实质审查的生效

说明书摘要

一种文本聚类方法，用于对潜在狄利克雷分布模型的文档集进行文本挖掘，其至少包括如下步骤：在第一文档集D1中对预设了主题数量K的潜在狄利克雷分布算法进行训练，得到参数β和φ；根据参数φ，利用信息熵理论对所述第一文档集D1进行过滤，得到第二文档集D2；根据参数β，对第二文档集D2进行分组，生成包含分组信息的第三文档集D3；以及在第三文档集D3上运行FG-Kmeans算法，得到最终聚类的聚类中心集合C以及标记矩阵U。本发明提供的文本聚类方法，通过潜在狄利克雷分布模型对文本进行分组，再利用FG-Kmeans算法处理分组后的文本，很好地应对文本挖掘中数据的高维和稀疏的问题，而且把特征分组的概念引入了特征空间，使得特征空间包含的信息更为丰富。

01、选取所需专利
02、确认专利可交易
03、签订合同
04、上报材料
05、确认变更成功
06、支付尾款
07、交付证书

企业提供

企业营业执照
专利证书原件

个人提供

身份证
专利证书原件

平台提供

专利代理委托书
专利权转让协议书
办理文件副本请求书
发明人变更声明

过户后买家信息

专利证书
手续合格通知书
专利登记薄副本

1、源头对接，价格透明
2、平台验证，实名审核
3、合同监控，代办手续
4、专员跟进，交易保障

文本聚类方法

企业提供

个人提供

平台提供

过户后买家信息

求购专利