专利名称 | 文本分类方法 | 申请号 | CN200910142286.6 | 专利类型 | 发明专利 | 公开(公告)号 | CN101587493 | 公开(授权)日 | 2009.11.25 | 申请(专利权)人 | 中国科学技术大学 | 发明(设计)人 | 陈恩红;林洋港;马海平;曹欢欢 | 主分类号 | G06F17/30(2006.01)I | IPC主分类号 | G06F17/30(2006.01)I | 专利有效期 | 文本分类方法 至文本分类方法 | 法律状态 | 实质审查的生效 | 说明书摘要 | 一种文本分类方法,包括以下步骤:根据类别将初始训练文本集划分 为多个分别包含相同类别文本的子集,并从每个子集中抽取出对应的概率 主题模型;利用对应的概率主题模型生成新的文本来均衡所述多个子集的 类别;根据所述多个子集对应的均衡训练文本集构造分类器;以及利用所 述分类器进行文本分类。本发明能够提高文本分类方法在数据倾斜条件下 的分类效果。 |
1、源头对接,价格透明
2、平台验证,实名审核
3、合同监控,代办手续
4、专员跟进,交易保障