专利名称 | 自动识别网页中维吾尔文的方法及其系统 | 申请号 | CN201010189851.7 | 专利类型 | 发明专利 | 公开(公告)号 | CN101882148A | 公开(授权)日 | 2010.11.10 | 申请(专利权)人 | 中国科学院计算技术研究所 | 发明(设计)人 | 倪耀群;许洪波 | 主分类号 | G06F17/30(2006.01)I | IPC主分类号 | G06F17/30(2006.01)I;G06F17/22(2006.01)I | 专利有效期 | 自动识别网页中维吾尔文的方法及其系统 至自动识别网页中维吾尔文的方法及其系统 | 法律状态 | 授权 | 说明书摘要 | 本发明涉及自动识别网页中维吾尔文的方法和系统,方法包括:步骤1,确定作为识别特征的n元组中n的取值,使用的每种语言,统计语言的各个n元组在使用语言的训练网页中的出现频率,为一个权重值,并且取n元组在预设标准编码中的有效位生成权重值对应的特征ID;步骤2,统计待识别网页中每个n元组的出现次数,取n元组在预设标准编码中有效位生成出现次数对应的识别ID,对于训练网页使用的每种语言,将特征ID的权重值和与特征ID相同的识别ID的出现次数相乘,叠加乘积,所得和值为待识别网页对应于语言的分值,待识别网页使用的语言为最高分值对应的语言。本发明能够提高识别的准确性。 |
1、源头对接,价格透明
2、平台验证,实名审核
3、合同监控,代办手续
4、专员跟进,交易保障