一种基于文本相似度矩阵运算的非结构化海量投诉数据分类算法

快速导航

期刊信息

1973年创刊

《计算机工程与科学》的办刊宗旨是为计算机界同行发表有创见的学术论文，介绍有特色的科研成果，探讨有新意的学术观点提供理想园地；�...查看更多>>

通知公告

您现在所在位置：首页 > 期刊导读 > 2012年 > 01 > 信息摘要

【出处】：《计算机工程与科学》 CSCD 2012年第34卷第1期 103-107页,共5页

【作者】：李青 [1] ; 陈阳 [2] ; 谢浩然 [1] ; 蒙圣光 [3]

【摘要】随着互联网和信息技术的日新月异,非结构化数据量有呈几何级数增长的趋势。尤其是Web2.0网络社区的流行与火爆,使得增长趋势得到了进一步的加速。因此,面对海量的非结构化数据,如何有效地管理和组织它们,以便于终端用户进行信息存取,成为了一个迫在眉睫的重要研究课题。本文通过对非结构化数据的文本的建模和文本相似度比较,对于大规模非结构化数据的分类算法进行了讨论和研究,并将此算法应用到了中国移动的投诉数据分类系统中。在系统实施后,非常有效地提高了投诉数据的处理效率,从而印证所提出分类算法及系统框架的有效性。

相关热词搜索：

上一篇：Vague集的新模糊熵
下一篇：基于MapGIS的钻孔柱状图自动生成方法