基于最近邻子空间搜索的两类文本分类方法
【出 处】:
【作 者】:
李玉鑑
;
王影
;
冷强奎
【摘 要】
在文本分类中,最近邻搜索算法具有思想简单、准确率高等优点,但通常在分类过程中的计算量较大.为克服这一不足,提出了一种基于最近邻子空间搜索的两类文本分类方法.首先提取每一类样本向量组的特征子空间,并通过映射将子空间变换为高维空间中的点,然后把最近邻子空间搜索转化为最近邻搜索完成分类过程.在Reuters-21578数据集上的实验表明,该方法能够有效提高文本分类的性能,具有较高的准确率、召回率和F1值.
相关热词搜索: 文本分类 最近邻子空间搜索 最近邻搜索 text categorization nearest subspace search nearest neighbor search