常用特征选择方法的比较研究
康岚兰;董丹丹
【期刊名称】《电脑知识与技术》
【年(卷),期】2009(005)034
【摘要】特征选择是中文文本自动分类领域中极其重要的研究内容,其目的是为了解决特征空间高维性和文档表示向量稀疏性之间的矛盾.常用的特征选择方法有:文档频数、信息增益、互信息,期望交叉熵、卡方统计量和文本证据权等.在该本自动分类器KNN上对以上方法进行了比较研究,分析了各个特征评估函数的优劣,检测了这些方法在特征维数变化情况下的性能.
【总页数】3页(9787-9789)
【关键词】中文文本自动分类;特征选择;特征评估函数;性能
【作者】康岚兰;董丹丹
【作者单位】江西理工大学应用科学学院,江西,赣州,341000;江西理工大学应用科学学院,江西,赣州,341000
【正文语种】中文
【中图分类】TP311
【相关文献】
1.常用特征选择方法的比较研究 [J], 康岚兰; 董丹丹
2.基于Lasso特征选择的方法比较 [J], 刘晓宁
3.两种分类方法特征选择的比较 [J], 王晓微
4.中文文本分类中特征选择方法的比较研究 [J], 刘洋
5.文本分类中特征选择方法的比较和改进 [J], 伍建军; 康耀红