搜档网
当前位置:搜档网 › 子空间聚类及其应用

子空间聚类及其应用

西安建筑科技大学硕士学位论文

目录

目录..................................................................................................I 1绪论 (1)

1.1子空间聚类的研究背景 (1)

1.2子空间聚类的发展和研究现状 (2)

1.2.1稀疏表示和秩极小化 (2)

1.2.2发展现状 (3)

1.3本文的主要工作与内容安排 (4)

2子空间聚类的理论知识 (6)

2.1聚类方法概述 (6)

2.2子空间聚类概述 (8)

2.3子空间聚类的相关数学理论 (9)

2.3.1图论相关理论 (9)

2.3.2矩阵论相关内容 (10)

2.4谱聚类算法简述 (13)

2.5本章总结 (14)

3子空间聚类算法研究 (16)

3.1稀疏子空间聚类(SSC) (16)

3.1.1稀疏优化模型 (17)

3.1.2基于稀疏表示的聚类 (18)

3.2低秩表示子空间聚类 (21)

3.3稀疏和低秩子空间聚类的衍生模型 (24)

3.3.1二次规划子空间分割模型(SSQP) (24)

3.3.2隐低秩表示模型(LatLRR) (25)

3.3.3最小二乘回归模型(LSR) (26)

3.3.4非负低秩稀疏表示模型(NNLRS) (29)

3.3.5对称的低秩表示模型(LRRSC) (29)

3.3.6低秩子空间聚类模型(LRSC) (30)

3.4本章总结 (32)

4聚类算法应用 (33)

I

西安建筑科技大学硕士学位论文

4.1高维数据聚类 (34)

4.2合成数据 (37)

4.3人脸聚类 (42)

4.4运动分割 (45)

4.5本章总结 (48)

5总结与展望 (49)

致谢 (50)

参考文献 (51)

参加研究的科研项目 (57)

II

西安建筑科技大学硕士学位论文1

1绪论

1.1子空间聚类的研究背景信息技术的进步和Internet 的日益普及使得数据收集变得越来越容易,最直接的结果是导致数据集变得越来越庞大和越来越复杂。实际上,高维数据现在在很多领域都很普遍,比如机器学习,信号处理,图像处理,计算机视觉,模式识别和生物信息学等等,例如,图片中包含数以亿计的像素,视频中有成千上万的画面文本和网页文件有成百上千的特征等等。

数据的高维度不仅增加了算法的计算时间和内存需要,而且由于噪声的影响和样本数据的不足(和空间的维数相比)影响了算法的性能,通常把这个现象叫做“维数灾难”[1]。然而,高维数据通常位于低秩结构中而不是一致分布在环绕空间中[2]

。如图1.1所示,给定的三维数据分别来自三条直线,即数据本质上是一维的,在其所属的低维子空间(直线)中,能够更好地体现出数据本身所具有的性质,这一发现对数据聚类、数据分析、数据挖掘以及模式识别等有重要的意义.恢复数据的低维结构不仅帮助减少算法的计算代价和内存需求,而且还可以减少数据中高维噪声的影响,提高算法在推理、学习及识别任务中的性能。图1.1空间中的点为分散在三维空间中三条直线上的离散点

实际上在许多问题中,在一类或一个范畴中的数据可以被高维环绕空间中的一个低维子空间很好地表示。例如,视频中一个移动目标的特征轨迹,不同光照下一个对象的脸部照片以及用不同角度手写字体的多个实例都位于环绕空间的低维子空间中。因此,来自多个类别或范畴的数据组成的集合位于几个低维子空间

相关主题