您的位置:首页 > 新闻 > 热点要闻 > 建e网室内设计网别墅_沈阳高端网站建设_抖音引流推广免费软件app_怎么给客户推广自己的产品

建e网室内设计网别墅_沈阳高端网站建设_抖音引流推广免费软件app_怎么给客户推广自己的产品

2025/1/9 11:37:41 来源:https://blog.csdn.net/dundunmm/article/details/144171778  浏览:    关键词:建e网室内设计网别墅_沈阳高端网站建设_抖音引流推广免费软件app_怎么给客户推广自己的产品
建e网室内设计网别墅_沈阳高端网站建设_抖音引流推广免费软件app_怎么给客户推广自己的产品

论文地址:Deep Multi-view Subspace Clustering with Anchor Graph (ijcai.org)

代码地址:


摘要

深度多视图子空间聚类(Deep Multi-View Subspace Clustering,DMVSC)近年来因其卓越的性能受到越来越多的关注。然而,现有的DMVSC方法仍存在两个问题:

(1)主要集中于使用自编码器对数据进行非线性嵌入,而自编码器通常很少考虑聚类目标,这可能导致嵌入对于聚类来说并非最优;

(2)现有方法通常具有二次甚至三次复杂度,这使得处理大规模数据具有较大挑战。

为了解决这些问题,本文提出了一种基于锚点图的全新深度多视图子空间聚类方法(DMCAG)。具体来说,DMCAG首先为每个视图独立学习嵌入特征,并利用这些特征获取子空间表示。为显著降低复杂度,我们为每个视图构建一个小规模的锚点图。随后,在集成的锚点图上执行谱聚类以获得伪标签。为克服次优嵌入特征带来的负面影响,我们利用伪标签对嵌入过程进行优化,使其更适合聚类任务。伪标签和嵌入特征交替更新。此外,我们基于对比学习设计了一种保持标签一致性的策略,以提升聚类性能。在真实数据集上的实验研究表明,本文方法在聚类性能上优于其他最先进的方法。

引言

子空间聚类经过多年的研究,假设数据点来自低维子空间,并且可以表示为其他数据点的线性组合。特别是,稀疏子空间聚类(SSC)[Elhamifar和Vidal,2013]展示了其在为来自同一子空间的点找到稀疏表示方面的能力。在获得子空间表示后,通常使用谱聚类来获取最终的聚类结果。另一方面,低秩子空间分割方法在[Liu等,2012]中被提出,用于找到低秩子空间表示。尽管已有一些最先进的性能成果,但大多数现有方法仅集中于单视图聚类任务。在许多现实应用中,随着数据的指数增长,数据的描述逐渐从单一来源扩展到多个来源。例如,一个视频包含文本、图像和音频。一段文本可以翻译成多种语言,场景也可以从不同的角度进行描述。这些不同的视图往往包含互补信息。充分利用多视图之间的互补性和一致性信息有望提升聚类性能。

考虑到多视图数据所带来的信息多样性,多视图子空间聚类(MVSC)的研究最近引起了越来越多的关注。MVSC的目标是通过学习多视图数据的融合表示,寻找到一个统一的子空间,然后在相应的子空间中分离数据。在文献中,已经提出了许多MVSC方法[Zhang等,2015;Luo等,2018;Li等,2019;Wang等,2019;Zheng等,2020;Liu等,2021;Si等,2022]。然而,现有方法的一个主要弱点是其高时间和空间复杂度通常在样本数量n上是二次或三次复杂度。最近,一些基于锚点的多视图子空间聚类方法[Chen和Cai,2011;Sun等,2021;Kang等,2020;Wang等,2022;Liu等,2022]得到了发展,这些方法能够在显著减少存储和计算时间的同时,取得良好的聚类性能。通常,锚点图是等权重的,并融合为共识图,然后进行谱聚类以获得聚类结果。

另一方面,受到深度神经网络(DNN)的启发,许多深度多视图子空间聚类(DMVSC)方法被提出[Peng等,2020;Wang等,2020;Kheirandishfard等,2020;Sun等,2019;Zhu等,2019;Ji等,2017]。然而,大多数DMVSC方法仅考虑网络中的特征学习能力,其性能仍然有限,因为这个学习过程通常独立于聚类任务

为了解决上述问题,本文提出了一种基于锚点图的深度多视图子空间聚类方法(DMCAG)。DMCAG首先利用深度自编码器通过优化重建损失,独立地为每个视图学习低维嵌入特征对于每个视图,通过在学习到的特征上执行k-means选择一组点,构建锚点图。然后,我们利用锚点图和嵌入特征作为输入,分别获得子空间表示。一旦获得所需的子空间表示,就可以通过应用标准的谱聚类算法计算聚类结果。与大多数现有的DMVSC方法不同,本文提出的方法并不直接从谱聚类输出聚类结果。相反,我们首先从聚类结果中获得一个统一的目标分布,这比通过k-means生成的分布更为稳健[Xie等,2016;Xu等,2022],尤其是对于那些不形成凸区域或不清晰分隔的聚类。以自监督的方式,优化统一目标分布与每个视图的聚类分配之间的Kullback-Leibler(KL)散度。我们通过从谱聚类中推导出的伪标签,迭代地优化嵌入过程,从而帮助获得互补信息和更准确的目标分布。此外,为了确保不同视图之间的一致性,并避免影响重建质量,我们在标签上采用对比学习,而不是在潜在特征上。本文的主要贡献总结如下:

  • 我们提出了一种新的深度自监督模型用于MVSC。通过谱聚类生成一个统一的目标分布,该分布更为稳健,并能够准确地指导特征学习过程。目标分布和学习到的特征是迭代更新的。
  • 为了提高模型效率,我们使用锚点图构建图矩阵,避免构建n × n的图。这个策略通过采样锚点显著降低了时间复杂度。
  • 我们在伪标签上使用对比学习来缓解一致性目标与重建目标之间的冲突,从而可以在多个视图之间获得一致的软聚类分配。
  • 在真实数据集上的大量实验验证了所提出模型的有效性和效率。

模型

问题陈述:给定多视图数据 X={Xv∈Rdv×n},其中 V表示视图的数量,dv是第 v-个视图的维度,n 是实例的数量。MVSC的目标是将给定的实例分成 k 个聚类。

动机

子空间聚类的目标是找到一个潜在的子空间,将每个点表示为其他点的线性组合。最终的聚类分配是通过在学习到的子空间上执行谱聚类来获得的。基本上,它可以通过以下数学公式来表示:

其中,Sv∈Rn×n是第 v 个视图的学习到的子空间,1∈Rn×1 是一个所有元素均为1的向量,γ是一个控制 Sv稀疏性的超参数。约束条件确保 Sv是非负的,并且sum_j S_{ij} = 1。当获得邻接图后,可以在 Sv上执行谱聚类以获得聚类结果。

现有的MVSC方法旨在有效地学习具体的子空间,并挖掘所有视图的全局信息以提高聚类分配质量,但仍面临一些挑战:

  1. 时间复杂度高:大多数MVSC方法至少需要O(n^2 k) 的时间复杂度来计算原始特征上的聚类结果,这需要更多的存储和时间,并且在处理大规模数据集时困难重重。此外,一些DMVSC方法如[Ji et al., 2017;Li et al., 2021]关注通过非线性嵌入数据来学习子空间。由于学习到的子空间与聚类任务之间的联系较弱,因此学习到的特征可能并不适合聚类任务。

  2. 潜在表示的质量依赖性:从现有的自监督MVC方法可以看出,它们大多依赖于潜在表示的质量来监督学习过程。[Xu et al., 2022]融合了所有视图的嵌入特征,并利用k-means [MacQueen, 1967]来获得全局目标分布。然而,k-means在某些数据结构(如非凸结构)上表现不佳,相较于谱聚类[Ng et al., 2001],后者对不同分布更为鲁棒。因此,所获得的伪标签可能无法反映清晰的聚类结构,从而影响潜在特征学习过程的指导。

  3. 视图间聚类不一致:某些视图的实例可能会出现错误的聚类分配,导致聚类不一致。一些基于深度学习的MVC方法通过直接在潜在特征上学习共享信息来实现一致性[Cheng et al., 2021],但由于学习精确的潜在表示与实现一致性之间的冲突,可能会减少每个视图信息的互补性。

为了解决上述问题,我们提出了一种新颖的DMCAG框架,如图1所示。我们使用锚点方法在每个视图的潜在特征上构建图矩阵,这样可以减少时间和存储开销。之后,我们通过在集成的锚点图上执行谱聚类来获得全局伪标签。由于谱聚类对数据分布更为鲁棒,我们的自监督过程可以从每个视图中学习到更具判别性的信息。接着,我们在潜在特征的伪标签上采用对比学习,以保持视图私有信息并实现所有视图之间的聚类一致性。

通过自编码器学习锚点图

由于原始数据中存在大量冗余,我们利用深度自编码器来提取所有视图的潜在表示。通过编码器 fv和解码器 gv,其中 θv和 ϕv是可学习的参数,Xv被编码为 Zv∈Rl×n(所有视图的 l 相同),然后通过 fv进行编码,接着通过 gv解码得到 X^v。

重建损失定义为:

灵感来源于[Kang et al., 2020],我们采用锚点图来替代完整的邻接矩阵 S,其形式化为:

其中,Av∈Rl×m(m 为锚点数目)是通过在嵌入特征 Zv上执行 k-means 聚类得到的簇心集合,Cv∈Rn×m是锚点图矩阵,反映了 Zv和 Av之间的关系。上述问题可以通过凸二次规划来求解。关于二次规划的更多细节,读者可以参考 [Wolfe, 1959]。

谱自监督学习

如 [Ng et al., 2001] 所述,对于那些未明显分离或不形成凸区域的聚类,谱方法仍然能够可靠地找到聚类分配。因此,我们使用谱聚类来获得更稳健的全局目标分布,以指导自我训练。谱聚类 [Ng et al., 2001] 可以通过最大化以下目标函数来数学描述:

根据 [Chen and Cai, 2011; Kang et al., 2020] 提出的定理 1,我们展示了一种在潜在空间中近似 S 的奇异向量的方法。

定理 1. [Chen and Cai, 2011; Kang et al., 2020]

给定一个相似度矩阵 S,它可以分解为(C^T)C。定义 C 的奇异值分解(SVD)为 U \Lambda V^T,那么我们有:

并且最优解 Q^* 等于 U。

证明: 从方程(5)中可以看出,最优 H∗= C^T Q。将 H∗= C^T Q 代入方程(5),得到以下等价式:

进一步地,我们可以得到:

因此,我们可以使用 C 的左奇异向量来近似 S 的特征向量。 □

根据定理 1,我们计算 { Uv} (对于每个视图 v) 来近似完整相似度矩阵的特征向量。为了充分利用所有视图之间的互补信息,我们将所有特征向量 U={U1,U2,…,UV}连接起来,通过谱方法生成全局特征。得到全局特征 U 后,我们应用 k-means 计算簇心 { μj}:

类似于 DEC [Xie et al., 2016],这是一种流行的单视图深度聚类方法,利用 Student’s t 分布 [Van der Maaten and Hinton, 2008],全局特征 UU 和每个簇心 μj之间的软聚类分配 tij可以通过以下公式计算:

为了提高全局软分配的可区分性,目标分布 P 被公式化为:

我们得到每个视图的软聚类分配(伪标签)Q,其中q_{vij} 可以被认为是第 i个实例属于第 j 个聚类在第 v 个视图中的概率。它被定义为:

其中,\mu_{vj} 表示第 v 个视图中第 j 个聚类的质心。

总体而言,我们使用Kullback-Leibler散度来衡量统一的目标分布 P 与视图私有的软分配分布 Qv之间的差异,以此引导自编码器优化具有更高区分信息的潜在特征。可以公式化为:

由于从谱聚类获得的目标分布适应不同的数据分布,因此,相比于k-means聚类,我们可以获得更明确的聚类结构来引导自训练过程。为了提取反映原始特征正确信息的嵌入特征并学习准确的聚类分配,我们联合优化自编码器的重构和自监督学习。总损失函数 Ls定义为:

标签一致性学习

为了保证所有视图的相同软分配分布表示相同的聚类,我们需要实现伪标签的一致性。我们对从公式 (9) 得到的软分配采用对比学习。对于第 m个视图,Qm(:,j)有 (V−1)对,其中 (V−1)对 { Qm(:,j),Qn(:,j) 是正样本,剩下的 V(k−1) 对是负样本。因此,对比损失可以定义为:

其中,d(⋅,⋅)表示用余弦距离衡量两个标签之间的相似度,τ 是温度参数。此外,为了避免样本被分配到单一聚类中,我们使用交叉熵作为正则化项。通常,标签一致性学习公式化为:

算法 1 深度多视图子空间聚类与锚点图 (DMCAG)

优化

详细的优化过程总结在算法 1 中。我们采用Adam方法训练自编码器。开始时,通过公式 (2) 初始化自编码器。然后,我们通过凸二次规划求解公式 (3),以获得 U 并计算全局目标分布 P。接着,采用谱自监督学习来学习更具代表性的嵌入。执行自监督学习后,进行对比学习以实现聚类一致性。最后,在 U上运行k-means来获得最终的聚类结果 y。

实验

数据集

结果


多视图聚类,后续是重点研究的方向,这篇利用锚点图,降低了整体的计算复杂度。

锚点的方法在大规模数据集中还是用的比较多的

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com