Abstract
但是传统方法受到与工业规模网络的高维性和异构特性相关联的高计算成本和过多存储器需求的困扰。
图嵌入方法就很高效,另一种新兴的图嵌入采用基于高斯分布的图嵌入,并具有重要的不确定性估计。
我们提出一些基本概念,特别关注基于随机游走和基于神经网络的方法。
Introduction
传统的图分析,包括路径分析、连通性分析、社区分析和中心性分析,主要基于直接从邻接矩阵中提取手工绘制的图拓扑特征。当我们将这些方法应用于工业系统中的大规模网络分析时,由于原始网络具有挑战性和不可避免的高维性以及新兴的异构特征,它们可能会面临高计算成本和过多的内存需求[43]。此外,手工设计的特征通常是特定于任务的,并且在用于不同任务时不能实现等同的性能。
图嵌入技术(主要称为节点嵌入)已经显示出将高维稀疏图转换为低维、稠密和连续向量空间的显著能力(见图1)。如下图:
除了节点嵌入之外,还有其他类型的嵌入,例如,边嵌入、子结构嵌入和全图嵌入;参见综述论文[9]。
2.2.2. Node Similarity Measures in the Original Graphs
原始图中节点之间的相似性可以基于五个不同方面来表征:
- presence of edges
- overlapped neighborhood
- reachable bu k-hops
- reachable through random walks
- similar node attributes
基于多跳邻域的节点相似性
“跳””术语最初出现在有线计算机网络领域,”“跳数””可以提供源主机和目的主机之间距离的度量.
近年来,为了对原始图中的节点邻居进行采样并保持图的结构特性,多跳邻域(或k-hop邻域)方法成为解决图嵌入问题的一种有效方法。
具体地,k跳邻域被定义为从源节点在k跳或更少跳中可到达的顶点的集合(即,在二进制图中遵循具有k条边或更少边的路径)。
特别是,k-hop邻域搜索方法使我们能够为原始图中不同跳数的每个采样源节点采样相似的邻居。此外,可以通过增加跳数来保持高阶邻近度。