图的相似性 (图的连接相似性)

黎 浩然/ 20 11 月, 2023/ 图/GRAPH, 研究生/POSTGRADUATE/ 0 comments

Baseline (Connectivisimilarity)

Edge Overlap Coefficient

重叠系数,也称Szymkiewicz–Simpson系数,为集合A和B的交集大小比A和B间较小集合大小。

重叠系数出自上述论文,修正Community Structure Similarity based Weighted GMS中的EOL。

$$ \begin{equation}sim(G,G’)=oc(E,E’)={|E\cap E’|\over \min(|E|,|E’|)} \end{equation} $$

Graph Edit Distance

如果节点$v_i$和$v_j$存在边,在$G$中其权重标记为$w_{ij}^1$,在$G’$中其权重标记为$w_{ij}^2$。

$$ \begin{equation}\begin{split} d(G,G’)&=\sum_{(v_i,v_j)\in E\cap E’}{(w_{ij}-w_{ij}’)^2\over (\min(w_{ij}, w_{ij}’)+\epsilon)^2} \\&+\sum_{(v_i,v_j)\in E \backslash( E\cap E’)} (w_{ij}+\epsilon)^2\\&+\sum_{(v_i,v_j)\in E’ \backslash( E\cap E’)} (w_{ij}’+\epsilon)^2\end{split} \end{equation} $$

$$ \begin{equation}sim(G,G’)=1-{d(G,G’)\over \sum_{(v_i,v_j)\in E\cap E’}(\min(w_{ij}, w_{ij}’)+\epsilon)^2} \end{equation} $$

DeltaCon: A Principled Massive-Graph Similarity Function

参考上述论文,考虑$G$和$G’$各只有一条边$w_{ij}=10$,$w_{ij}’=0.01$;$d(G,G’)={(10-0.01)^2\over (0.01+\epsilon)^2}$,$sim(G,G’)=1-{9.99^2\over(0.01+\epsilon)^4}<0$,显然不合理。

Share this Post

Leave a Comment

您的邮箱地址不会被公开。 必填项已用 * 标注

*
*