MDS & Correspondence Analysis & Hierarchical clustering

1. Multi-Dimensional Scaling

MDS将“接近性数据(proximity data)”可视化为“直观图像(visual representation)”。

接近性数据可以是距离矩阵(distance matrix)-值越大越远离,也可以是相似性矩阵(similarity matrix)-值越大越接近。在MDS输出的地图中,唯一有用的信息是“which point is close to which other”——坐标轴没有含义、更没有“东南西北”的概念。

Untitled

Untitled

更进一步,我们利用MDS地图寻找clusters和dimensions:

关于stress:数据点越多,MDS地图越可能不精确。这种不精确程度(distortion)使用stress来衡量。经验法则:

在xUCINET中,使用xMDS()进行该操作。

2. Correspondence Analysis

在对应分析(correspondence analysis)中,输入n×p的二模数据,输出一个类似MDS的、具有n+p个点的地图。同样的,该图的坐标轴没有实际含义,只有点和点的距离有意义:

Untitled

在网络分析中,我们常常会对所有nodes计算多个centrality measures——此时就可以对该centrality matrix做CA,如上图所示。