1. Data storage
一张图的数据包含两个部分:network data与attribute data。
- Attribute data很简单:每列是attribute(第一列往往是node ID),每行是一个node的信息。
- Network data则有三种常用的formats:Adjacency matrix & Edgelist & Nodelist.
1.1 Adjacency matrix format
- 第一行和第一列都是node label。
- 如果是directed network,sender是rows,receiver是columns。
- 适用于one-mode数据,也适用于two-mode数据。
- 该format file的checklist:
1.2 Edge-list format
- 有向图:第一列是sender,第二列是receiver。
- 无向图:节点i和节点j之间的边,只用输入一次即可。
- 第三列「可选(不必需)」,表示strength of the tie。
- 若是two-mode graph,第一列是一个mode,第二列是另一个mode。
- 对于isolates的处理:可以在该文件中加上一个自己指向自己的strength为0的行,也可以在R中import data的时候加上。
- 该format file的checklist:
1.3 Node-list format