1. Polytomous data

之前的LR是对因变量为二元变量做的。本节里因变量为polytomous data,即类别不只有两个。在此情形中,又分为:①因变量为定类变量(nominal);②因变量为定序变量(ordinal)。

2. LR for nominals

i.e., multinomial logit model

2.1 Model specification

假设因变量有C类:

$$ y_i \in \{1,2,\cdots,C\} $$

LR的流程为:①选定一个类作为reference cate;②拟合C-1个LR模型:

$$ \ln\frac{p_c(\mathbf{x})}{p_1(\mathbf{x})}=\beta_c^T \mathbf{x}, \quad c=2,3,\cdots,C $$

换种写法:

$$ p_1(\mathbf{x}) = \frac{1}{1+\sum_{j}\exp(\beta_j^T \mathbf{x})}\\

p_c(\mathbf{x}) = \frac{\exp(\beta_c^T \mathbf{x})}{1+\sum_{j}\exp(\beta_j^T \mathbf{x})} $$

2.2 Coefficient interpretation

如果有K个covariates,因变量有C类,那么就会有(C-1)(K+1)个参数。

2.3 Estimation