Dekorrelation von normalverteilten Daten

Sei $A$ eine Matrix und $\mu$ ein Vektor. Wenn $Z$ ein Vektor von standard-normalverteilten Zufalls-Vektoren ist, dann ist $ZA^T + \mu^T$ ein Vektor von normalverteilten Zufallszahlen mit Mittelwert $\mu$ und der Varianz-Kovarianz-Matrix $$ \Sigma = A A^T. $$

Wenn, andersherum, eine Stichprobe $X$ aus einer multivariaten Normalverteilung mit Mittelwert $\mu$ und Varianz-Kovarianz-Matrix $\Sigma$ gegeben ist, dann gibt es genau eine untere Dreiecksmatrix $A$ mit der Eigenschaft $$ \Sigma = A A^T. $$

Diese Cholesky-Faktorisierung ist nützlich, weil dann $Z = (X - \mu) (A^T)^{-1}$ standard-normalverteilt ist. Durch diese Transformation wird die Stichprobe $X$ dekorreliert. Außerdem kann die Cholesky-Faktorisierung benutzt werden, um Zufallszahlen aus beliebigen multivariaten Normalverteilungen zu generieren.

Wenn man die Bedingung, dass $A$ eine untere Dreiecksmatrix sei, aufgibt, ist die Faktorisierung einer Varianz-Kovarianz-Matrix nicht eindeutig.

Beispiel

$$ \begin{align} A &= \begin{pmatrix} \frac{\sqrt(2)}{2} & \frac{\sqrt(2)}{2}\\ -\frac{\sqrt(2)}{2} & \frac{\sqrt(2)}{2} \end{pmatrix}\\ A A^T &= \mathbf{I} \\ &= \mathbf{I} ~\mathbf{I}^T \end{align} $$
In [5]:
(A <- matrix(c(1, 1, 1, -1), nrow=2)/sqrt(2))
A matrix: 2 × 2 of type dbl
0.7071068 0.7071068
0.7071068-0.7071068
In [7]:
(Sigma = A %*% t(A))
A matrix: 2 × 2 of type dbl
10
01
In [8]:
chol(Sigma)
A matrix: 2 × 2 of type dbl
10
01

Die Matrix $A$ rotiert alle Datenpunkte um $45°$. Eine Rotation einer Standard-Normalverteilung bleibt jedoch standard-normalverteilt, so dass das Ergebnis auch durch die Identitätstransformation (trivial) dekorreliert wird.

In [ ]: