next up previous
Next: Dæmi Up: Meginþættir (principal components) Previous: Línuleg samantekt hendinga: Hámörkun

Meginþættir gagna

Þegar kemur að því að reikna byggt á gögnum þá línulegu samantekt sem gefur mestan breytileika er þess vegna fundið hæsta eigingildi dreifnifylkis gagnanna, $S$, ásamt tilsvarandi eiginvigri, $\mathbf{c}_1$, af lengd 1. Stuðlar eiginvigursins gefa vogtölur sem nota skal á hverja mælingu en eigingildið metur hve mikill breytileiki samantektarinnar verður. Þessi línulega samantekt nefnist fyrsti meginþáttur gagnanna í $\mathbf{X}$-fylkinu. Tilsvarandi eigingildi gefur breytileikann í þessari línulegu samantekt.

Næsti meginþáttur er sú línulega samantekt $\mathbf{c}_2'\mathbf{x}_i$ sem gefur mestan breytileika en er hornrétt á $\mathbf{c}_1$. Þannig er haldið áfram og fundin eigingildin $\lambda_1, \lambda_2, \ldots,
\lambda_p$.

Heildarbreytileiki gagnanna er skilgreindur með

\begin{displaymath}
\mathrm{tr}\mathbf{S} = s_{11}+s_{22}+\ldots + s_{pp}= s_{1}^2+s_{2}^2+\ldots + s_{p}^2.
\end{displaymath} (8)

Eigingildi fylkis $\mathbf{S}$ hafa þann eiginleika að $\lambda_1 +
\lambda_2+ \ldots + \lambda_p =\mathrm{tr}\mathbf{S} $ og því er unnt að tala um mikilvægi (eða útskýrðan heildarbreytileika gagnanna) hvers meginþáttar, sem
\begin{displaymath}
\frac{\lambda_i}{\mathrm{tr}\mathbf{S}} .
\end{displaymath} (9)

Oft eru mælingar þess eðlis, að þær mæla svipaða hluti. Í slíkum tilvikum skýrir fyrsti meginþátturinn mjög stóran hluta breytileika gagnanna. Túlkun þess fyrirbæris er sú, að í raun eru litlar upplýsingar í gögnunum umfram þær sem felast í fyrsta meginþættinum. Í sumum tilvikum getur þó þurft fleiri en einn meginþátt, og jafnvel allnokkra.


next up previous
Next: Dæmi Up: Meginþættir (principal components) Previous: Línuleg samantekt hendinga: Hámörkun
Gunnar Stefansson 2000-11-15