09.10.16 Línuleg algebra og tölfræði

Lausnir á prófi, des. 2000

Látum fylkið X vera

\begin{eqnarray*}
\mathbf{X}=
\left[ \mathbf{a_1} \vdots \mathbf{a_2} \vdots \m...
... 0 & 0 \\
1 & 2 & -1 & 0 \\
1 & 2 & 1 & 0
\end{array} \right]
\end{eqnarray*}


og vigurinn y vera


\begin{eqnarray*}
\mathbf{y}= \left[ \begin{array}{r}
1 \\
2 \\
1 \\
3 \\
0
\end{array} \right]
\end{eqnarray*}


1. (10) Finnið þann vigur $\boldsymbol{\hat{\beta}}$ sem gefur lægsta gildi á $\vert\vert\mathbf{y}-\mathbf{X}\boldsymbol{\beta}\vert\vert^2$ yfir alla hugsanlega vigra $\boldsymbol{\beta}$.

Athugið, að þótt vissulega sé rétt, að $\boldsymbol{\hat{\beta}}=\left (
\mathbf{X'} \mathbf{X} \right ) ^{-1} \mathbf{X'} \mathbf{y}$, þá er X' X 4 x 4 fylki og ekki hefur verið farið í, hvernig á að finna andhverfu af því. Hér er þetta fylki að vísu einfaldara en oftast, en samt vefst fyrir mörgum, hvernig á að finna slíka andhverfu.

Hér er því einfaldast að leysa normaljöfnurnar, þ.e. finna $\boldsymbol{\hat{\beta}}$ sem uppfyllir $\left ( \mathbf{X'} \mathbf{X}
\right ) \boldsymbol{\hat{\beta}} = \mathbf{X'} \mathbf{y}$.

Við reiknum því fyrst $\left ( \mathbf{X'} \mathbf{X} \right )$-fylkið:


\begin{eqnarray*}
\left ( \mathbf{X'} \mathbf{X}
\right ) =
\left[ \begin{array...
... & 0 & 0 \\
0 & 0 & 4 & 2 \\
0 & 0 & 2 & 2
\end{array} \right]
\end{eqnarray*}


og þvínæst margföldum við saman X' og y:


\begin{eqnarray*}
\mathbf{X'} \mathbf{y}=
\left[ \begin{array}{rrrrr}
3 &3 &4 &...
...eft[ \begin{array}{r}
16 \\
14 \\
-2 \\
1
\end{array} \right]
\end{eqnarray*}


Þá vitum við að $\hat{\boldsymbol{\beta}}$ er 4x1 vigurinn sem inniheldur $\hat{\beta_1},\hat{\beta_2},\hat{\beta_3},\hat{\beta_4}$ og uppfyllir:


\begin{eqnarray*}
\left[ \begin{array}{rrrr}
36 & 24 & 0 & 0 \\
24 & 20 & 0 & 0...
...eft[ \begin{array}{r}
16 \\
14 \\
-2 \\
1
\end{array} \right]
\end{eqnarray*}


Þetta tilsvarar jöfnuhneppinu


\begin{eqnarray*}
36 \hat{\beta_1} + 24\hat{\beta_2} + 0\hat{\beta_3} + 0\hat{\...
...{\beta_1} + 0\hat{\beta_2} + 2\hat{\beta_3} + 2\hat{\beta_4} &=1
\end{eqnarray*}


þ.e.


\begin{eqnarray*}
36 \hat{\beta_1} + 24\hat{\beta_2} & &=16 \\
24 \hat{\beta_...
...+ 2\hat{\beta_4} &=-1 \\
& 2\hat{\beta_3} + 2\hat{\beta_4} &=1
\end{eqnarray*}


Hér einfaldast jöfnurnar því þannig, að annars vegar fást tvær jöfnur í tveimur óþekktum til að finna $\hat{\beta_1}, \hat{\beta_2}$ og hins vegar tvær jöfnur í tveimur öþekktum til að finna $\hat{\beta_3},
\hat{\beta_4}$.

Við byrjum á $\hat{\beta_1}, \hat{\beta_2}$:

\begin{eqnarray*}
36 \hat{\beta_1} + 24\hat{\beta_2} &=16 \\
24 \hat{\beta_1} + 20\hat{\beta_2} &=14
\end{eqnarray*}


Deila má með 2 í síðari jöfnuna og margfalda hana síðan með 3 til að fá stuðulinn 36 á $\hat{\beta_1}$ í báðum. Gerum þetta og drögum síðan neðri jöfnuna frá þeirri efri:


\begin{eqnarray*}
36 \hat{\beta_1}&+ 24\hat{\beta_2} &=16 \\
-36 \hat{\beta_1}&- 30\hat{\beta_2} &=-21 \\
\hline
& -6\hat{\beta_2} &=-5
\end{eqnarray*}


þ.e.a.s.

$\hat{\beta_2} = \frac{5}{6}$. Þá fæst líka með efri jöfnunni, að $16= 36 \hat{\beta_1} + 24 \frac{5}{6} = 36 \hat{\beta_1} + 20$, þ.e. $ \hat{\beta_1}=-\frac{1}{9}$.

Að lokum finnum við $\hat{\beta_3},
\hat{\beta_4}$ úr síðari jöfnunum:

\begin{eqnarray*}
4\hat{\beta_3} + 2\hat{\beta_4} &=-2 \\
2\hat{\beta_3} + 2\hat{\beta_4} &=1
\end{eqnarray*}


Hér má margfalda síðari jöfnuna með -1 og leggja þær saman (þ.e. við getum dregið neðri jöfnuna frá þeirri efri):


\begin{eqnarray*}
4\hat{\beta_3} &+ 2\hat{\beta_4} &=-2 \\
-2\hat{\beta_3} &- 2\hat{\beta_4} &=-1 \\
\hline
2 \hat{\beta_3} & &= -3
\end{eqnarray*}


þ.e. $\hat{\beta_3} = -\frac{3}{2} $

Þá fæst líka með efri jöfnunni, að $-2= 4 ( -\frac{3}{2}) +
2\hat{\beta_4} = -6 + 2\hat{\beta_4}$, þ.e. $\hat{\beta_4}= 2$.

Vigurinn $\hat{\boldsymbol{\beta}}$ er því gefinn með


\begin{eqnarray*}
\hat{\boldsymbol{\beta}}
=
\left[ \begin{array}{r}
\beta_1 \\ ...
...1}{9} \\
\frac{5}{6} \\
-\frac{3}{2} \\
2
\end{array} \right]
\end{eqnarray*}


2. (15) Finnið hornréttan einingargrunn fyrir sp{ a1, a2. a3, a4 }.

Notum Gram-Schmidt aðferð og athugum að mörg innfeldanna verða núll.

Byrjum á að athuga, að fyrsta normið er : $\vert\vert\mathbf{a_1}\vert\vert=\sqrt
{3^2+3^2+4^2+1^2+1^2} =\sqrt {36}=6$ og því fæst fyrsti einingarvigurinn þannig:

\begin{eqnarray*}
\mathbf{v_1 }=\mathbf{a_1} / \vert\vert\mathbf{a_1}\vert\vert ...
... \begin{array}{r}
3 \\
3 \\
4 \\
1 \\
1
\end{array} \right]
\end{eqnarray*}


Næst reiknum við ofanvarp a2 á þennan vigur og leifina frá því ofanvarpi:


\begin{eqnarray*}
\mathbf{r_2 }=\mathbf{a_2} -
\underbrace {
\left ( \mathbf{a_...
...egin{array}{r}
0 \\
0 \\
-1 \\
2 \\
2
\end{array} \right]
\end{eqnarray*}


Þá fæst strax, að $\vert\vert\mathbf{r_2}\vert\vert= \frac{2}{3}\sqrt {0+0+1+4+4} = \frac{2}{3}\sqrt {9}=2$ og þá fæst næsti einingavigur sem

\begin{eqnarray*}
\mathbf{v_2 }=\mathbf{r_2} / \vert\vert\mathbf{r_2}\vert\vert ...
...egin{array}{r}
0 \\
0 \\
-1 \\
2 \\
2
\end{array} \right]
\end{eqnarray*}


Svo kemur þriðji einingarvigurinn, v3. Byrjum eins og áður á að reikna leif


\begin{eqnarray*}
\mathbf{r_3 }=\mathbf{a_3} -
\underbrace {
\left ( \mathbf{a_...
...{array}{r}
-1 \\
1 \\
0 \\
-1 \\
1
\end{array} \right]
\end{eqnarray*}


og einingarvigurinn fæst með því að byrja á að finna lengdina, $\vert\vert\mathbf{r_3}\vert\vert=\sqrt {1+1+0+1+1} =\sqrt {4}=2$ og deila svo með henni:


\begin{eqnarray*}
\mathbf{v_3 }=\mathbf{r_3} / \vert\vert\mathbf{r_3}\vert\vert ...
...{array}{r}
-1 \\
1 \\
0 \\
-1 \\
1
\end{array} \right]
\end{eqnarray*}


Þá er komið að síðasta einingavigrinum, v4. Byrjum á að finna leifina,

\begin{eqnarray*}
\mathbf{r_4 }=\mathbf{a_4} -
\underbrace {
\left ( \mathbf{a_...
...{array}{r}
-1 \\
1 \\
0 \\
-1 \\
1
\end{array} \right]
\end{eqnarray*}


og þannig fæst

\begin{eqnarray*}
\mathbf{r_4 }= \frac{1}{2} \left[ \begin{array}{r}
-1 \\
1 \\
0 \\
1 \\
-1
\end{array} \right]
\end{eqnarray*}


Norm leifarinn er $\vert\vert\mathbf{r_4}\vert\vert=\frac{1}{2}\sqrt
{1+1+0+1+1}=\frac{1}{2}\sqrt {4}=1$ svo einigarvigurinn verður einfaldlega leifin sjálf:


\begin{eqnarray*}
\mathbf{v_4 }=\mathbf{r_4} / \vert\vert\mathbf{r_4}\vert\vert ...
...{array}{r}
-1 \\
1 \\
0 \\
1 \\
-1
\end{array} \right]
\end{eqnarray*}


3. (5) Finnið ofanvarpið, $\hat{\mathbf{y}}$, af y á spann dálkvigra fylkisins X.

Þetta má gera með hvort sem er með $\hat{\mathbf{y}}=\mathbf{X}\boldsymbol{\hat{\beta}}$ og nota niðurstöðu úr dæmi 1 eða nota sér að $\hat{\mathbf{y}}$ er ofanvarpið af y á $span\{a_1,\ldots ,a_4\}=span\{v_1,\ldots ,v_4\}$, þ.e. finna ofanvarp y á $span\{v_1,\ldots ,v_4\}$. Fyrri aðferðin er óneitanlega miklu fljótlegri.


\begin{eqnarray*}
\hat{\mathbf{y}}=\mathbf{X}\boldsymbol{\hat{\beta}}=\left [ \b...
...
5/6 \\
11/6 \\
11/9 \\
55/18 \\
1/18
\end{array} \right ]
\end{eqnarray*}


4. (15) Teiknið mynd og nýtið hana til að finna þau gildi, x og y, sem hámarka z= 3x+2y með tilliti til

\begin{eqnarray*}
-3x+y \leq -2 \\
2x-y \leq 5 \\
2x+y \leq 8 \\
x \geq 0 \\
y \geq 0
\end{eqnarray*}


Figure 1: Línur í bestunardæmi

Skurðpunktur lína 1 og 3 er í (x,y)=(2,4) og þar er z=14, sem er greinilega hæsta mögulega gildi á z.

5. (15) Í teningakasti fjárhættuspilara var sett merki á annan teninginn og fylgst náið með útkomum á hvorum teningi fyrir sig. Eftir 50 köst kom í ljós að á öðrum teningnum hafði 6 komið upp 11 sinnum en á hinum 15 sinnum.

(a) Er hægt að fullyrða að munur sé á teningunum?

Hér þarf að prófa

H0: p1=p2 vs $H_a:p_1\ne p_2$

Ef H0 er rétt má meta sameiginlegt p með $\hat{p}=\frac{11+15}{50+50}=\frac{26}{100}=\frac{13}{50}$ og við skilgreinum $\hat{q}=1-\hat{p}=\frac{37}{50}$. Ef tilgátan er rétt vitum við ennfremur að


$\displaystyle z=\frac{\hat{p}_1-\hat{p}_2}{\sqrt { \hat{p}\hat{q}\left ( \frac{1}{n}+\frac{1}{m} \right ) }}$     (1)

(þar sem n og m eru úrtaksstærðirnar) á að tilsvara tölu sem hefur ``komið úr normaldreifingu'' og við höfnum því H0 ef $z>z_{1-\alpha}=z_{0.95}=1.645$ (einhliða próf með $\alpha=0.05$)

Hér fæst hins vegar $\hat{p}_1=\frac{11}{50}$ og $\hat{p}_2=\frac{15}{50}$ þannig að


$\displaystyle z=\frac{\frac{11}{50}-\frac{15}{50}}{\sqrt{\frac{13}{50}\frac{37}{50}\left ( \frac{1}{50}+\frac{1}{50}\right ) } } = \ldots = -0.912$     (2)

Hér er því ekki hægt að hafna H0, munurinn er ekki marktækur.

(b) Fullyrt hefur verið að fjárhættuspilarinn sé með teninga sem séu falsaðir með því að setja ákveðinn aukinn þunga á móti 6-hliðinni (og auka þannig líkur á 6 á ákveðinn hátt). Er þessi fullyrðing réttlætanleg?

Her þarf að athuga, hvort marktækur munur sé á teningunum, frá teningi sem er óbjagaður. Óbjagaður teningur hefur líkurnar $\frac{1}{6}$ á hverri hlið og hér er því haldið fram að tengingarnir séu með meiri líkum á að fá ``6''. Hér er eðlilegt að gera einhliða próf (varla færi neinn að vega niður líkurnar á að fá ``6''):

$H_0: p=\frac{1}{6}$ vs $H_a:p>\frac{1}{6}$.

Tveir teningar voru notaðir í kastinu að ofan og í ljós kom að munurinn á þeim var ekki marktækur. Gerum ráð fyrir að þeir séu dæmigerðir fyrir teninga sem fjárhættuspilarinn notar og við höfum því mat á hans teningum með $\hat{p}=\frac{26}{100}$. Ef H0 er rétt ætti talan


\begin{eqnarray*}
z=\frac{\hat{p}-\hat{p}_0}{\sqrt { \hat{p_0}\hat{q_0}/{n}}}
\end{eqnarray*}


að ``koma úr normaldreifingu''.

6. (15) Krukka nokkur inniheldur 8 kúlur, 5 rauðar og 3 bláar. Draga skal tilviljanakennt eina kúlu í einu úr krukkunni, með skilum.

Látum Y tákna fjölda rauðra kúlna sem fást áður en blá kúla kemur ef dregið er þrisvar sinnum (setjum Y=3 ef ekki kemur nein blá).

(a) Setjið upp líkindadreifingu Y.

Athugum, að Y hefur ekki neina líkindadreifingu, sem farið hefur verið í í þessu námskeiði. Sérílagi hefur Y ekki tvíkostadreifingu.

Mögulegar útkomur (grunnatburðir) úr tilrauninni þar sem dregnar eru 3 kúlur eru alls 8: (BBB), (BBR), (BRB), (BRR), (RBB), (RBR), (RRB), (RRR). Þarna er dregið með skilum þannig að líkur á B eru 3/8 og á R eru 5/8. Líkur á hverri útkomu ásamt tilsvarandi gildi, y á Y eru eftirfarandi:

Útkoma líkur y
BBB $\frac{3}{8}^3\frac{5}{8}^0=1\cdot 27 / 512 = 27/512 $ 0
BBR $\frac{3}{8}^2\frac{5}{8}^1=5\cdot 9 / 512 = 45/512 $ 0
BRB $\frac{3}{8}^2\frac{5}{8}^1=5\cdot 9 / 512 = 45/512 $ 0
BRR $\frac{3}{8}^1\frac{5}{8}^2=25\cdot 3 / 512 = 75/512 $ 0
RBB $\frac{3}{8}^2\frac{5}{8}^1=5\cdot 9 / 512 = 45/512 $ 1
RBR $\frac{3}{8}^1\frac{5}{8}^2=25\cdot 3 / 512 = 75/512 $ 1
RRB $\frac{3}{8}^1\frac{5}{8}^2=25\cdot 3 / 512 = 75/512 $ 2
RRR $\frac{3}{8}^0\frac{5}{8}^3=125\cdot 1 / 512= 125/512 $ 3
Alls 1  

Með því að leggja saman úr þessari töflu fást líkur á hverju hugsanlegu gildi á hendingunni Y:
y p(y)=P[Y=y]  
0 192/512  
1 120/512  
2 75/512  
3 125/512  
Alls 1  

(b) Reiknið væntigildi Y.

Væntigildið þarf að reikna með grunnjöfnunni: $E[Y]=\sum_y y \cdot
p(y) = 0 \cdot 192/512 +1 \cdot 120/512 +2 \cdot 75/512 +3 \cdot
125/512 =\ldots$

Látum hendinguna X tákna fjölda rauðra kúlna sem fást. Skrifið niður viðeigandi jöfnur og reiknið:

Athugum, að $X\sim b(n,p=\frac{5}{8})$

(c) Væntigildi X ef dregið er 10 sinnum.

$E[X]=n\cdot p=10\cdot \frac{5}{8} = \frac{25}{4}$.

(d) Líkurnar á því að fá a.m.k. tvær rauðar kúlur ef dregið er 10 sinnum.

$P[X \geq 2 ] = 1-P[X<2] = 1-(P[X=0]+P[X=1])$ reiknast samkvæmt tvíkostadreifingu: $P[X \geq 2 ] = 1
-{10 \choose 0}\frac{5}{8}^0\frac{3}{8}^{10}
-{10 \choose 1}\frac{5}{8}^1\frac{3}{8}^9$

(e) Líkurnar á því að fá 40 eða færri rauðar kúlur ef dregið er 100 sinnum.

Reiknast með normaldreifingarnálgun.

7. (15) Tilraun var framkvæmd á tveimur stöðum með eftirfarandi niðurstöðum:

Staður 1 2
n 5 6
$\bar{x}$ 2.5 3.7
s 0.4 0.3

Er marktækur munur á meðaltölunum?

Hér má alls ekki nota normaldreifingarnálgunina, þ.e.a.s. reikna með því að $s_1=\sigma_1$ og $s_2=\sigma_2$ því til þess er úrtakið allt of lítið.

Við reiknum með því að $\sigma_1=\sigma_2$ og metum sameiginlegt staðalfrávik s með því að reikna $s^2=\frac{(n_1-1)s_1^2
+(n_2-1)s_2^2}{n_1+n_2-2}$ og þvínæst $t=\frac{\bar{x_1}-\bar{x_2}}{s\sqrt{1/n_1+1/n_2}}=\ldots=5.66$. Tilsvarandi töflugildi er t*=2.262 og munurinn er því marktækur.

8. (25) Áhugi er á að kanna mum á tveimur aðhvarfsgreiningarlínum, þ.e. að prófa hvort sé marktækt betra að leggja tvær línur frekar en eina í gegnum gögn (xi,yi) úr tveimur könnunum, annars vegar hjá körlum (1) og hins vegar konum (2). Í hverri könnun eru fjórar mælingar.

Þetta má gera með því að smíða annars vegar einfalt líkan (líkan R),


\begin{displaymath}
y_{ij}=\alpha + \beta x_{ij} + e_{ij} \textrm{ fyrir } i=1, \ldots 2, j=1,\ldots,4 \textrm{(lína R)}
\end{displaymath} (3)

og hins vegar flókið líkan (líkan F) og bera þau síðan saman. Stuðlar í flókna líkaninu eru metnir með því að leggja eina línu í gegnum hvert gagnasafn:


\begin{displaymath}
y_{1j}=\alpha_1 + \beta_1 x_{1j} + e_{1j} \textrm{ fyrir } j=1,\ldots,4, \textrm{(lína F1)}
\end{displaymath} (4)


\begin{displaymath}
y_{2j}=\alpha_2 + \beta_2 x_{2j} + e_{2j} \textrm{ fyrir } j=1,\ldots,4, \textrm{(lína F2)}
\end{displaymath} (5)

Þessu til viðbótar er prófað millilíkan (M) með breytilegum skurðpunkti:

\begin{displaymath}
y_{ij}=\alpha_i + \beta x_{ij} + e_{ij} \textrm{ fyrir } i=1, \ldots 2, j=1,\ldots,4, \textrm{(lína M)}
\end{displaymath} (6)

Meðfylgjandi blöð gefa SAS skipanir og úttak sem sýnir metna stuðla og helstu töflur með fervikagreiningum. Munið að rökstyðja svörin hér að neðan með beinum tilvísunum í tölur úr töflum.

Spurningar að neðan eru flestallar með beina tilvísun í tilteknar tölur í SAS úttakinu og þarf litlu við að bæta. Þó eru 2-3 spurningar sem ekki eru svo einfaldar.

Spurningar með tilvísunum í líkön R og F

(a) Hvað útskýrir einfalda líkanið hátt hlutfall af breytileika gagnanna og hver er fylgnin milli x og y?

Hlutfall af breytileika = R2 og fylgnin=r. Athuga þarf formerki á r - ekki er alltaf nóg að draga kvaðratrót (en það nægir hér).

(b) Hvert er matið, $\hat{\alpha}$, $\hat{\beta}$ og $\hat{\sigma}^2$, á stuðlunum $\alpha$ og $\beta$ og dreifni mælinganna, $\sigma^2$?

Athugið, að $\hat{\alpha}$, $\hat{\beta}$ og $\hat{\sigma}^2$ eru úr einfalda líkaninu (annars eru þetta sér tölur fyrir karla eða konur).

(c) Er skurðpunkturinn í einfalda líkaninu marktækt frábrugðinn núlli?

Athugið að þetta er skurðpunkturinn sem verið er að tala um, ekki hallinn.

(d) Notið flókna líkanið til að finna besta spágildi (þ.e. minnstu kvaðrata mat) á y fyrir karl sem hefur x=2.5.

Hér þarf að vita, hvaða jöfnu er verið að nota, finna stuðlana í hana og reikna síðan upp úr jöfnunni með x=2.5.

(e) Hver eru gildin á kvaðratsummum frávika í hvoru líkani fyrir sig, þ.e. SSE(F) og SSE(R)?

SSE(R) er í útprentun, en ekki SSE(F). Hins vegar er í raun gefið í skyn í spurningunni, hvað SSE(F) er: Fullt líkan er metið með því að meta sér fyrir karla og konur. Það er hægt vegna þess að þegar kvaðratsumman er lágmörkuð í flókna líkaninu eru kvaðratsummurnar alveg aðskildar. Raunar gildir augljóslega alltaf SSE(F)=SSE(F1)+SSE(F2) því aðeins er verið að skipta upp gögnunum (og þarmeð kvaðratsummunum).

(f) Prófið (með því að setja upp viðeigandi ANOVA töflu) hvort flókna líkanið (F) er marktækt betra en einfalda líkanið (R).

Hér þarf að nota SSE(F) og SSE(R) úr (e)-liðnum.

Spurningar með tilvísun í millilíkanið M

(g) Hvað er SSE í þessu líkani, þ.e. $y_{ij}=\alpha_i + \beta x_{ij} + e_{ij}$?

(h) Hvað yrði SSE í líkaninu $y_{ij}=\alpha_i + e_{ij}$?

Hér þarf að skilja Type I og/eða Type III kvaðratsummurnar, þ.e. vita hvernig SSE breytist ef lið er sleppt úr líkaninu.