Intervalestimation og konfidensintervaller

Sessionsmateriale:¶

Ross: 7.1, 7.3, 7.4, 7.5.

Se Tutorial 7: Intervalestimation og konfidensintervaller

Video Materiale:¶

Intervalestimation og konfidensintervaller

Der er tre playlister med hhv. 10, 10, og 6 videoer. Som I kan regne ud er det noget mere omfattende end det, vi skal igennem, men jeg har angivet i de to sidste videoer, hvilke videoer der er relevante for os.

Confidence Intervals for Population Means

Inference for Variances

Kun video 1-4.

Inference for Proportions

Kun video 1-4.

Sessionbeskrivelse¶

I denne session går vi fra stikprøvefordelinger (session 6) til at bruge dem til at sige noget kontrolleret om ukendte populationsparametre. Med udgangspunkt i Ross, kapitel 7 (Parameter estimation), afsnit 7.1, 7.3, 7.4 og 7.5, skelner vi mellem punktestimation (ét tal som “bedste gæt”, fx stikprøvegennemsnit) og intervalestimation, hvor vi angiver et interval, der med en valgt sandsynlighed vil indeholde parameteren, når vi gentager forsøget under samme dataindsamling — det er idéen bag konfidensintervaller og det tilhørende konfidensniveau (\(1-\alpha\)).

I 7.3 arbejder vi med konfidensintervaller for middelværdien i normalmodellen: når populationsvariansen er kendt, bruges normalfordelingen (z-baserede intervaller); når den er ukendt, bruges typisk t-fordelingen med passende frihedsgrader. Under samme kapitelafsnit indgår intervaller for variansen (og dermed standardafvigelsen) i en normalpopulation, typisk knyttet til \(\chi^2\)-fordelingen for \((n-1)S^2/\sigma^2\), samt prædiktionsintervaller for en ny observation (ikke det samme som et CI for middelværdien). I 7.4 konstruerer vi intervaller for forskellen mellem to normalpopulationsmiddelværdier under de antagelser, bogen angiver. I 7.5 behandler vi konfidensintervaller for en populationsandel \(p\) i en Bernoulli-population (fx ved stor-stikprøve-normaltilnærmelse til \(\hat{p}\)). Afsnit om maksimal likelihood og eksponentielle livstidsmodeller springes over.

Centrale begreber¶

Punktestimation vs. intervalestimation: Estimat/statistik over for interval med konfidensniveau og gentagelsesfortolkning
Konfidensinterval og konfidensniveau (\(1-\alpha\)): Hvad der er (og ikke er) sandsynligt for parameteren efter observerede data
CI for \(\mu\) (normalmodel): z-interval når \(\sigma\) er kendt; t-interval når \(\sigma\) estimeres med \(S\)
Prædiktionsinterval: Usikkerhed for en ny observation frem for middelværdien
To stikprøver / differens: Konfidensinterval for forskel mellem middelværdier under relevante antagelser
Varians i normalpopulation (under 7.3): Intervaller baseret på \(\chi^2\)-fordelingen for \((n-1)S^2/\sigma^2\)
Andel \(p\) (Ross 7.5): Konfidensintervaller for en Bernoulli-parameter, ofte med normaltilnærmelse for stor \(n\)

Læringsmål

Kunne forklare forskellen mellem punktestimation og intervalestimation og give en korrekt fortolkning af et konfidensniveau.
Kunne udlede og beregne konfidensintervaller for populationsmiddelværdien i normaltilfældet (kendt \(\sigma\): z; ukendt \(\sigma\): t).
Kunne vælge relevant fordeling (normal, t, \(\chi^2\)) ud fra model, antagelser og hvilken parameter der estimeres.
Kunne skelne mellem konfidensinterval for middelværdien og prædiktionsinterval for en enkelt fremtidig observation.
Kunne opstille og fortolke konfidensintervaller for forskellen mellem middelværdier i to normalpopulationer (som i pensum/antagelser for sessionen).
Kunne konstruere og fortolke konfidensintervaller for variansen (eller standardafvigelsen) i en normalpopulation.
Kunne opstille og fortolke konfidensintervaller for en populationsandel \(p\) (som i Ross 7.5).

Øvelser¶

Gennemgang i Python med samme tal som her finder du i Tutorial 7 (markdown og notebook ovenfor).

Øvelse 1¶

A manufacturer produces piston rings for an automobile engine. It is known that ring diameter is normally distributed with \(\sigma=0.001\) millimeters. A random sample of 15 rings has a mean diameter of \(\bar{x}=74.036\) millimeters.

Construct a \(99 \%\) two-sided confidence interval on the mean piston ring diameter.
Construct a \(99 \%\) lower-confidence bound on the mean piston ring diameter. Compare the lower bound of this confidence interval with the one in part (a).

\(99 \%\) two-sided CI on the mean piston ring diameter. For \(\alpha=0.01\), \(z_{\alpha / 2}=z_{0.005}=2.58\), and \(\bar{x}=74.036\), \(\sigma=0.001\), \(n=15\):

\[ \begin{gathered} \bar{x}-z_{0.005}\left(\frac{\sigma}{\sqrt{n}}\right) \leq \mu \leq \bar{x}+z_{0.005}\left(\frac{\sigma}{\sqrt{n}}\right) \\ 74.036-2.58\left(\frac{0.001}{\sqrt{15}}\right) \leq \mu \leq 74.036+2.58\left(\frac{0.001}{\sqrt{15}}\right) \\ 74.0353 \leq \mu \leq 74.0367 \end{gathered} \]
\(99 \%\) one-sided lower bound on the mean piston ring diameter. For \(\alpha=0.01\), \(z_{\alpha}=z_{0.01}=2.33\) and \(\bar{x}=74.036\), \(\sigma=0.001\), \(n=15\):

\[ \begin{aligned} \bar{x}-z_{0.01} \frac{\sigma}{\sqrt{n}} &\leq \mu \\ 74.036-2.33\left(\frac{0.001}{\sqrt{15}}\right) &\leq \mu \\ 74.0354 &\leq \mu \end{aligned} \]

The one-sided lower bound is slightly larger than the lower endpoint of the two-sided interval, because \(z_{0.01} < z_{0.005}\).

Øvelse 2¶

A civil engineer is analyzing the compressive strength of concrete. Compressive strength is normally distributed with \(\sigma^2=1000(\mathrm{psi})^2\). A random sample of 12 specimens has a mean compressive strength of \(\bar{x}=3250\) psi.

Construct a \(95 \%\) two-sided confidence interval on mean compressive strength.
Construct a \(99 \%\) two-sided confidence interval on mean compressive strength. Compare the width of this confidence interval with the width of the one found in part (a).

\(95 \%\) two-sided CI on the mean compressive strength. With \(z_{\alpha/2}=z_{0.025}=1.96\), \(\bar{x}=3250\), \(\sigma=\sqrt{1000}\approx 31.62\), \(n=12\):

\[ \begin{aligned} 3250-1.96\left(\frac{31.62}{\sqrt{12}}\right) &\leq \mu \leq 3250+1.96\left(\frac{31.62}{\sqrt{12}}\right) \\ 3232.11 &\leq \mu \leq 3267.89 \end{aligned} \]
\(99 \%\) two-sided CI: \(z_{0.005}=2.58\).

\[ 3250-2.58\left(\frac{31.62}{\sqrt{12}}\right) \leq \mu \leq 3250+2.58\left(\frac{31.62}{\sqrt{12}}\right) \]

i.e. approximately \(3226.48 \leq \mu \leq 3273.52\). The \(99 \%\) interval is wider than the \(95 \%\) interval, because a higher confidence level requires a larger critical value.

Øvelse 3¶

An article in Computers & Electrical Engineering ["Parallel Simulation of Cellular Neural Networks" (1996, Vol. 22, pp. 61-84)] considered the speedup of cellular neural networks (CNNs) for a parallel general-purpose computing architecture based on six transputers in different areas. The data follow:

3.775302	3.350679	4.217981	4.030324	4.639692
4.139665	4.395575	4.824257	4.268119	4.584193
4.930027	4.315973	4.600101

Is there evidence to support the assumption that speedup of CNN is normally distributed? Include a graphical display in your answer.
Construct a \(95 \%\) two-sided confidence interval on the mean speedup.
Construct a \(95 \%\) lower confidence bound on the mean speedup.

The data appear to be normally distributed based on examination of the normal probability plot below.
\(95 \%\) confidence interval on mean speed-up:

\[ \begin{aligned} & n=13 \quad \bar{x}=4.313 \quad s=0.4328 \quad t_{0.025,12}=2.179 \\ & \bar{x}-t_{0.025,12}\left(\frac{s}{\sqrt{n}}\right) \leq \mu \leq \bar{x}+t_{0.025,12}\left(\frac{s}{\sqrt{n}}\right) \\ & 4.051 \leq \mu \leq 4.575 \end{aligned} \]
\(95 \%\) lower confidence bound on mean speed-up:

\[ \begin{aligned} & n=13 \quad \bar{x}=4.313 \quad s=0.4328 \quad t_{0.05,12}=1.782 \\ & \bar{x}-t_{0.05,12}\left(\frac{s}{\sqrt{n}}\right) \leq \mu \\ & 4.099 \leq \mu \end{aligned} \]

Øvelse 4¶

An article in Technometrics ["Two-Way Random Effects Analyses and Gauge R\&R Studies" (1999, Vol. 41(3), pp. 202-211)] studied the capability of a gauge by measuring the weight of paper. The data for repeated measurements of one sheet of paper are in the following table. Construct a \(95 \%\) one-sided upper confidence interval for the standard deviation of these measurements. Check the assumption of normality of the data and comment on the assumptions for the confidence interval.

Observations
3.481	3.448	3.485	3.475	3.472
3.477	3.472	3.464	3.472	3.470
3.470	3.470	3.477	3.473	3.474

\(95 \%\) one-sided upper confidence bound for \(\sigma\) (from \(\chi^2\) for \(\sigma^2\)):

\[ \begin{aligned} n=15, \quad s&=0.00831 \\ \chi_{1-\alpha, n-1}^2 &=\chi_{0.95,14}^2=6.53 \\ \sigma^2 &\leq \frac{(n-1)s^2}{\chi_{0.95,14}^2}=\frac{14(0.00831)^2}{6.53} \\ \sigma &\leq 0.0122 \end{aligned} \]

The data do not appear to be normally distributed based on an examination of the normal probability plot in the textbook solution; in that case the \(\chi^2\)-interval for \(\sigma\) is not strictly valid.

Øvelse 5¶

The 2004 presidential election exit polls from the critical state of Ohio provided the following results. The exit polls had 2020 respondents, 768 of whom were college graduates. Of the college graduates, 412 voted for George Bush.

Calculate a \(95 \%\) confidence interval for the proportion of college graduates in Ohio who voted for George Bush.
Calculate a \(95 \%\) lower confidence bound for the proportion of college graduates in Ohio who voted for George Bush.

\(95 \%\) confidence interval for the proportion of college graduates in Ohio that voted for George Bush:

\[ \begin{gathered} \hat{p}=\frac{412}{768}=0.536, \quad n=768, \quad z_{\alpha / 2}=1.96 \\ \hat{p}-z_{\alpha / 2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \leq p \leq \hat{p}+z_{\alpha / 2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \\ 0.501 \leq p \leq 0.571 \end{gathered} \]
\(95 \%\) lower confidence bound:

\[ \begin{aligned} \hat{p}-z_\alpha \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} & \leq p \\ 0.506 & \leq p \end{aligned} \]