Kontinuerte fordelinger II: normalfordeling og eksponentialfordeling
Sessionsmateriale:¶
Ross: 5.5., 5.6.
Videoserien giver en hurtig gennemgang af kontinuerte fordelinger, og er en god introduktion til kurset og kan bruges som erstatning for læsestoffet. Det samme gælder for videoen om eksponentialfordelingen.
Se Tutorial 5: Kontinuerte fordelinger II (normalfordeling og eksponentialfordeling)
Download tutorial som notebook (.ipynb)
Video Materiale:¶
Continuous Probability Distributions (5-7)
Playliste med 10 videoer, der dækker kontinuerte fordelinger - også til session 4.
Exponential Distribution
En enkelt video, der dækker eksponentialfordelingen, som supplement til videoserien om kontinuerte fordelinger.
Sessionbeskrivelse¶
I denne session arbejder vi målrettet med to centrale kontinuerte standardfordelinger: normalfordelingen og eksponentialfordelingen.
Først behandler vi normalfordelingen (Gauss-kurven): parametrene \(\mu\) og \(\sigma^2\), standardnormalfordelingen \(N(0,1)\), standardisering med Z-scores samt beregning af sandsynligheder og fraktiler. Vi ser også på lineære transformationer af normalfordelte variable (f.eks. \(Y = aX + b\)), som er en vigtig egenskab i dataanalyse.
Derefter arbejder vi med eksponentialfordelingen. Hvor normalfordelingen ofte beskriver målinger, beskriver eksponentialfordelingen typisk levetider eller ventetider mellem hændelser (f.eks. tiden mellem to servernedbrud). Den har en unik egenskab kaldet hukommelsesløshed (memorylessness), og vi kobler den til Poisson-processer: Hvis ankomster er Poisson-fordelte, er tiden mellem dem eksponentialfordelt.
Centrale begreber¶
- Normalfordeling: Parametre, standardisering og anvendelse
- Standardnormalfordeling: \(N(0,1)\) og Z-score
- Eksponentialfordeling: Tæthedsfunktion \(f(x) = \lambda e^{-\lambda x}\)
- Rate-parameteren (\(\lambda\)): Sammenhæng med middelværdi (\(1/\lambda\))
- Hukommelsesløshed: \(P(X > s+t | X > s) = P(X > t)\)
- Relationen mellem Poisson og Eksponential: Antal vs. tid
Læringsmål
- Opnå rutine i beregninger med normalfordelingen (inkl. Z-standardisering).
- Kunne genkende situationer, hvor eksponentialfordelingen er en passende model (ventetider/levetider).
- Forstå og forklare begrebet hukommelsesløshed, og hvorfor det er centralt for eksponentialfordelingen.
- Kunne veksle mellem at beskrive en proces via hændelsesrate (Poisson) og ventetid (Eksponential).
- Kunne beregne sandsynligheder for, at en proces "overlever" længere end et givet tidsrum.
Øvelser¶
Bemærk: Alle dagens øvelser er taget fra eksamensopgaver. Du kan derfor forvente lignende opgaver på eksamen.
Øvelse 1¶
Let \(X \sim N(3,9)\).
- Find \(P(X>0)\).
- Find \(P(-3<X<8)\).
- Find \(P(X>5 | X>3)\).
- \(P(X>0)=\Phi(1) \approx 0.8413\)
- \(P(-3<X<8)=\Phi\left(\frac{5}{3}\right)-\Phi(-2) \approx 0.9295\).
- \(P(X>5 \mid X>3)=2 \times\left(1-\Phi\left(\frac{2}{3}\right)\right) \approx 0.5050\)
Øvelse 2¶
Let \(X \sim N(3,9)\) and \(Y=5-X\).
- Find \(P(X>2)\).
- Find \(P(-1<Y<3)\).
- Find \(P(X>4 |Y<2)\).
- \(P(X>2)=1-\Phi\left(\frac{1}{3}\right) \approx 0.6306\)
- \(P(-1<Y<3)=\Phi\left(\frac{1}{3}\right)-\Phi(-1) \approx 0.4719 \).
- \(P(X>4 \mid Y<2)=2\left(1-\Phi\left(\frac{1}{3}\right)\right) \approx 0.7389 .\)
Øvelse 3¶
Let \(X \sim N(2,4)\) and \(Y=3-2 X\).
- Find \(P(X>1)\).
- Find \(P(-2<Y<1)\).
- Find \(P(X>2 \mid Y<1)\).
- 0.6915
- 0.2902
- 0.7231
Øvelse 4¶
A central database server receives, on the average, 25 requests per second from its clients. Assuming that requests received by a database follow a Poisson distribution
- What is the probability that the server will receive no requests in a 10-millisecond interval?
- What is the probability that the server will receive more than 2 requests in a 10-millisecond interval?
- What is the probability that the server will receive between 2 and 4 (both included) requests in a 20-millisecond interval?
Let T be the time in seconds between requests.
- What is the probability that less than or equal to 10 milliseconds will elapse between job requests?
- What is the probability that more than 100 milliseconds will elapse between requests?
- \(P(X=0) = 0.7788\)
- \(P(X>2) = 0.0022\)
- \(P(2 \leq X \leq 4) = 0.09\)
- \(P(T \leq 0.01) = 0.2212\)
- \(P(T > 0.1) = 0.0821\)
Øvelse 5¶
Empirical evidence suggests that the number of battery charges of a Tesla Model S ( 85 kWh ) follows a Poisson distribution with an average of 2.1 charges per 1,000 km.
- What is the probability that you will need to charge the Tesla more than five times during a \(2,000 \mathrm{~km}\) trip?
- What is the probability that you will not need to charge the Tesla during a 500 km trip?
Now, let \(K\) denote the range in kilometers between charges.
- Which distribution must be used to model \(K\) and what is the average range in kilometers between charges?
- Suppose someone has to travel from Horsens to Copenhagen - a distance of 270 km. What is the probability that the person will be able to complete the trip without having to charge the car battery?
- 0.2469
- 0.3499
- 476.19
- 0.5672