MATH 2411 Homework 3

Q1

i

df <- read.csv("lead_concentration.csv")
df_fall_1977 <- na.omit(df$Fall.1977)
 
n = length(df_fall_1977)
m = mean(df_fall_1977)
v = var(df_fall_1977)
s = sd(df_fall_1977)
 
alpha = (1 - 0.9) / 2
t_alpha = qt(1 - alpha, df=n-1)
 
c(m - t_alpha * s / sqrt(n), m + t_alpha * s / sqrt(n))

The 90% CI of mean is [8.504470, 9.858688]

ii

The CI for $σ^{2}$ is

[\frac{( n - 1 ) S _{n - 1}^{2}}{χ _{n - 1, α}^{2}}, \frac{( n - 1 ) S _{n - 1}^{2}}{χ _{n - 1, 1 - α}^{2}}]

The CI for $\frac{1}{σ}$ is

\frac{χ _{n - 1, 1 - α}^{2}}{( n - 1 ) S _{n - 1}^{2}}, \frac{χ _{n - 1, α}^{2}}{( n - 1 ) S _{n - 1}^{2}}

X_one_minus_alpha = qchisq(alpha, df=n-1)
X_alpha = qchisq(1 - alpha, df=n-1)
 
1 / sqrt(
    c(
        (n - 1) * v / X_one_minus_alpha,
        (n - 1) * v / X_alpha
    )
)

The 90% CI of $\frac{1}{σ}$ is [0.3260397, 0.4800552]

Q2

a

Bias (\overset{p}{^}, p) = E (\overset{p}{^}) - p = E (\overset{ˉ}{X}) - p = E (\frac{Y}{n}) - p = E (\frac{X _{1} + X _{2} + \dots + X _{n}}{n}) - p = \frac{1}{n} i = 1 \sum n E (X_{i}) - p = \frac{1}{n} n p - p = 0

Therefore $\frac{Y}{n}$ is an unbiased estimator of $p$

b

Va r (\overset{ˉ}{X}) = Va r (\frac{X _{1} + X _{2} + \dots + X _{n}}{n}) = \frac{1}{n ^{2}} Va r (X_{1} + X_{2} + \dots + X_{n}) = \frac{1}{n ^{2}} [Va r (X_{1}) + Va r (X_{2}) + \dots + Va r (X_{n})] = \frac{n p ( 1 - p )}{n ^{2}} = \frac{p ( 1 - p )}{n}

c

Va r (\overset{ˉ}{X}) = E (\overset{ˉ}{X}^{2}) - E (\overset{ˉ}{X})^{2} E (\overset{ˉ}{X}^{2}) = \frac{p ( 1 - p )}{n} = \frac{p ( 1 - p )}{n} + p^{2}

E (\frac{X ˉ ( 1 - X ˉ )}{n}) = E (\frac{X ˉ - X ˉ ^{2}}{n}) = \frac{1}{n} (E (\overset{ˉ}{X}) - E (\overset{ˉ}{X}^{2})) = \frac{1}{n} (p - (\frac{p ( 1 - p )}{n} + p^{2})) = \frac{1}{n} (\frac{n p - n p ^{2} - p + p ^{2}}{n}) = \frac{p ^{2} ( - n + 1 ) + p ( n - 1 )}{n ^{2}} = \frac{( n - 1 ) ( - p ^{2} + p )}{n ^{2}} = \frac{( n - 1 ) p ( 1 - p )}{n ^{2}}

d

Bias = E (c \overset{ˉ}{X} (1 - \overset{ˉ}{X})) - \frac{p ( 1 - p )}{n} \frac{c ( n - 1 ) p ( 1 - p )}{n} c = 0 = \frac{p ( 1 - p )}{n} = \frac{1}{n - 1}

$\pagebreak$

Q3

i

The PDF of $X_{i}$ is

p (x) = \frac{1}{T}, 0 \leq x \leq T

The expectation of $X_{i}$ is

E (X_{i}) = \int_{0}^{T} x p (x) d x = \int_{0}^{T} x \frac{1}{T} d x = \frac{1}{T} \frac{T ^{2}}{2} = \frac{T}{2}

The expectation of $\overset{ˉ}{X}$ is

E (\overset{ˉ}{X}) = E (\frac{X _{1} + X _{2} + \dots + X _{n}}{n}) = \frac{1}{n} E (X_{1} + X_{2} + \dots + X_{n}) = \frac{1}{n} \times n \times \frac{T}{2} = \frac{T}{2}

To make it unbiased, multiply by 2, then $\hat{T} = 2 \overset{ˉ}{X}$

B ia s (\hat{T}) = B ia s (2 \overset{ˉ}{X}) = E (2 \overset{ˉ}{X}) - T = T - T = 0

Therefore $\hat{T} = 2 \overset{ˉ}{X}$ is an unbiased estimator of $T$

ii

Since $T$ is the maximum time interval, $max {X_{1}, X_{2}, \dots, X_{n}}$ is the minimum value of $T$ , which maximize $\frac{1}{T ^{n}}$

\hat{T}_{M L E} = argmax {p (X_{1}, X_{2}, \dots, X_{n})} = argmax {\frac{1}{T ^{n}}} = max {X_{1}, X_{2}, \dots, X_{n}}

iii

The CDF of $\hat{T}_{M L E}$ is

F (x) = P (\hat{T}_{M L E} \leq x) = P (max (X_{1}, X_{2}, \dots, X_{n}) \leq x) = P (X_{1} \leq x) P (X_{2} \leq x) \dots P (X_{n} \leq x) = (x \times \frac{1}{T})^{n} = (\frac{x}{T})^{n}

Differentiate w.r.t to $x$ , the PDF of $\hat{T}_{M L E}$ is

f (x) = \frac{1}{T ^{n}} n x^{n - 1} = \frac{n}{T ^{n}} x^{n - 1}

$\pagebreak$
The bias of $\hat{T}_{M L E}$ is

Bias (\hat{T}_{M L E}) = E (\hat{T}_{M L E}) - T = \int_{0}^{T} x \frac{n}{T ^{n}} x^{n - 1} d x - T = \frac{n}{T ^{n}} [\frac{x ^{n + 1}}{n + 1}]_{0}^{T} - T = \frac{n}{T ^{n}} \frac{T ^{n + 1}}{n + 1} - T = \frac{n T}{n + 1} - T \neq = 0

Therefore $\hat{T}_{M L E}$ is a biased estimator

iv

Note that

σ_{X}^{2} = Var (X) = E (X^{2}) - [E (X)]^{2} = \int_{0}^{T} x^{2} \frac{1}{T} d x - (\frac{T}{2})^{2} = \frac{1}{T} [\frac{x ^{3}}{3}]_{0}^{T} - \frac{T ^{2}}{4} = \frac{T ^{2}}{3} - \frac{T ^{2}}{4} = \frac{T ^{2}}{12}

$\pagebreak$

MSE of $\hat{T}$ is

MSE (\hat{T}) = (Bias (\hat{T}, T))^{2} + Var (\hat{T}) = 0 + Var (2 \overset{ˉ}{X}) = 4 Var (\overset{ˉ}{X}) = 4 \times \frac{σ ^{2}}{n} = 4 \times \frac{T ^{2}}{12 n} = \frac{T ^{2}}{3 n}

Note that

Var (\hat{T}_{M L E}) = E (max (X_{1}, X_{2}, \dots, X_{n})^{2}) - [E (max (X_{1}, X_{2}, \dots, X_{n}))]^{2} = \int_{0}^{T} x^{2} \frac{n}{T ^{n}} x^{n - 1} d x - (\frac{n T}{n + 1})^{2} = \frac{n}{T ^{n}} [\frac{x ^{n + 2}}{n + 2}]_{0}^{T} - (\frac{n T}{n + 1})^{2} = \frac{n T ^{2}}{n + 2} - (\frac{n T}{n + 1})^{2} = \frac{( n + 1 ) ^{2} n T ^{2} - ( n + 2 ) n ^{2} T ^{2}}{( n + 2 ) ( n + 1 ) ^{2}} = \frac{n ^{3} T ^{2} + 2 n ^{2} T ^{2} + n T ^{2} - n ^{3} T ^{2} - 2 n ^{2} T ^{2}}{( n + 2 ) ( n + 1 ) ^{2}} = \frac{n T ^{2}}{( n + 2 ) ( n + 1 ) ^{2}}

$\pagebreak$

MSE of $\hat{T}_{M L E}$ is

MSE (\hat{T}_{M L E}) = (Bias (\hat{T}_{M L E}, T))^{2} + Var (\hat{T}_{M L E}) = (\frac{n T}{n + 1} - T)^{2} + \frac{n T ^{2}}{( n + 2 ) ( n + 1 ) ^{2}} = (\frac{n T - T ( n + 1 )}{n + 1})^{2} + \frac{n T ^{2}}{( n + 2 ) ( n + 1 ) ^{2}} = (\frac{n T - n T - T}{n + 1})^{2} + \frac{n T ^{2}}{( n + 2 ) ( n + 1 ) ^{2}} = \frac{T ^{2}}{( n + 1 ) ^{2}} + \frac{n T ^{2}}{( n + 2 ) ( n + 1 ) ^{2}} = \frac{n T ^{2} + 2 T ^{2} + n T ^{2}}{( n + 1 ) ^{2} ( n + 2 )} = \frac{2 T ^{2} ( n + 1 )}{( n + 1 ) ^{2} ( n + 2 )} = \frac{2 T ^{2}}{( n + 1 ) ( n + 2 )}

Comparing the MSE of $\hat{T}$ and $\hat{T}_{M L E}$

\frac{MSE ( T ^ )}{MSE ( T ^ _{M L E} )} = \frac{n T ^{2}}{( n + 2 ) ( n + 1 ) ^{2}} \frac{( n + 1 ) ( n + 2 )}{2 T ^{2}} = \frac{n}{2 ( n + 1 )} = \frac{n}{2 n + 2}

$\frac{n}{2 n + 2} < 1$ for all $n \geq 1$ , therefore the MSE of $\hat{T}_{M L E}$ is larger

🏡

Explorer

MATH 2411 Homework 3

Q1

i

ii

Q2

a

b

c

d

Q3

i

ii

iii

iv

Explorer

Table of Contents

Backlinks