Introdução a grandes amostras
Agora, vamos verificar algumas propriedades assintóticas, isto é, quando o número de amostras é muito grande, com .
Conceitos de convergência
Uma lista de conceitos de convergência importantes. Em particular, o conceito de consistência é importante para estimadores, dado que gostaríamos que, com amostras suficientes, tivéssemos valores razoáveis para o parâmetro.
-
Determinística: Seja uma sequência em um espaço normado e uma sequência de reais. Se para cada , existe suficientemente grande tal que para , dizemos que . Se existe tal que a desigualdade anterior valha para grande, então dizemos que .
-
Estocástica: Seja uma sequência de variáveis aleatórias definidas em espaços normados e uma sequência de reais. Se para cada e , existe tal que para , dizemos que . Se para cada , existe tal que a desigualdade anterior valha para grande, então dizemos que .
-
Convergência em probabilidade: Se e são quantidades aleatórias e, para todo , vale que então dizemos que , isto é, converge em probabilidade para .
Se para uma sequência de funções mensuráveis e é uma outra quantidade aleatória, temos que se, e só se, . Em particular, se é contínua em e , então .
-
Consistência: Sejam uma função mensurável e uma distribuição paramétrica definida em . A sequência de variáveis aleatórias é consistente para se para todo . A lei dos grandes números é um forte aliado, pois afirma que a média amostral converge em probabilidade para a média verdadeira.
-
Convergência em distribuição: Seja uma sequência de quantidades aleatórias e uma quantidade aleatória. Se para toda função contínua limitada , dizemos que converge em distribuição para , isto é, ou . Dizemos que a distribuição de é a distribuição assintótica de . Além do mais, dizemos que a distribuição de converge fracamente para a distribuição de . Se é a função de distribuição acumulada de e é a CDF de , então sempre que é contínua em se, e somente se,
Teorema: Se , e , então
- Convergência quase certa: Uma sequência converge quase certamente para se .
Consistência
O exemplo clássico de consistência é o seguinte:
📝
Exemplo (Lei fraca dos grandes números)
Seja uma sequência de variáveis aleatórias independentes cuja distribuição tem densidade . Defina e . Pela lei fraca dos grandes números, temos que é uma sequência de estimadores consistente para .
Teorema: Seja uma sequência de estimadores para tal que, para todo ,
(i) ,
(ii) .
Então é sequência de estimadores consistente de . Esse resultado é consequência direto do fato de que e da desigualdade de Chebyshev,
Além do mais, se fizemos , com e , temos que também é consistente.
Teorema Central do Limite
Seja variáveis aleatórias iid com média e variância . Então
Propriedades assintóticas MLE
O seguinte Teorema afirma que sob o modelo , a probabilidade de que a função de verossimilhança seja estritamente maior em tende a quando . Nesse sentido, se é suficientemente grande, nossa probabilidade de que sob aquela amostra a verossimilhança seja maior do que qualquer outro ponto é próximo a 1.
Teorema: Seja a densidade de uma amostra aleatória . Então, para cada com , vale que
Agora, vamos verificar que o MLE é um estimador consistente.
Teorema: Seja a densidade de uma amostra aleatória e fixe . Para cada e , defina Assuma que para cada , exista uma vizinhança tal que . Se não é compacto, assuma que exista um compacto tal que e . Então quase certamente.
A função é a diferença da log-verossimilhança em e o máximo que ela atinge em . Estamos assumindo que em uma vizinhança de cada ponto , a máxima verossimilhança nessa região é, em média, menor do que a verossimilhança em . Além disso, para conjuntos não compactos, fora desse compacto, queremos que em média a verossimilhança em seja maior. A dificuldade de utilizar esse teorema é verificar todas essas condições.
Assumindo a continuidade da função de verossimilhança para todo e que , também temos que MLE é um estimador consistente.
MLE para a família exponencial
Seja MLE calculado a partir de cuja distribuição tem densidade isto é, pertence à família exponencial na forma canônica. Se é um subconjunto aberto de , então
-
-
, em que é a matriz informação de Fisher.
-
é consistente para .
Normalidade assintótica para MLEs
Sob algumas hipóteses de regularidade, podemos concluir que em que é a informação de Fisher. Hipóteses:
- é consistente para .
- tem derivadas de segunda ordem contínuas com respeito a e vale o sinal de integração pode ser trocado com o de diferenciação.
- Existe uma função que para todo tem valor esperando nulo quanto e seja limite superior da diferença na segunda derivada em uma bola de raio de .
Na prática, podemos usar , visto que é desconhecido.