Introdução a grandes amostras

Agora, vamos verificar algumas propriedades assintóticas, isto é, quando o número de amostras é muito grande, com .

Conceitos de convergência

Uma lista de conceitos de convergência importantes. Em particular, o conceito de consistência é importante para estimadores, dado que gostaríamos que, com amostras suficientes, tivéssemos valores razoáveis para o parâmetro.

  1. Determinística: Seja uma sequência em um espaço normado e uma sequência de reais. Se para cada , existe suficientemente grande tal que para , dizemos que . Se existe tal que a desigualdade anterior valha para grande, então dizemos que .

  2. Estocástica: Seja uma sequência de variáveis aleatórias definidas em espaços normados e uma sequência de reais. Se para cada e , existe tal que para , dizemos que . Se para cada , existe tal que a desigualdade anterior valha para grande, então dizemos que .

  3. Convergência em probabilidade: Se e são quantidades aleatórias e, para todo , vale que então dizemos que , isto é, converge em probabilidade para .

Se para uma sequência de funções mensuráveis e é uma outra quantidade aleatória, temos que se, e só se, . Em particular, se é contínua em e , então .

  1. Consistência: Sejam uma função mensurável e uma distribuição paramétrica definida em . A sequência de variáveis aleatórias é consistente para se para todo . A lei dos grandes números é um forte aliado, pois afirma que a média amostral converge em probabilidade para a média verdadeira.

  2. Convergência em distribuição: Seja uma sequência de quantidades aleatórias e uma quantidade aleatória. Se para toda função contínua limitada , dizemos que converge em distribuição para , isto é, ou . Dizemos que a distribuição de é a distribuição assintótica de . Além do mais, dizemos que a distribuição de converge fracamente para a distribuição de . Se é a função de distribuição acumulada de e é a CDF de , então sempre que é contínua em se, e somente se,

Teorema: Se , e , então

  1. Convergência quase certa: Uma sequência converge quase certamente para se .

Consistência

O exemplo clássico de consistência é o seguinte:


📝 Exemplo (Lei fraca dos grandes números)

Seja uma sequência de variáveis aleatórias independentes cuja distribuição tem densidade . Defina e . Pela lei fraca dos grandes números, temos que é uma sequência de estimadores consistente para .


Teorema: Seja uma sequência de estimadores para tal que, para todo ,

(i) ,

(ii) .

Então é sequência de estimadores consistente de . Esse resultado é consequência direto do fato de que e da desigualdade de Chebyshev,

Além do mais, se fizemos , com e , temos que também é consistente.

Teorema Central do Limite

Seja variáveis aleatórias iid com média e variância . Então

Propriedades assintóticas MLE

O seguinte Teorema afirma que sob o modelo , a probabilidade de que a função de verossimilhança seja estritamente maior em tende a quando . Nesse sentido, se é suficientemente grande, nossa probabilidade de que sob aquela amostra a verossimilhança seja maior do que qualquer outro ponto é próximo a 1.

Teorema: Seja a densidade de uma amostra aleatória . Então, para cada com , vale que

Agora, vamos verificar que o MLE é um estimador consistente.

Teorema: Seja a densidade de uma amostra aleatória e fixe . Para cada e , defina Assuma que para cada , exista uma vizinhança tal que . Se não é compacto, assuma que exista um compacto tal que e . Então quase certamente.

A função é a diferença da log-verossimilhança em e o máximo que ela atinge em . Estamos assumindo que em uma vizinhança de cada ponto , a máxima verossimilhança nessa região é, em média, menor do que a verossimilhança em . Além disso, para conjuntos não compactos, fora desse compacto, queremos que em média a verossimilhança em seja maior. A dificuldade de utilizar esse teorema é verificar todas essas condições.

Assumindo a continuidade da função de verossimilhança para todo e que , também temos que MLE é um estimador consistente.

MLE para a família exponencial

Seja MLE calculado a partir de cuja distribuição tem densidade isto é, pertence à família exponencial na forma canônica. Se é um subconjunto aberto de , então

Normalidade assintótica para MLEs

Sob algumas hipóteses de regularidade, podemos concluir que em que é a informação de Fisher. Hipóteses:

  1. é consistente para .
  2. tem derivadas de segunda ordem contínuas com respeito a e vale o sinal de integração pode ser trocado com o de diferenciação.
  3. Existe uma função que para todo tem valor esperando nulo quanto e seja limite superior da diferença na segunda derivada em uma bola de raio de .

Na prática, podemos usar , visto que é desconhecido.