Teorema da Representação de De Finetti
Considere uma sequência de variáveis aleatórias indicadoras (assumem valor ou ). Em geral, assumimos que elas são independentes e identicamente distribuídas (IID), implicando em algo do tipo: Desta forma, assumindo essa propriedade e que , mesmo que eu visualizasse um milhão de variáveis sendo , eu acreditaria que a milionésima primeira ainda teria a mesma probabilidade. Logo, observar um experimento não traria informação para a moeda. Com isso, De Finetti introduziu um conceito mais fraco, o de permutabilidade. Em particular, ele demonstrou, para esse caso de variáveis binárias, que existe uma variável com distribuição tal que com . Portanto, sob a hipótese de permutabilidade, existe um parâmetro tal que esse parâmetro é uma função do limite das distribuições empíricas e, em particular, as variáveis são IID condicionadas em . Isso permite a introdução de modelos estatísticos bayesianos de uma forma natural.
Permutabilidade
Em uma análise estatística, existem diversas quantidades sobre as quais somos incertos. Por exemplo, considere uma população e uma determinada doença. A priori, não sabemos se as pessoas têm ou não a doença. E mesmo que testemos algumas das pessoas, ainda não saberemos as respostas daqueles que não foram testados. Além do mais, o próprio teste é uma quantidade incerta, visto que o seu resultado pode ser falso. Portanto, deveríamos conseguir escrever a distribuição de probabilidade conjunta de todas as variáveis de interesse. Nesse caso, elas se resumem à indicação de doença de cada indivíduo.
Outro exemplo é a de jogar uma moeda vezes. Não temos informação de que jogadas próximas tenham algum tipo de relação diferente da relação para jogadas distantes. Por esse motivo, faz sentido assumirmos que as jogadas são simétricas, e em geral, assumimos que são independentes e identicamente distribuídas, imbuindo um modelo e um parâmetro . Mas essa maquinaria pode ser simplificada para refletir a ideia de simetria que gostaríamos de atingir. Por simetria, dizemos que para toda permutação de resultados leva aos mesmos resultados. Em particular, apenas essa hipótese vai implicar que existe uma medida para que satisfaz propriedades probabilísticas que almejamos.
Permutabilidade: As variáveis aleatórias são permutáveis se toda permutação de tem a mesma distribuição conjunta. Para uma coleção infinita, essa propriedade é válida quando todo subconjunto finito é permutável.
Um resultado direto é que distribuições marginais são iguais. Além disso, a distribuição conjunta de qualquer subconjunto de variáveis de tamanho só depende de . Também podemos afirmar que IID implica permutabilidade. Todavia, a recíproca não é verdadeira. Se são (condicionalmente) IID dado , as variáveis são permutáveis, mas não IID necessariamente. De forma simples, a permutabilidade é uma hipótese fraca quando se deseja simetria entre as variáveis, e que o índice delas seja "irrelevante".
Observação: probabilidade é vista como um limite de frequências por uma grande parte dos estatísticos. Em particular, isso exige a tomada de uma quantidade infinita de variáveis, o que é impossível. O Teorema de Finetti a seguir esclarece que o limite de frequências de 1s na sequência Bernoulli, denominado é apenas uma probabilidade condicional dada informação desconhecida. Essa probabilidade tem visão subjetiva. Mesmo que o cálculo de probabilidades seja diferente, se os indivíduos assumem permutabilidade das variáveis aleatórias, então eles acreditam na existência de , de forma que condicionado em , as variáveis são IID Bernoulli().
Teorema de De Finetti
O teorema de De Finetti conecta os conceitos de permutabilidade com o de independência e distribuição idêntica condicionada em uma outra variável aleatória. Por fim, ele relaciona essa variável condicionadora com o que chamamos de parâmetro, cerne dos modelos estatísticos paramétricos.
Variáveis aleatórias Bernoulli
Considere uma sequência de variáveis aleatórias distribuídas conforme Bernoulli. A sequência é permutável se, e somente se, existe uma variável aleatória tal que é uma sequência IID Bernoulli(). Além do mais, se a sequência é permutável, a distribuição de é única e quase certamente.
Versão Finita
Suponha que são variáveis aleatórias em um espaço de Borel . Seja e para cada , seja a distribuição empírica de . As variáveis aleatórias são permutáveis se, e somente se, para toda -tupla de distintos elementos de , a distribuição conjunta de , condicionadas em é a de uma amostra aleatória simples sem reposição da distribuição . Nesse caso, tomamos amostras sem reposição de uma urna tal que cada bola tem a mesma probabilidade de ser retirada.
Versão infinita
Seja um espaço de probabilidade e um espaço de Borel. Para cada , seja mensurável. A sequência é permutável se, e somente se, existe uma medida de probabilidade aleatória em tal que, condicionada em , a sequência é IID com distribuição . Nesse caso, é única e converge para quase certamente para cada .
Alguns pontos importantes:
(1) Um espaço de Borel: Seja um espaço mensurável. Se existe uma função bimensurável (mensurável bijetiva com inversa mensurável) com Borel, então é espaço de Borel.
(2) Medida de probabilidade aleatória: Seja o conjunto de todas as medidas de probabilidade em e uma -álgebra de subconjuntos de forma que sejam mensuráveis, com . Em particular, a função é medida de probabilidade aleatória, em que é espaço de probabilidade.
Esse teorema foi estendido para sequência de variáveis aleatórias não permutáveis.
A demonstração se encontra entre as páginas 33-49 do livro de Schervish.
Links relevantes
-
Exchangeability, Correlation, and Bayes' Effect, Ben O'Neill: esse paper discute a diferença da estatística bayesiana e frequentista sobre os valores observados, relacionando com o conceito de permutabilidade.