Funções de risco
Podemos ver a inferência estatística como a arte de aprender sobre uma quantidade desconhecida a partir de dados , através de uma conexão definida a partir de um modelo probabilístico . Para estudar a performance de estimadores de , conceito introduzido em Estimação pontual, uma abordagem formalizada é a Teoria da Decisão. Aqui introduziremos esses conceitos, mas uma visão mais geral sob a ótica de Inferência Bayesiana pode ser encontra aqui.
Seja o espaço das decisões (por exemplo, uma estimativa é uma decisão) e o espaço dos parâmetros. Uma função de perda é uma função e avalia uma penalidade em tomar a decisão com respeito a . Quando , temos que mede o erro em obter por .
Sendo um estimador para (uma estatística que busca aproximá-lo), é uma variável aleatória que pode ser grande, mesmo que seja um bom estimador. Com isso, definimos a função de risco como a perda média em usar para estimar isto é, tomando a esperança quando .
📝
Exemplo (caso binomial)
Seja com conhecido. Um estimador para é . Seja a perda quadrática. Assim, a função de risco para é
A função de risco tem um problema clássico: é difícil comparar dois estimadores quaisquer, pois um pode ter risco menor em certas regiões e maior em outras.
📝
Exemplos de riscos
Para cada perda , definimos um risco . A seguir, temos alguns mais famosos.
-
Perda quadrática (): mean squared error (erro médio quadrado) ou MSE.
-
Perda absoluta (): mean absolute error (erro médio absoluto) ou MAE.
-
Perda absoluta percentual (): mean absolute percentage error (erro médio absoluto percentual) ou MAPE.
-
etc.