close Warning: Can't synchronize with repository "(default)" (/var/svn/tolp does not appear to be a Subversion repository.). Look in the Trac log for more information.

Opened 13 years ago

Last modified 13 years ago

#1387 closed defect

Probit con datos omitidos en el output — at Version 1

Reported by: Víctor de Buen Remiro Owned by: Víctor de Buen Remiro
Priority: highest Milestone: BSR extensions
Component: BSR Version: head
Severity: blocker Keywords:
Cc: Jorge, Pedro Gea, prcoco.bbvasp@…

Description (last modified by Víctor de Buen Remiro)

Es necesario introducir datos omitidos en el output de modelos probit para poder estimar modelos con datos desconocidos para los que tengamos algún tipo de información a priori, es decir, que no sabemos si el output es y[k]=1 ó y[k]=0 de forma determinista, pero sí tenemos cierta información sobre la probabilidad de que sea una cosa u otra.

Si nuestra información es una probabilidad p[k] prefijada para cada observación k tendremos un prior de Berniuilli definido como Prob { y[k] = 1 } = p[k]

En el caso de no tener una información tan precisa lo usual es utilizar un prior conjugado sobre la p[k] que para una Bernouilli resulta ser la distribución Beta(a,b). Los parámetros a y b habría que tratar de estimarlos a partir de algún modelo previo, o bien ajustarlos en base a un par de momentos (media y varianza por ejemplo), o cualquier otro tipo de información con dos grados de libertad.

En el caso de haber censura en los datos, lo que tendremos serán restricciones de desigualdad del tipo 0 <= l[k] <= p[k] <= u[k] <= 1. Habría que estudiar en este caso cuál sería el prior adecuado. Podría ser por ejemplo:

  • una Beta truncada en el intervalo [ l[k], u[k] ]
  • una Beta reescalada al intervalo [ l[k], u[k] ] , es decir, con un cambio de variable de forma que el 0 corresponda a l[k] y el 1 corresponda a u[k]
  • una Beta tal que la probabilidad del intervalo [ l[k], u[k] ] sea un valor dado muy cercano a 1. En lugar de dos grados de libertad ahora sólo quedaría uno, es decir, bastaría con dar la media por ejemplo para determinar la distribución. Esto podría llamarse censura probabilista y quizás sea la opción más sensata cuando la información a priori se basa en conocimientos no deterministas.

En BSR habría que retocar el filtro no lineal del probit o bien construir uno nuevo que permitiera añadir estos tipos de prior y otros que pudieran surgir más adelante.

Change History (1)

comment:1 Changed 13 years ago by Víctor de Buen Remiro

Description: modified (diff)
Note: See TracTickets for help on using tickets.