id	summary	reporter	owner	description	type	status	priority	milestone	component	version	severity	resolution	keywords	cc
1387	Probit con datos omitidos en el output	Víctor de Buen Remiro	Víctor de Buen Remiro	"Es necesario introducir datos omitidos en el output de modelos probit para poder estimar modelos con datos desconocidos para los que tengamos algún tipo de información a priori, es decir, que no sabemos si el output es {{{y[k]=1}}} ó {{{y[k]=0}}} de forma determinista, pero sí tenemos cierta información sobre la probabilidad de que sea una cosa u otra.

Si nuestra información es una probabilidad {{{p[k]}}} prefijada para cada observación {{{k}}} tendremos un prior de Berniuilli definido como {{{ Prob { y[k] = 1 } = p[k] }}}

En el caso de no tener una información tan precisa lo usual es utilizar un [http://en.wikipedia.org/wiki/Conjugate_prior#Discrete_likelihood_distributions prior conjugado] sobre la {{{p[k]}}} que para una Bernouilli resulta ser la distribución [http://en.wikipedia.org/wiki/Beta_distribution Beta(a,b)]. Los parámetros {{{a}}} y {{{b}}} habría que tratar de estimarlos a partir de algún modelo previo, o bien ajustarlos en base a un par de momentos (media y varianza por ejemplo), o cualquier otro tipo de información con dos grados de libertad.

En el caso de haber censura en los datos, lo que tendremos serán restricciones de desigualdad del tipo {{{ 0 <= l[k] <= p[k] <= u[k] <= 1}}}. Habría que estudiar en este caso cuál sería el prior adecuado. Podría ser por ejemplo:

 * una Beta truncada en el intervalo {{{ [ l[k], u[k] ] }}}
 * una Beta reescalada al intervalo {{{ [ l[k], u[k] ] }}}, es decir, con un cambio de variable de forma que el {{{0}}} corresponda a {{{l[k]}}} y el {{{1}}} corresponda a {{{u[k]}}} 
 * una Beta tal que la probabilidad del intervalo {{{ [ l[k], u[k] ] }}} sea un valor dado muy cercano a 1. En lugar de dos grados de libertad ahora sólo quedaría uno, es decir, bastaría con dar la media por ejemplo para determinar la distribución. Esto podría llamarse censura probabilista y quizás sea la opción más sensata cuando la información a priori se basa en conocimientos no deterministas.

En BSR habría que retocar el filtro no lineal del probit o bien construir uno nuevo que permitiera añadir estos tipos de prior y otros que pudieran surgir más adelante.


"	defect	new	highest	BSR extensions	BSR	head	blocker			Jorge Pedro Gea prcoco.bbvasp@…