¿Hay alguna diferencia entre los modelos aditivos y los modelos aditivos generalizados? http://artsandsciences.sc.edu/geog/hvri/sites/sc.edu.geog.hvri/files/attachments/SoVI%20recipe_2016.pdf


Respuesta 1:

Si.

Un modelo aditivo ajusta los datos como la suma de predictores univariados. Un modelo aditivo generalizado se ajusta a una transformación de los datos, como el logaritmo o el inverso. Para un estadístico, esto es solo una transformación de la variable dependiente, que es una técnica estándar utilizada en todo tipo de ajuste, pero tiene su propio nombre por razones históricas.

Su referencia dice agregarlos. No sé cómo podría ponerlos en un modelo de regresión, ya que no tiene una variable dependiente. Parece que está construyendo un índice en lugar de predecir algo.

Solo estoy adivinando aquí, pero el objetivo del procedimiento parece ser reducir la dimensionalidad. Tiene muchos datos del censo y desea obtener un índice de vulnerabilidad social, que luego usaría para futuras investigaciones.

La única razón para transformar el puntaje de vulnerabilidad social sería darle algunas propiedades estadísticas estandarizadas, como una distribución normal o uniforme, o tal vez hacer que su valor esperado sea igual a alguna otra medida de vulnerabilidad social para facilitar las comparaciones. Eso podría hacer que sea más conveniente usarlo en futuras investigaciones. Pero no cambiaría el contenido de la información de la medida. Cualquiera siempre podría transformar la medida en la investigación adicional.

Puede agregar un paso donde ponga pesos en los componentes individuales antes de agregarlos. Pero eso parecería derrotar el punto. Creo que lo que está sucediendo aquí es que tienes demasiadas variables para usar cada una individualmente como una variable independiente. Si tenía la información para poner pesos en cada uno para el índice, ¿por qué no usar los componentes individualmente en una regresión? Puede haber alguna razón para esto, por ejemplo, puede tener la información en un conjunto de datos para estimar los pesos, pero desea utilizar la medida en otro conjunto de datos donde no lo haga. Pero supongo que solo agregas aquí.