Conglomerados y Discriminante
Las técnicas para buscar casos parecidos de nuestra base de datos y agruparlos son conocidas como Análisis de Conglomerados. El Análisis Discriminante se usa para estimar parámetros que permiten identificar las características de grupos ya conocidos. Ambas técnicas son muy usadas, así como los Árboles de Decisión (Chi-squared Automatic Interaction Detector – CHAID). Las tres tienen puntos de partida y procesos diferentes, pero al final tienen el mismo cometido: agrupar parecidos y separar diferentes.
Comparto la presentación usada en Estadística para el Análisis Político 2.
Pueden consultar este otro post sobre el tema. Incio prepara una sintaxis sencilla de replicar.
Apuntes de Clase: Estadística Bivariada
Comparto un cuadro resumen de la aplicación de las pruebas estadísticas bivariadas según el tipo de variable que se tenga a la mano. Espero que sea de utilidad para aquellos que están estudiando el tema o para aquellos que no están seguros si la prueba que utilizan con sus variables es la indicada. En futuros posts trataremos de replicar cada prueba en R.
Tour Guiado por la Estadística Básica

En febrero de este año el profesor Jose Manuel Magallanes y los/as que alguna vez fuimos sus asistentes de los cursos de estadística en la especialidad de Ciencia Política y Gobierno en la Facultad de Ciencias Sociales de la PUCP presentamos el libro llamado Tour Guiado por la Estadística Básica. El libro fue financiado por el Vicerrectorado Administrativo de la PUCP a través del fondo concursable 2011 y todo el material se desarrolló en menos de 6 meses.
Califico lo producido como un intento más de poner las cosas en sencillo y de manera amigable, sin complicarnos con las fórmulas estadísticas y el cálculo. No solo consta de una publicación en físico, sino que tiene material de apoyo haciendo uso de recursos web como una wiki, videos y un mapa conceptual. Todo esto con el fin de poder acceder a la teoría y ejercicios desde cual parte solo teniendo conexión a internet.
La apuesta es sin duda que la estadística deje de ser el talón de aquiles de los que estudian una carrera de Ciencias Sociales, Educación, Psicología y afines. Aprender a usar software para aplicar técnicas estadísticas básicas no debería costar tanto si uno revisa todo este material, que dicho sea de paso está abierto al público en general. Si quedaran dudas o se detectan imprecisiones pueden enviar un correo a estadistica.virtual@pucp.edu.pe.
Cabe precisar que la guía solo cubre desde estadística descriptiva hasta estadística inferencial bivariada. Lo modelos de regresión tranversal o longitudinal, así como los de reducción de dimensiones y clasificación esperamos desarrollarlos más adelante. Mientras tanto los invito a sacarle provecho a todos los recursos. Si quieren la publicación en físico pueden pasar por el CISEPA (tecer piso del Departamento de Sociales, es probable que todavía existan algunos ejemplares) caso contrario lo encuentran en las bibliotecas PUCP.
Construcción de Indicadores
Sobre creación de indicadores resumo en la siguiente presentación algunos cuantos manuales sobre el tema más una pizca de experiencia propia. La presentación hace uso de unas bases de datos las cuales los encuentran más abajo. Si se quiere indagar más al respecto recomiendo el Handbook on Constructing Composite Indicators: Methodology and User Guide.
Empezando con LAPOP, seleccionando variables.
Tengo que presentar en algunos meses un trabajo que tiene como objetivo probar algunos modelos sobre satisfacción con la democracia. Más adelante, con mayor detalle, explicaré la idea y las hipótesis principales. Para efectos de este blog, iré mostrando paso a paso como, siempre con R, llego a probar ( si lo termino) las hipótesis de este trabajo.
Primera gran pregunta ¿Cuál será mi fuente? Hasta ahora tengo claro que usaré LAPOP, y empezaré por seleccionar de la base de Perú las preguntas que me interesan. Creo que este debe ser el primer paso para empezar a trabajar,
considerando que LAPOP tienen muchas más variables de las que me interesan. Entonces los objetivos de este post son:
- Cargar la data de LAPOP Perú a R.
- Seleccionar las variables que me interesan.
- Grabar una base de datos con las variables que he seleccionado>
Vamos a usar para este post la base de datos de LAPOP Perú. Si quieres saber más sobre LAPOP y pedir la base de datos lo puedes hacer aquí

![R Cookbook [Paperback]](http://politicalranalysis.com/web/sidebar/banner_03.jpg)