Regionalización de la Pobreza Multidimensional en México 2016-2022


Luis Armando García Rodríguez & Edward Dobrusin Larios

Cargando...

*Antes de comenzar a navegar es importante hacerte saber que por temas de estetica y diseño responsivo hay cuadros y graficas que no se muestran en dispositivos celulares, se recomienda navegar desde una PC para verlos correctamente. Sin embargo, no es indispensable.*

Resumen


A continuación, presento una versión corta de mi investigación titulada: Pobreza Multidimensional en ; una Metodología de Regionalización.

Esta investigación, ofrece una metodología para la regionalización de la pobreza multidimensional en México, con un enfoque que aborda la pobreza más allá de lo económico, integrando las múltiples dimensiones sociales y de derechos, que estipula la Ley General de Desarrollo Social en su Art36 y los reconoce la metodología de medición de la pobreza multidimensional del CONEVAL. Metodológicamente, se emplean técnicas de estadística multivariante y “Machine Learning” para analizar los datos, superando las limitaciones de regionalización en las metodologías revisadas en la literatura.

El objetivo del desarrollo de esta metodología es mejorar la focalización y eficacia de las políticas públicas en México, pues esta metodología es aplicable a nivel federal, estatal, e incluso municipal (si se cuentan con los datos apropiados). Por ello, la correcta aplicación de esta metodología de regionalización; contribuirá a un aumento significativo de la eficiencia en las políticas de desarrollo social, ofreciendo una perspectiva más completa y precisa de la pobreza en el país.

Leer Articulo Completo

Introducción


En 2020 México tuvo un índice de Gini de 45.4 (Banco Mundial, 2020)[1], ocupando el tercer lugar de los países de la OCDE con mayor índice de Gini. Recordemos que este índice se usa para medir la desigualdad de ingresos, cuyo valor varía entre 0 y 100 (tambien 0 y 1), donde 0 corresponde a una perfecta igualdad y 100 ( o 1) corresponde a una desigualdad perfecta. En ese sentido, el ya mencionado 45.4 obtenido en 2020, refleja un nivel de desigualdad severo y alarmante en nuestro país, el cual no podemos ignorar.

El índice de Palma, que es otra medida de desigualdad de ingresos, la cual matemáticamente es una razón entre los ingresos de los más ricos y los más pobres en una sociedad; en México 2022 fue de 2.53 (Gómez. A, 2023)[2]. Esta cifra indica que el 10% de la población más adinerada del país concentra 2.53 veces lo que tienen el 40% de la población más pobre. Lo que evidentemente es una desigualdad severa e injusta, que pesa y duele para miles de familias mexicanas que se encuentran hasta bajo en esta des equitativa distribución del ingreso, porque viven al día, en una situación económica que limita sus oportunidades y por si fuera poco, los priva de derechos que se suponen constitucionales.

No hay necesidad de explorar mas cifras para darse cuenta de que la pobreza es un problema público vigente. Es responsabilidad del estado y de los tres poderes de la federación atenderlo, pues el incremento de la pobreza no solo es injusto y perjudica la dignidad e integridad de millones de personas, sino que también fomenta una desigualdad que deteriora la unidad comunitaria y afecta el desarrollo económico del país.

Como economista, es de mi interés y a la vez, parte de la responsabilidad social de la profesión; el ayudar a mejorar la dignidad humana y las condiciones de vida en nuestro país. Es de mi interés contribuir y proponer soluciones a los problemas públicos, como lo es la pobreza. Para poder combatirla, se necesitan de políticas de desarrollo social, y para ello, primero se debe tener una correcta identificación de esta, la cual, no es homogénea en todo el país. De allí identifico la necesidad de una metodología de regionalización que pueda clasificar cada una de las entidades federativas del país en 5 niveles según los atributos particulares de la pobreza, con un enfoque que abarque su carácter multifacético y contemple todas sus dimensiones, enfocándose no solo en una cuantificación de la población empobrecida, sino en las carencias, y la intensidad con la que estas afectan a cada entidad federativa del país. En ese sentido esta investigación, se enmarca en la búsqueda teórica y estadística para comprender, cuantificar y mitigar la pobreza multidimensional en México.


Revisión de la literatura


Antecedentes


Ley General de Desarrollo Social - Art36.


La multidimensionalidad de la pobreza se expresa en el Art 36 de la Ley General de Desarrollo Social[3], que dicta:

Los lineamientos y criterios que establezca el Consejo Nacional de Evaluación de la Política de Desarrollo Social para la definición, identificación y medición de la pobreza son de aplicación obligatoria para las entidades y dependencias públicas que participen en la ejecución de los programas de desarrollo social, y deberá utilizar la información que genere el Instituto Nacional de Estadística, Geografía e Informática, independientemente de otros datos que se estime conveniente, al menos sobre los siguientes indicadores:

  1. Ingreso corriente per cápita;

  2. Rezago educativo promedio en el hogar;

  3. Acceso a los servicios de salud;

  4. Acceso a la seguridad social;

  5. Calidad y espacios de la vivienda digna y decorosa;

  6. Acceso a los servicios básicos en la vivienda digna y decorosa;

  7. Acceso a la alimentación nutritiva y de calidad;

  8. Grado de cohesión social;

  9. Grado de Accesibilidad a carretera pavimentada.

Metodología de la medición multidimensional de la pobreza.

Para cumplir con sus atribuciones establecidas en la Ley General de Desarrollo Social y conscientes de la discusión internacional en la conceptualización de la pobreza multidimensional, el CONEVAL, adopto desde 2009 un enfoque multidimensional en la metodología de medición de pobreza, cuyos lineamientos se muestran en la tercera edición de la Metodología para la medición multidimensional de la pobreza en México. [4]

Esta metodología está basada en dos perspectivas que analizan este carácter de la pobreza, que son la perspectiva de bienestar y la de derechos. La primera se basa en la premisa de que el ingreso es fundamental para la adquisición de una variedad de bienes y servicios que son indispensables para la satisfacción de las necesidades esenciales (CONEVAL,2023)[5] , mientras que la segunda considera el cumplimiento de los derechos sociales establecidos como derechos (garantías) constitucionales, y se concibe a la pobreza como una negación de estos derechos. (CONEVAL,2023)[6]



En este diagrama de árbol, el primer nivel de nodos representa la perspectiva de la pobreza; el segundo nivel, las dimensiones de la pobreza; y el tercer nivel, los indicadores que genera el CONEVAL con la información de la ENIGH para representar estas dimensiones.

De forma concreta, la definición de pobreza del CONEVAL es la siguiente:



Una persona se encuentra en situación de pobreza multidimensional cuando no tiene garantizado el ejercicio de al menos uno de sus derechos para el desarrollo social, y sus ingresos son insuficientes para adquirir los bienes y servicios que requiere para satisfacer sus necesidades. (CONEVAL)[7]

Y de manera específica, el CONEVAL identifica a un individuo, en alguna de las siguientes clasificaciones:

*Haz click en las tarjetas para ver la definición*

Pobreza extrema
Aquellas personas cuyo ingreso es menor a la línea de pobreza extrema por ingresos y que presentan 3 o más carencias.

Pobreza moderada
Aquellas personas cuyo ingreso es menor a la línea de pobreza por ingresos y que presentan 1 o 2 carencias.

Vulnerable por carencia social
Aquellas personas cuyo ingreso es mayor a la línea de pobreza por ingresos y que presentan 1 o más carencias.

Vulnerable por ingreso
Aquellas personas cuyo ingreso es menor a la línea de pobreza por ingresos y que no presentan carencias.

No pobres y no vulnerables sin carencias
Aquellas personas cuyo ingreso es mayor a la línea de pobreza por ingresos y que no presentan carencias.


Lo anterior puede visualizarse de manera grafica en la siguiente recreación de la dispositiva de la presentación del resumen ejecutivo de la medición de la pobreza en 2022.

CONEVALVIDEO (2023, agosto 10)[8]

Investigaciones previas relacionadas


Regionalización de la pobreza y pobreza extrema en México 2008-2018[9]


Este estudio de Islas Ochoa y Torres Busqueño, publicado en "Tiempo Económico" de la Universidad Autónoma Metropolitana, nos da un análisis detallado de las tendencias de la pobreza en México, utilizando una metodología de regionalización. Los autores emplean datos del CONEVAL para examinar las tasas de pobreza y pobreza extrema a nivel nacional y regional, señalando cómo estas han evolucionado entre 2008 y 2018. La regionalización se basa en la división geoeconómica propuesta por Ángel Bassols Batalla en 1967. Esta metodología divide al país en siete regiones definidas: Centro, Golfo de México, Norte, Pacífico Norte, Pacífico Central, Sureste y Península de Yucatán.

La investigación resalta la heterogeneidad en la intensidad y características de la pobreza entre las regiones, que sugiere la necesidad de políticas diferenciadas y focalizadas para combatir eficazmente estos problemas.

Las conclusiones del estudio señalan que, a pesar de los esfuerzos nacionales, la pobreza sigue siendo una cuestión arraigada y regionalmente diversa en México. Se subrayan la importancia de desarrollar estrategias de política pública que no solo se enfoquen en reducir las cifras generales de pobreza, sino que también reconozcan y aborden las particularidades regionales.




La pobreza en México y sus regiones: un análisis de impacto del programa Oportunidades en el periodo 2002-2006[10]


La investigación de Joaquín Bracamontes-Nevarez y Mario Camberos-Castro, se centra en medir la pobreza en México utilizando un enfoque monetario y el método de líneas de pobreza. Para la regionalización se consideran las cuatro regiones migratorias establecidas por el Consejo Nacional de Población. El Conapo divide el territorio del país en cuatro grandes regiones migratorias y agrupa a las entidades federativas por la cercanía geográfica y su tradición en cuanto a intensidad migratoria. Dentro de la metodología se emplean técnicas de micro simulación estática para evaluar el impacto de las transferencias monetarias del programa Oportunidades en la reducción de la pobreza, particularmente en la región Sur-Sureste. Los autores identificaron resultados poco exitosos del programa en la disminución de la pobreza, lo que cuestiona la eficiencia de Oportunidades debido a recursos insuficientes y errores de focalización.

El estudio utiliza datos de la Encuesta Nacional de Ingresos y Gastos de los Hogares (2002 y 2006) para evaluar la pobreza desde varias perspectivas. Inicialmente, adopta el enfoque monetario, centrándose en los ingresos y gastos para medir la pobreza, y luego aborda el enfoque multidimensional.

El estudio aplica el método de líneas de pobreza desarrollado por Amartya Sen, que compara el ingreso corriente de los hogares con una línea de pobreza especificada para identificar a los hogares pobres. Además, detalla cómo se utilizan los índices de pobreza global y estandarizado para medir la proporción y la intensidad de la pobreza en diferentes entidades y regiones. La micro simulación estática, una técnica crucial en su análisis, que permite evaluar los efectos de las políticas fiscales y sociales en la calidad de vida, calculando el ingreso disponible para cada hogar en una muestra representativa y simulando cambios en la política.

Los autores concluyen que las transferencias monetarias del programa Oportunidades han tenido un impacto limitado en la reducción de la pobreza, especialmente en el Sur-Sureste de México. Sugieren que los recursos insuficientes y los errores de focalización son factores clave detrás de este impacto reducido. Además, resaltan la importancia de considerar la diversidad regional en el diseño de políticas públicas para combatir la pobreza de manera más efectiva.


Una propuesta para el análisis regional de la pobreza en México[11]


En este estudio de Marco Antonio Pérez Méndez se analizar la pobreza en México desde una perspectiva regional. El autor propone una regionalización homogénea de la Tasa de Pobreza por entidad federativa, empleando el algoritmo Max-P para identificar el óptimo entre pobreza y desigualdad. Este enfoque busca identificar la pobreza y cómo esta se manifiesta en términos regionales debido al crecimiento económico y la desigualdad.

La metodología de regionalización se basa en la identificación de sendas regionales diferenciadas que explican la relación triangular entre pobreza, crecimiento y desigualdad de ingresos. El algoritmo Max-P permite identificar regiones homogéneas en términos de estas variables, optimizando la relación entre pobreza y desigualdad y asegurando que cada región satisface un umbral mínimo predefinido por un atributo espacialmente extensivo.

Pérez Méndez realiza un análisis de las tasas de pobreza a nivel nacional y regional, considerando la evolución económica del país y las variaciones en las distribuciones de ingreso. Resalta cómo, a pesar de ciertas reducciones en las tasas de pobreza antes de la crisis económica de 2008, las tendencias se invirtieron durante y después de la crisis, llevando a una década perdida en términos de reducción de la pobreza y distribución del ingreso.

El estudio concluye que las transferencias monetarias y otras políticas implementadas hasta la fecha han tenido un impacto limitado en la reducción de la pobreza, especialmente en el sur-sureste de México, donde las tasas de pobreza son más altas. La investigación resalta la importancia de adoptar un enfoque regionalizado en el diseño de políticas públicas para combatir la pobreza de manera más efectiva, considerando las diferencias significativas en las condiciones económicas, sociales y culturales entre las regiones.


Metodología



Diseño de Investigación



La presente investigación utiliza un diseño cuantitativo, longitudinal descriptivo y correlacional. Es correlacional, porque analiza las relaciones entre diversas variables reflejos de la pobreza, buscando entender cómo estas se relacionan y cómo el tenerlas a todas en cuenta puede dar lugar a una regionalización multidimensional de la pobreza. Es descriptiva, ya que con esta información busca detallar la pobreza y sus carencias de forma regional en el país, para mejorar en la formulación de políticas públicas.

Metodológicamente es un enfoque mixto que combina técnicas de estadística multivariante y de “Machine Learning” para procesar y analizar datos de este fenómeno multidimensional. Este enfoque permite abordar la complejidad y la naturaleza de la pobreza, no solo desde un punto de vista económico sino también considerando las diversas dimensiones sociales y de derechos.


Recopilación de datos


La metodología de análisis requiere de la estipulación de un año base, este será aquel año con el que se comparará el dinamismo de la pobreza multidimensional en años posteriores, y por su puesto este debe actualizarse constantemente, óptimamente, una vez cada seis años; pues puede ser también una forma de evaluar los resultados en el combate a la pobreza de cada sexenio.

En este ejemplo de aplicación se utiliza como año base 2016, y se hacen 3 comparaciones con esta base, que serán los años 2018, 2020 y 2022.

Las bases de datos empleadas para este análisis se obtuvieron de los de los Programas de cálculo y bases de datos[12] que el CONEVAL pone a disposición de la población cada 2 años. Y corresponden específicamente a los archivos pobreza_16.csv, pobreza_18.csv, pobreza_20.csv, y pobreza_22.csv, los cuales, para un acceso más sencillo, fueron cargados en el repositorio de GitHub de la investigación.

Las variables que fueron seleccionadas para el estudio son las que reflejan la multidimensionalidad de la pobreza según lo estipulado en el Artículo 36 de la LGDS (Ley General de Desarrollo Social). Estas son:


  • plp_e: Población por debajo de la línea de pobreza extrema por ingresos
  • plp: Población por debajo de la línea de pobreza por ingresos
  • ic_rezedu: Indicador de carencia por rezago educativo
  • ic_asalud: Indicador de carencia por acceso a los servicios de salud
  • ic_segsoc: Indicador de carencia por acceso a la seguridad social
  • ic_cv: Indicador de carencia por calidad y espacios de la vivienda digna y decorosa
  • ic_sbv: Indicador de carencia por acceso a servicios básicos en la vivienda
  • ic_ali: Indicador de carencia por acceso a la alimentación
  • ic_ali_nc: Indicador de carencia por acceso a la alimentación nutritiva y de calidad

Estas reflejan tanto la perspectiva de bienestar económico como la de derechos sociales. Además, se incluyó la variable ent, que nos indica la entidad federativa a la que corresponde cada observación.


Instrumentos y herramientas


Para la limpieza, transformación, manipulación, y modelado de los datos se usó el lenguaje de programación Python. Y se usaron las siguientes librerías: numpy, pandas, sklearn, geopandas. plotly, matplotlib, pandas. plotting, factor_analyzer.


Procedimientos


Carga de datos


Inicialmente, cargaron las bases de datos originales desde el repositorio de la investigación a un dataframe correspondiente a cada año (2016, 2018, 2020, 2022). Posteriormente se revisaron las respectivas dimensiones de cada base, es decir, el número de variables y observaciones para cada año. Dicha información se expresa en el siguiente cuadro:

*Por diseño responsivo, los cuadros no podrán ser visualizados en dispositivos celulares. Se recomienda navegar en la pagina desde una PC*

Año Variables Observaciones
2016 10 257658
2018 10 269065
2020 10 315619
2022 10 269065

También se revisaron las observaciones por entidad federativa en cada año.


Estados Obs_16 Obs_18 Obs_20 Obs_22
Aguascalientes 9302 9017 10040 9017
Baja California 12435 11413 13917 11413
Baja California Sur 7526 7756 8875 7756
Campeche 6385 6799 7781 6799
Coahuila 12023 11582 13692 11582
Colima 9196 9265 10611 9265
Chiapas 7383 7207 8275 7207
Chihuahua 10582 12517 15009 12517
CDMX 5710 7462 9035 7462
Durango 7462 8440 10113 8440
Guanajuato 9664 10539 11894 10539
Guerrero 6183 7261 9253 7261
Hidalgo 6944 6721 7819 6721
Jalisco 7621 7760 9976 7760
EDOMEX 11050 10982 13643 10982
Michoacán 7080 6720 7483 6720
Morelos 7516 7225 8737 7225
Nayarit 6607 6052 6979 6052
Nuevo León 10548 10446 11991 10446
Oaxaca 7067 8139 9516 8139
Puebla 8023 7136 8142 7136
Querátaro 8299 11678 13835 11678
Quintana Roo 6185 6065 7533 6065
San Luis Potosí 6338 8021 9342 8021
Sinaloa 10755 10229 11883 10229
Sonora 7844 7216 8135 7216
Tabasco 6456 6479 7312 6479
Tamaulipas 6358 6383 7754 6383
Tlaxcala 6800 7195 8490 7195
Veracruz 6309 8231 9366 8231
Yucatán 8997 9164 10305 9164
Zacatecas 6999 7956 8858 7956


Para identificar el tipo de variables con las que se está trabajando, es importante realizar una inspección de los valores únicos de los datos. Tras esta inspección se identificó que todas las variables de las cuatro bases son dicotómicas, es decir, que toman valores 0 o 1. 0 en ausencia de algún atributo o carencia, y 1 en presencia de este.

También se inspeccionó la existencia de datos faltantes (NA), en el conjunto de datos. Los datos faltantes encontrados se resumen en la siguiente tabla:

*Por diseño responsivo, los cuadros no podrán ser visualizados en dispositivos celulares. Se recomienda navegar en la pagina desde una PC*

Variable 2016 2018 2020 2022
ent 0 0 0 0
plp_e 0 0 0 0
plp 0 0 0 0
ic_rezedu 0 0 1 0
ic_asalud 0 0 0 0
ic_segsoc 0 0 0 0
ic_cv 11 8 24 8
ic_sbv 0 1 0 1
ic_ali 0 0 0 0
ic_ali_nc 0 0 0 0

Al revisar los datos faltantes y compararlos con el numero de observaciones en total, podemos notar que estas son muy pocas, por lo que, de imputarlas, el resultado no seria significativamente distinto, por lo que se procederá a eliminar las observaciones con datos faltantes.

Para este análisis es necesario trabajar con variables cuantitativas, por lo que se requiere de una transformación de datos en proporciones.

Por ejemplo, al contar las observaciones totales de la variable plp en la Base16, estas son iguales a 257658, y sí contamos las observaciones de la misma base y variable, cuyo valor fuese iguale a 1, esta cifra es de 126502. Con ambas cifras podríamos obtener una proporción de población que presenta plp, lo que se podría interpretar como la proporción de la población por debajo de la línea de pobreza por ingresos, que sería igual a 126502/257658 = 0.4909 = 49%. Estas proporciones son las que necesitamos para llevar acabo nuestro análisis, por lo que se procede a obtener estas proporciones, pero segmentadas por entidad federativa en cada una de las variables de interés, y en cada una de las bases. Los resultados de dicha transformación de variables dicotómicas discretas a continuas, asi como los cuadros anteriores y otra informacion relevante se pueden consultar en el repositorio de la investigación , y estan disponibles en formato Excel(.xlsx) para su propio analisis.


Análisis estadístico descriptivo


Una vez superada la transformación de datos dicotómicos a continuos, prosigue realizar un análisis exploratorio de las bases transformadas. El análisis, estadísticas y graficas detalladas pueden consultarse a continuación, mientras que mas abajo se presenta la interpretación de dicho análisis exploratorio de datos.



Analizando las estadísticas, se identifica que, de forma general, los indicadores de la pobreza multidimensional tuvieron una tendencia a la baja de 2016 a 2018, lo que se interpreta como una disminución de la pobreza multidimensional en dichos años. Desafortunadamente y a causa de la terrible situación de pandemia que sufrió nuestro país al igual que el resto del mundo en 2020, esta rompió con la tendencia, pues la mayoría de los indicadores no mostraron variaciones significativas, a excepción del ic_asalud, que evidentemente por la situación pandémica sufrió un alza que hizo pasar el promedio nacional de esta carencia de 14% en 2018 a 26% en 2020, un aumento del 12% lo cual es muy significativo.

En los gráficos, identificamos que en este periodo de 2016 a 2022, la estructura de los datos se ha mantenido prácticamente igual, sin mucha variación en sus distribuciones, y asociaciones lineales. A continuación, nos enfocarnos a describir un poco de esta estructura de datos.

Se identifico que variables como plp_e, ic_rezedu, ic_asalud, ic_cv, ic_sbv, ic_ali y ic_ali_nc tienen distribuciones apuntaladas y sesgadas, cargadas a la izquierda, lo que indica que la mayoría de los estados tienen proporciones menores al 30% en estos indicadores. Encontramos distribuciones con un comportamiento distinto, como el de ic_segsoc que es mucho más normal, lo que apunta que a nivel nacional, la mayoría de los estados tiene una proporción de esta carencia en alrededor del 50%, con una desviación estándar del 14%. Otra distribución particular es la de plp, la cual es una distribución bimodal, que tiene dos medias, que en promedio se centran en un valor de 48-49% con una desviación estándar del 13%, cabe señalar también que la correlación entre ambas en los cuatro años es muy cercana al 0.90, lo indica que están altamente coleccionadas. Al igual que esta variable, existen más correlaciones importantes en el tiempo, como los es el caso de ic_segsoc y ic_cv y ic_sbv, que rondan entre el 0.90 y 0.80 respectivamente, lo que podría indicar de que aquellos que carecen de seguridad social, también carecen de servicios de vivienda y calidad de esta. ic_rezedu, también presenta una correlación cercana al 0.70 con ic_sbv, lo que también induce a la idea de que una parte de quienes carecen de servicios básicos de la vivienda, también tienen rezago educativo. Esta última también presenta una correlación estable en el tiempo con ic_ali en alrededor de 0.60, lo que lleva a la misma idea de que quienes padecen de servicios básicos de vivienda, también tiene carencia por alimentación, solo que en menor intensidad.

Una vez realizado el análisis estadístico descriptivo, procedemos a la parte inferencial. Para la metodología de regionalización, se implementan dos modelos de análisis de datos. El primero es un análisis Factorial de componentes principales, mientras es segundo es un análisis de clúster con las puntuaciones factoriales del análisis factorial.


Análisis Factorial


El Análisis Factorial, es un método de estadística multivariante, cuyo propósito es definir la estructura subyacente de una matriz de datos. Aborda el problema del análisis de las correlaciones entre un gran numero de variables con la definición de una serie de dimensiones subyacentes comunes, conocidas como factores. El análisis factorial permite identificar las dimensiones separadas de una estructura y posteriormente determinar el grado en el que se justifica cada variable por cada dimensión. Una vez determinadas estas dimensiones subyacentes, y la explicación de cada variable, se logran cosas: el resumen y la reducción de datos y dimensiones. (Hair, J. F.,1999)[13] Es decir, el análisis factorial permite obtener dimensiones subyacentes de una matriz de datos, que cuando son entendidas e interpretadas, permiten describir los datos con un numero menor de conceptos que las variables individuales originales. Se puede obtener esta reducción de datos al calcular las puntuaciones factoriales para cada dimensión subyacente y sustituir estas por las variables originales.

Para obtener las puntuaciones factoriales se necesita de la matriz de cargas, esta matriz muestra la relación entre cada variable observada y los factores subyacentes o no observados identificados durante el análisis. Cada elemento de esta matriz representa la carga factorial, que es el coeficiente que indica cuánto de la varianza en una variable observada es explicada por un factor.

Es decir, la matriz de cargas dice que tan fuertemente asociada esta cada variable observada con cada factor. Lo que permite interpretar las puntuaciones factoriales, al saber el peso de todas las variables observadas en los factores latentes no observados.

Existen distintos métodos para estimar la matriz de cargas, en este caso, se implementa el análisis Factorial de componentes principales, que está basado en la descomposición espectral de la matriz de correlaciones, a través de los valores y vectores propios, y transformaciones a partir de los mismos. Dada la extencion de dicha estimacion de la matriz de cargas, esta no se presentara detalladamente aqui. Sin emabargo puede consultarse en la version completa del articulo de investigacion. Aqui, siemplemente mostraremos la matriz de cargas para 2016 (LM16 = Loading Matrix 16) obtenidad tras la estimacion, la cual se presenta a continuacion.



La coloración de la matriz proporciona una representación visual de la fuerza y de las asociaciones y los pesos de los factores: los tonos más oscuros indican las cargas más fuertes, mientras que los mas claros, son la mas débiles.
Se identifican asociaciones muy importantes de plp_e, plp, ic_rezedu,ic_segsoc, ic_cv, ic_sbv en el primer factor; ic_ali y ic_ali_nc en el segundo; y de ic_asalud en el tercero.

Las cargas factoriales tiene mayormente signo negativo, lo que implica que al calcular las puntuaciones factoriales (que son el producto punto de los vectores fila de la matriz original estandarizada por el vector columna de la matriz de cargas respectiva a cada factor) estas se interpretaran de la siguiente forma:
A mayor valor en las variables originales, mas negativa será la puntuación de estas en los tres factores, indicando así, que los estados con puntuaciones más pequeñas (más negativas) serán los que mayor presencia de pobreza multidimensional presentan. Mientras que los de mayores puntuaciones (menos negativas) serán los menos afectados. Es decir, mientras mas negativa sea una puntuación factorial, más pobre multidimensionalmente será el respectivo estado en el respectivo factor.


Gracias a el análisis factorial, las puntuaciones factoriales pueden interpretarse como un rango de la pobreza multidimensional, ya que al ser el producto punto de los vectores fila de la matriz original y los vectores columna de la matriz de cargas; las puntuaciones factoriales son combinaciones lineales de todas las variables reflejos de la multidimensionalidad de la pobreza estipulada en la LGDS y su Art.36.

Utilizando la matriz de cargas de 2016, se calculan las puntuaciones factoriales para 2018, 2020, y 2022, esto con la finalidad, de que las puntuaciones sean comparables entre sí.

Las puntuaciones factoriales para cada año, se presentan a continuación:


Análisis de Cluster


El análisis de cluster es una de técnica de estadistica multivarainte cuyo principal propósito es el de agrupar objetos, basándose en las características que estos poseen. El análisis de cluster clasifica objetos de tal forma que cada objeto es muy parecido a los que existen en el mismo conglomerado respecto a algún criterio de selección determinado. Los conglomerados de objetos resultantes de este análisis deben ser homogéneos internamente (dentro del conglomerado) y heterogéneos externamente (con los otros conglomerados). (Hair, J. F.,1999)[13]

Para este análisis, se utiliza un algoritmo de cluster de "Machine Learning" no supervisado, llamado K-Means.

En este algoritmo, se eligen K puntos al azar como los centros iniciales de los grupos, a estos se les denomina centroides. Posteriormente, cada punto del conjunto de datos se asigna al grupo cuyo centroide es el más cercano. Esto utilizando alguna medida de distancia, que en este caso será la distancia euclídea.

Una vez todos los puntos han sido asignados a un grupo, se recalculan los centroides de cada grupo usando usando de la media de las observaciones de dicho grupo. Estos pasos se repiten hasta que se cumpla un criterio de detención. Este criterio puede ser un número fijo de iteraciones, que en este caso es de 100.

El objetivo del K-Means es minimizar la suma de las distancias cuadradas de cada punto a su centroide, lo cual es conocido como la inercia o la varianza dentro del grupo. Nuevamente por extension, no detallamos el proceso, sin embargo este puede consultarse en el articulo completo.

Los criterios que se emplean para este cluster, serán las puntuaciones factoriales en los tres factores obtenidos del análisis factorial. Esto para cada año de estudio. Y los grupos a formar serán 5, esto es un criterio a priori y por elección propia.

A continuación se muestran los resultados del cluster y sus proyecciones.

Cluster de la pobreza multidimensional en México 2016

Como puede visualizarse en los gráficos anteriores, se clasificaron las entidades federativas de la república en 5 grupos, cada uno identificado con un color y un numero. Donde 1 es el grupo de los estados menos pobres multidimensionalmente y 5 es el de los estados con mayor pobreza multidimensional. En los gráficos y las dispersión de los factores puede observarse como la mayoría de los grupos son homogéneos internamente, entre sus miembros, y son heterogéneos con los demás grupos.
Sin embargo también existen casos como los de los grupos 4, y 5. Donde el grupo 4 esta únicamente conformado por el estado de Tabasco, cuyas proyecciones factoriales fueron tan heterogéneas al resto de estados que el algoritmo le asignó un cluster propio y único. El caso del grupo 5, también es bastante particular, porque gráficamente se ve como difiere de los demás grupos e incluso es medianamente heterogéneo entre los miembros del cluster. Y además, es el cluster con mayor pobreza multidimensional.


Resultados



Regionalizaciones

Concluidos los procesos de análisis de datos que incluyeron un modelo de análisis factorial con componentes principales y otro de cluster con k-means, se obtuvieron las regionalizaciones de la pobreza multidimensional para cada año estudiado.

Los resultados de dicha regionalización se muestran a continuación.

Regionalización de la pobreza multidimensional en México 2016

Tras las visualizaciones, se observa como aunque hay contigüidad geográfica, esta no es perfecta, lo que demuestra la importancia de que el criterio de regionalizacion este enfocada plenamente en la pobreza multidimensional y como este criterio puede mejorar la focalización de políticas publicas y de desarrollo social, mejor que una regionalización geográfica a priori.

Las clasificaciones de los estados en clusters y su evolución en el tiempo, se resumen en el siguiente gráfico.



Se observa que la mayoría de los estados se mantuvieron en su cluster inicial en el intervalo de los 6 años estudiados, siendo Colima, Morelos, Nayarit, Quintana Roo, Tlaxcala y Veracruz, los únicos que se movieron.





Una vez clasificado cada estado en un cluster, se pueden obtener estadísticas descriptivas más acertadas y menos sesgadas, debido a la homogeneidad entre los grupos formados. Un ejemplo de ello, se muestra en los siguientes gráficos, donde se obtiene la media por variable de cada cluster. Esto, proporciona una visualización de como la pobreza multidimensional se manifiesta de distinta forma en cada cluster/región, donde las carencias e intensidades entre los grupos formados difiere significativamente, ayudando a identificar los problemas de pobreza en cada una de las dimensiones, y como estas afectan a cada grupo, y como han evolucionado en el tiempo; proporcionando más y mejor información, para una focalización precisa y efectiva de las políticas publicas y de desarrollo social.



Media por variable para cada cluster en 2016

*Por diseño responsivo, los cuadros y graficas no podrán ser visualizados en dispositivos celulares. Se recomienda navegar en la pagina desde una PC*


Variable Clst1 Clst2 Clst3 Clst4 Clst5
plp_e 0.08 0.14 0.18 0.19 0.40
plp 0.39 0.51 0.59 0.58 0.75
ic_rezedu 0.17 0.19 0.23 0.18 0.29
ic_asalud 0.14 0.13 0.16 0.13 0.15
ic_segsoc 0.43 0.59 0.66 0.64 0.80
ic_cv 0.09 0.11 0.16 0.12 0.28
ic_sbv 0.12 0.19 0.33 0.51 0.57
ic_ali 0.18 0.19 0.24 0.46 0.26
ic_ali_nc 0.19 0.21 0.27 0.48 0.29




Media por variable para cada cluster en 2018

*Por diseño responsivo, los cuadros y graficas no podrán ser visualizados en dispositivos celulares. Se recomienda navegar en la pagina desde una PC*


Variable Clst1 Clst2 Clst3 Clst4 Clst5
plp_e 0.08 0.14 0.16 0.19 0.36
plp 0.39 0.50 0.58 0.58 0.73
ic_rezedu 0.17 0.19 0.22 0.18 0.28
ic_asalud 0.14 0.13 0.15 0.13 0.16
ic_segsoc 0.43 0.58 0.65 0.64 0.78
ic_cv 0.09 0.11 0.15 0.12 0.25
ic_sbv 0.12 0.19 0.30 0.51 0.53
ic_ali 0.18 0.19 0.23 0.46 0.25
ic_ali_nc 0.19 0.21 0.26 0.48 0.28




Media por variable para cada cluster en 2020

*Por diseño responsivo, los cuadros y graficas no podrán ser visualizados en dispositivos celulares. Se recomienda navegar en la pagina desde una PC*


Variable Clst1 Clst2 Clst3 Clst4 Clst5
plp_e 0.08 0.16 0.17 0.19 0.40
plp 0.39 0.54 0.58 0.58 0.75
ic_rezedu 0.18 0.21 0.21 0.18 0.29
ic_asalud 0.14 0.11 0.15 0.13 0.15
ic_segsoc 0.45 0.60 0.64 0.64 0.80
ic_cv 0.09 0.08 0.15 0.12 0.28
ic_sbv 0.13 0.20 0.29 0.51 0.57
ic_ali 0.18 0.18 0.22 0.46 0.26
ic_ali_nc 0.19 0.20 0.25 0.48 0.29




Media por variable para cada cluster en 2022

*Por diseño responsivo, los cuadros y graficas no podrán ser visualizados en dispositivos celulares. Se recomienda navegar en la pagina desde una PC*


Variable Clst1 Clst2 Clst3 Clst4 Clst5
plp_e 0.08 0.14 0.16 0.19 0.36
plp 0.39 0.50 0.58 0.58 0.73
ic_rezedu 0.17 0.19 0.22 0.18 0.28
ic_asalud 0.14 0.13 0.15 0.13 0.16
ic_segsoc 0.43 0.58 0.65 0.64 0.78
ic_cv 0.09 0.11 0.15 0.12 0.25
ic_sbv 0.12 0.19 0.30 0.51 0.53
ic_ali 0.18 0.19 0.23 0.46 0.25
ic_ali_nc 0.19 0.21 0.26 0.48 0.28



Discusión



Dentro de los resultados se puede observar la movilidad social de Colima, Morelos, Nayarit, Quintana Roo, Tlaxcala y Veracruz.Los años donde se aprecian cambios en la mayoría de estos estados fueron 2020 y 2022, siendo Morelos la excepción moviéndose en 2018 para luego mantenerse constante. Según los cambios en la región, los estados se dividen en dos grupos:

1. Aquellos que se catalogan en una región menos pobre para 2020, en relación al 2018, para luego volver a la región donde estaban para el 2022: Colima, Nayarit y Veracruz.

2. Los que se movieron en sentido opuesto, es decir, se catalogan en una región más pobre para 2020, en relación al 2018, para luego volver a la región donde estaban para el 2022: Quintana y Tlaxcala.

La presencia de una movilidad social positiva o negativa puede deberse a distintos factores, tanto internos como externos. Analizando el caso de ambos grupos mencionados anteriormente se plantean las posibles causas:

En el año 2020, debido a la pandemia, los estados más afectados fueron los que se dedicaban al turismo, siendo uno de ellos Quintana Roo. En cambio, Colima, Nayarit y Veracruz, con su condición de puertos, continuaron con sus actividades comerciales aún en el 2020.

Durante el año 2022 Quintana Roo pudo retomar sus actividades turísticas y este estado, al igual que el resto del sureste, se vio favorecido por la inversión pública en la región.

A diferencia de los estudios antes mencionados sobre regionalización de la pobreza, áreas geográficamente separadas no eran comúnmente asociadas; por ejemplo: Colima, Nayarit y Veracruz.


Conclusiones



En esta investigación, se ha propuesto una forma de integrar las diversas dimensiones de la pobreza en un modelo de regionalización multidimensional. Dicho modelo consiste en la obtención de proporciones por entidad federativa de cada uno de los indicadores que usa el CONEVAL estipulados en su metodología de medición de la pobreza multidimensional, para posteriormente resumir y reducir las dimensiones de dichos datos a través de un análisis factorial, con la cual se obtienen puntuaciones factoriales para un posterior análisis de cluster, el cual permite clasificar entidades federativas según la similitud entre su grado de pobreza multidimensional, obteniendo así una regionalización no basada en la contigüidad geográfica, sino en la similitud e intensidad de la pobreza multidimensional que cada una padece.

Para dichos procesos, la estadística multivariante y los algoritmos de aprendizaje automático o machine learning son fundamentales, pues estos hacen posible el correcto tratamiento de la multidimesnionalidad y son capaces de capturar y procesar información que sin algoritmos computacionales seria muy difícil de desentrañar.

La metodología de regionalización propuesta, tiene potencial para mejorar la formulación, evaluación y ejecución de la política pública y de desarrollo social, ya que permite identificar correctamente las carencias de cada entidad federativa y agruparlas en similitudes para ofrecer una mejor focalización de la pobreza. Además, esta metodología es perfectamente micro escalable, y puede aplicarse a estados, alcaldías, localidades e incluso municipios siempre y cuando se cuente con la información y los datos necesarios. Además, no es únicamente en temas de pobreza esta aplicación, pues la metodología en realidad puede adaptarse a medir otros fenómenos de carácter multidimensional como los pueden ser la economía en su conjunto y sus interacciones y la seguridad publica.

En resumen, la presente investigación ha destacado la importancia de la metodología de la medición multidimensional de la pobreza, al mismo tiempo que ha propuesto la regionalización de la pobreza multidimensional en México, como una metodología que combina estadística multivariante y métodos computacionales, y que puede ser complementaria a la actual del CONEVAL. Se identificaron clústeres de entidades federativas con características similares en términos de pobreza multidimensional, lo que es una herramienta útil para diseñar y ejecutar políticas públicas y sociales más efectivas y focalizadas.

Esta metodología desde luego necesita de datos actualizados y de alta calidad, pero puede mejorar la eficiencia y efectividad de los programas dedicados al combate a la pobreza en el país. Esta aportación metodológica puede significar una comprensión más integral, y una guía para el micro-escalamiento de la técnica, lo que puede resultar en una intervención gubernamental y de políticas públicas que junto con la metodología actual, pueden hacer estas más eficientes, para combatir esta problemática compleja y multidimensional.