ANÁLISIS PREDICTIVO DE DATOS ABIERTOS PARA DETERMINAR EL CRECIMIENTO DE LA POBLACIÓN Y CONSUMO DE AGUA POTABLE EN LA REPÚBLICA MEXICANA (PREDICTIVE ANALYSIS OF OPEN DATA TO DETERMINE POPULATION GROWTH AND POTABLE WATER CONSUMPTION IN THE MEXICAN REPUBLIC)
Resumen
Se presenta el análisis exploratorio y predictivo de la base de datos del Consejo Nacional de Población (CONAPO), con la finalidad de identificar variables de interés para cuantificar el consumo de agua potable en los diferentes Estados de la República Mexicana, de acuerdo con la agenda 2030, el agua forma parte de los Objetivos del Desarrollo Sostenible (ODS) y México ha adoptado tales objetivos. Por otro lado, se requiere conocer el crecimiento poblacional de los Estados y las Ciudades, con la finalidad de establecer políticas públicas que ayuden a disminuir tanto la problemática del agua así como de la vivienda, es decir, el presente trabajo identifica la validez del aprendizaje supervisado con regresión polinomial y comparar la predicción con la base de datos abiertos: “Proyecciones de Población de Municipios de México”, con la finalidad de determinar el crecimiento poblacional de los Estados y tener información que permita estimar la cantidad de agua requerida por la población; es importante hacer notar que, aunque algunas ciudades cuentan con medidores del consumo de agua potable, no hay registros con estadísticas reales, ni tampoco históricos del consumo. Asimismo, se realiza un análisis exploratorio de la base de datos por medio del software estadístico R y se construyen diagramas de puntos del crecimiento poblacional, también, se realiza un análisis de regresión polinomial hasta el año 2010 y su análisis predictivo al año al 2070, se muestran los Estados con mayor población para cada 10 años a partir de 1970 al 2070 y se calcula el error absoluto respecto a la base de la CONAPO y el modelo de regresión cúbico para cada Estado.
Palabras Clave: Agua Potable, Análisis Exploratorio, Datos Abiertos, Regresión, Población.
Abstract
The exploratory and predictive analysis of the National Population Council (CONAPO) database is presented, with the aim of identifying variables of interest to quantify potable water consumption in the different states of the Mexican Republic. According to the 2030 Agenda, water is part of the Sustainable Development Goals (SDGs), and Mexico has adopted these objectives. Additionally, it is necessary to understand the population growth of the states and cities to establish public policies that help mitigate both water and housing issues. In other words, this work assesses the validity of supervised learning using polynomial regression and compares the predictions with the open data source: "Population Projections for Municipalities of Mexico", in order to determine the population growth of the states and obtain information that allows for estimating the amount of water required by the population. It is important to note that, although some cities have potable water consumption meters, there are no real statistics or historical records of consumption.
Additionally, an exploratory analysis of the database is conducted using the statistical software R, scatter plots of population growth are constructed, and a polynomial regression analysis is performed up to the year 2010, with a predictive analysis extending to 2070. The states with the highest populations for every 10 years from 1970 to 2070 are shown, and the absolute error is calculated in relation to the CONAPO database and the cubic regression model for each state.
Keywords: Potable Water, Exploratory Analysis, Open Data, Regression, Population.
Texto completo:
PDFReferencias
UNESCO. Agua para la prosperidad y la paz. Informe mundial de las Naciones Unidas sobre el desarrollo de los Recurso Hídricos 2024. (2024). https://agua.org.mx/wp-content/uploads/2024/04/agua-para-la-paz-Resumen-ejecutivo_UNESCO.pdf, consultado el 22 de febrero de 2024.
Plan Nacional de Desarrollo 2019-2024. Diario Oficial: https://www.gob.mx/cms/uploads/attachment/file/487316/PND_2019-2024.pdf, consultado el 4 de febrero del 2024.
Organización de las Naciones Unidas: Página oficial, https://www.un.org/es, consultado el 14 de febrero del 2014.
CONAPO. Proyecciones de la población de México 2020 a 2070: https://www.gob.mx/conapo/documentos/bases-de-datos-de-la-conciliacion-demografica-1950-a-2019-y-proyecciones-de-la-poblacion-de-mexico-2020-a-2070?idiom=es, consultado el 12 de enero de 2024.
CONAPO. Proyecciones de los municipios de México 2010 a 2030: http://www.conapo.gob.mx/work/models/CONAPO/Resource/1529/1/images/Documento_Metodologico_Proyecciones_de_la_poblacion_de_Mexico_20102050.pdf, consultado el 12 de enero de 2024.
Hussen, D., Moshin, A. A Review on Linear Regression Comprehensive in Machine Learning. Journal of Applied Science and Technology Trends, vol. 01, No. 4, pp. 140-147:
https://www.researchgate.net/publication/348111996_A_Review_on_Linear_Regression_Comprehensive_in_Machine_Learning, consultado el 23 de mayo de 2024.
Software R. The R Project for Statistical Computing: https://www.r-project.org/
CONAGUA. Agenda del agua 2030. Avances y logros 2012: https://www.conagua.gob.mx/CONAGUA07/Publicaciones/Publicaciones/SGP-10-12baja.pdf, consultado el 22 de febrero de 2024.
Medina, I. Modelos simples de crecimiento poblacional desde la perspectiva de flujos-reservorios en la plataforma Stella como herramienta para visualizar elementos que regulan los sistemas dinámicos. Enseñanza y Comunicación de las Geociencias, v. 3, núm. 1, p. 33-40: http://encomunicacionct.geociencias.unam.mx/wp-content/uploads/2024/06/Medina-Gomez-v2.pdf, consultado el 12 de septiembre de 2024
Terven, J., Cordova, D., Ramírez, A. Chavez, E. Loss Functions and Metrics in Deep Learning. A Review. Under Review in Computer Science Review. Computer Science. Machine Learning: https://arxiv.org/abs/2307.02694, consultado el 10 de octubre del 2024.
Kowsher, Jashim, Moheuddin, Mahbuba. Two new regression and curve fitting techniques using numerical methods. Algoritms for intelligents systems, Springer 2020:
https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3590089, consultado el 3 de septiembre de 2024
Jiang, B., Zhu, X., Tian, X., Yi, W., Wang, S. Integrating Interpolation and Extrapolation: A Hybrid Predictive Framework for Supervised Learning. Appl. Sci. 2024, 14, 6414: https://www.mdpi.com/2076-3417/14/15/6414, consultado el 10 de octubre de 2024.
URL de la licencia: https://creativecommons.org/licenses/by/3.0/deed.es
Pistas Educativas está bajo la Licencia Creative Commons Atribución 3.0 No portada.
TECNOLÓGICO NACIONAL DE MÉXICO / INSTITUTO TECNOLÓGICO DE CELAYA
Antonio García Cubas Pte #600 esq. Av. Tecnológico, Celaya, Gto. México
Tel. 461 61 17575 Ext 5450 y 5146
pistaseducativas@itcelaya.edu.mx