CÓMPUTO PARALELO EN UNIDADES DE PROCESAMIENTO GRÁFICO Y MEDICIÓN DE TIEMPOS DE RESPUESTA COMO CRITERIO DE DESEMPEÑO (PARALLEL COMPUTING IN GRAPHIC PROCESSING UNITS AND MEASUREMENT OF RESPONSE TIMES AS PERFORMANCE CRITERIA)
Resumen
En este trabajo se presenta el procedimiento para la paralelización de procesos en una Unidad de Procesamiento Gráfico (GPU) y la medición de sus tiempos de respuesta como criterio de desempeño. Para el desarrollo de este trabajo se realizaron pruebas experimentales en dos bancos de prueba: el primero está conformado por una GPU NVIDIA GTX 1050 adaptada de forma externa a una laptop; el segundo, una laptop con GPU integrada NVIDIA GTX 1050. Cada banco de pruebas está configurado para dos sistemas operativos, Windows 10 y GNU/Linux Ubuntu con la plataforma CUDA. Como caso de estudio se utilizan dos algoritmos complejos, producto de matrices y eliminación de matrices por método de Gauss-Jordan, donde se realiza un conjunto de mediciones de tiempos de respuesta, analizando su dinámica y desempeño a través de sus primeros momentos de probabilidad (media y varianza).
Palabras Clave: Algoritmo complejo, CUDA, desempeño, GPU, paralelización de procesos.
Abstract
This paper presents the parallelization of processes in a Graphic Processing Unit (GPU) and measurement of their response times as performance criteria. To support this work, experimental tests have been carried out on two test benches; The first one is made up of an NVIDIA GTX 1050 Graphics Processing Unit externally adapted to a laptop; The second one is a laptop with an integrated GPU. Each test bench is configured for two operating systems, Windows 10 and GNU/Linux Ubuntu with the CUDA platform. As a test object, two complex algorithms are used, product of matrices and elimination of matrices by the Gauss-Jordan method, where a set of response time measurements is made, analyzing their dynamics and performance through their first moments of probability (mean and variance).
Keywords: Complex algorithm, CUDA, GPU, parallelization of processes, performance.
Texto completo:
653-669 PDFReferencias
Baldovinos D. L. G. Análisis Experimental de los Tiempos de Respuesta en Rt- Linux Para Una SBC. Ciudad De México, Tesis de Maestría. México, Sección de Estudios de Posgrado e Investigación. ESIME Culhuacan. Instituto Politécnico Nacional, 2018a.
Baldovinos D. L. G., Rosas J. L. C., García E. E. and López P. G. Impacto de dos Mecanismos de Planificación de Tiempo Real con RT-Linux sobre una Computadora Embebida. CIRC 2018, San Jose del Cabo, Baja California Sur, México. México, Dirección de Publicaciones IPN: Instituto Politécnico Nacional, 2018b.
Baldovinos D. L. G., Rosas J. L. C., C. E. M. y Guevara López Pedro. Caracterización estadística de los tiempos de respuesta de un algoritmo complejo en RT-Linux, 2019.
Ccapacca E. Q., (2012). Paralelización sobre GPU del Algoritmo de Eliminación de Gauss-Jordan para la Solución de Sistemas de Ecuaciones Lineales. Arequipa - Perú. Disponible:
http://www.comtel.pe/comtel2012/callforpaper2012/P40C.pdf.
Corsair,(2015) Cx seriesTM modular cx650m atx fuente de alimentación modular de 650 W. Disponible en:
Unidades-de-fuentes-de-alimentaci%C3%B3n/cxm-series-2015-config/p/CP-9020103-NA#tab-tech-specs.
G. Store, (2016). Ngff pci-e versión pcie pci-e v8.4d exp gdc estación de acoplamien- to de ordenador portátil/base de tarjeta de video portátil externa. Disponible:
https://es.aliexpress.com/item/4000912882833.html?spm=a2g0o.productlist.0.0.457d59ffIri89C&algo_pvid=18264914-afb8-4a9c-8b8c-006319bbe511&algo_expid=18264914-afb8-4a9c-8b8c-006319bbe511-35&btsid=zab50f0815925859895762140ed19e&ws_ab_test=searchweb0_0,searchweb201602_,searchweb201603.
Gigabyte, (2020). GeForce GTX 1050 oc 2g(rev1.0/rev1.1). Disponible: https://www.gigabyte.com/mx/Graphics-Card/GV-N1050OC-2GD#kf.
Koo J. J. P., Quintal L. F. C. and May O. A. C., (2016). Análisis del rendimiento de procesadores multinúcleo embebidos en dispositivos digitales al ejecutar aplicaciones paralelas. Disponible:
http://www.itc.mx/ojs/index.php/pistas/article/view/658.
Mercado Libre, (2020). Pci-e 8 pines a 6 + 2 pines (6 pines/8 pines power). Disponible:
https://articulo.mercadolibre.com.mx/MLM-700127901-pci-e-8-pines-a-6-2-pines-6-pines-8-pinespower_M?quantity=1#position=2&type=item&tracking_ id=bc7ccc6d-e784-4d80-b7d4-85c3e2e571fc.
Molina J. A. L. and Alpizar D. M. R., (2012). Análisis de rendimiento de algoritmos paralelos. Disponible:
https://repositorio.unan.edu.ni/1914/1/ANALISIS%20DE%20RENDIMIENTO%20DE% 20ALGORITMOS%20PARALELOS.pdf.
NVIDIA, (2020). Documentación del paquete de herramientas de CUDA. Disponible:
https://docs.nvidia.com/cuda/cuda-runtime-api/group CUDARTEVENT.html#groupCUDART__EVENT_1g40159125411db92c835edb46a0989cd6.
Soto R. T. Programación paralela sobre arquitecturas heterogéneas. Bogotá, Colombia: Universidad Nacional de Colombia, 2016.
Universidad de Alicante, (2020). Supercomputación y sus aplicaciones para el profesional de la ingeniería informática. Disponible:
https://eps.ua.es/es/master-ingenieria-informatica/noticias/supercomputacion-y-sus-aplicaciones-para-el-profesional-de-la-ingenieria-informatica.html.
URL de la licencia: https://creativecommons.org/licenses/by/3.0/deed.es
Pistas Educativas está bajo la Licencia Creative Commons Atribución 3.0 No portada.
TECNOLÓGICO NACIONAL DE MÉXICO / INSTITUTO TECNOLÓGICO DE CELAYA
Antonio García Cubas Pte #600 esq. Av. Tecnológico, Celaya, Gto. México
Tel. 461 61 17575 Ext 5450 y 5146
pistaseducativas@itcelaya.edu.mx