COMPARACIÓN DE CLASIFICADORES BASÁNDOSE EN DATOS EXTRAÍDOS DE MAMOGRAMAS DIGITALES

Miriam Martínez Arroyo, José Antonio Montero Valverde, Eduardo De La Cruz Gámez, José Francisco Gazca Portillo

Resumen


Resumen

    Este trabajo se enfoca al desarrollo de la etapa de clasificación de un sistema para identificar la lesión de distorsión arquitectural en mamogramas, se realiza un análisis comparativo de clasificadores, con la finalidad de determinar el método que mejor se ajuste a los datos extraídos. Las técnicas aplicadas para la comparación de clasificadores son matriz de confusión y matriz costo-beneficio. Se toma en cuenta la sensibilidad al costo del error de clasificación de cada técnica, ya que en muchas situaciones los errores producidos por un modelo predictivo no tienen las mismas consecuencias. Para la realización de las pruebas, se hace uso del UCI Machine Learning Repository, donde dos BD contienen datos de historial médico (BD1, BD2) y  una contiene datos extraídos de mamogramas digitales (BD3), para esta última se determina que NB obtiene los mejores resultados.

Palabras clave: árboles de decisión, clasificador bayesiano simple (NB), distorsión arquitectural, Máquina de Vector de Soporte (VSM), Perceptrón Multicapa (MLP).


COMPARISON OF CLASSIFIERS BASED ON DATA EXTRACTED FROM DIGITAL MAMMOGRAMS


Abstract

 This work focuses on the development of the classification stage of a system to identify the architectural distortion lesion in mammograms, a comparative analysis of classifiers is performed, in order to determine the method that best fits the data extracted. The techniques applied are confusion matrix and cost-benefit matrix. The sensitivity analysis versus the cost of the classification error of each technique is taken into account, since in many situations the errors produced by a predictive model do not have the same consequences. NB, TAN, J48, SVM and MLP are the classifiers used.  To carry out the tests, a set of classification domains was selected from the UCI Machine Learning Repository collection, which contains medical history data (BD1, BD2) and data extracted from digital mammograms   (BD3), for the latter  was determined that NB obtains the best results.

Keywords: architectural distortion, decision trees, Multi Layer Perceptron (MLP), Naive Bayes classifier (NB), Support Vector Machines (VSM).

 

Texto completo:

130-142 PDF

Referencias


Argañaraz J. y Entraigas I. (2011). Análisis comparativo entre máquinas de vectores soporte y clasificador de máxima probabilidad para la discriminación de cubiertas de suelo. Revista de teledetección: Revista de la Asociación Española de Teledetección, ISSN 1133-0953, Nº. 36, 2011, págs. 26-39.

Barrientos M. R. E., Cruz R. N. y otros (2008). Evaluación potencial de Redes Bayesianas en la clasificación de datos médicos. Revista médica de la universidad Veracruzana. Vol. 8 Num. 1, junio 2008.

Bellaachia, Abdelghani and Guven, Erhan (2005). Predicting breast cancer survivability using data mining techniques. The George Washington University.

Botia J., Sarmiento H. e Isaza C. (2009). Redes neuronales artificiales de base radial como clasificador difuso: Una aplicación en diagnóstico médico. Universidad de Antioquia.

Betancourt, G. A. (2005). “Las Máquinas de Soporte Vectorial (SVMs)”. Scientia et Technica Año XI, No 27. UTP. ISSN 0122-1701.

Flores G. H. (2016). “Redes Neuronales Aplicadas a la Detección de Cáncer de Mama”. Tesis IPN.

Corso, C. L. (2009). Aplicación de algoritmos de clasificación supervisada usando WEKA. Universidad Tecnológica Nacional, Facultad Regional Córdoba.

Lozano P. F. (2011). Integración del algoritmo CTC en la plataforma WEKA, Universidad del País Vasco. Irun, España.

Marin-Castro H.M. y Franco-Vázquez P.E. (2017). “Estudio de Herramientas de Minería de Datos para la Tarea de Clasificación”. Universidad Politécnica de Victoria, Av. Nuevas Tecnologías 5902, Parque Científico y Tecnológico de Tamaulipas, C.P. 87138, Cd Victoria, Tamaulipas, México. Tecno Intelecto 2017, 14(1):1-9.

Martínez F. C. (2016). Detección Automática de Anomalías Presentes en mamografías Digitales. Tesis IPN.

Merz, C.J., and Murphy, P.M. (1996). UCI Repository of machine learning databases [http://www.ics.uci.edu/~mlearn/MLRepository.html]. Irvine, CA: University of California, Department of Information and Computer Science.

Oommen, t., Misra and Twarakavi, N. K. C., Prakash, Sahoo, b. & Bandopadhyay, S. (2008). An objective analysis of Support vector machine-based classification for remote sensing.

John Ross Quinlan (1993). C4.5 Programs for machine Learning. Morgan Kaufmann Publishers, San Mateo.

Rodríguez L. V. Análisis de imágenes de mamografía para la detección de cáncer de mama (2012). Temas de Ciencia y Tecnología. 2012; 15(47): 39-45.

Organización Mundial de la Salud (OMS, 2016). “Estadísticas a Propósito del Día Mundial de la Lucha Contra el Cáncer de Mama”. http://www.inegi.org.mx/saladeprensa/aproposito/2016/mama2016_0.pdf.

M.R.M. Samulski (2006). “Classification of breast lesions in digital mammograms,” Master’s thesis, University Medical Center Nijmegen, 2006.

UCI Machine Learning Repository (2017). Center for Machine Learning and Intelligent Systems: http://archive.ics.uci.edu/ml/datasets/Breast+Cancer+ Wisconsin+%28Diagnostic%29.






URL de la licencia: https://creativecommons.org/licenses/by/3.0/deed.es

Barra de separación

Licencia Creative Commons    Pistas Educativas está bajo la Licencia Creative Commons Atribución 3.0 No portada.    

TECNOLÓGICO NACIONAL DE MÉXICO / INSTITUTO TECNOLÓGICO DE CELAYA

Antonio García Cubas Pte #600 esq. Av. Tecnológico, Celaya, Gto. México

Tel. 461 61 17575 Ext 5450 y 5146

pistaseducativas@itcelaya.edu.mx

http://pistaseducativas.celaya.tecnm.mx/index.php/pistas