Choosing a machine learning model for breast cancer detection in images
View/ Open
Date
2020Author
Ávila Hernández, Ricardo
Rossell Mendoza, Kevin Ricardo
Soto Mora, Josue Alejandro
Metadata
Show full item recordAbstract
Machine Learning comprises a wide range of models aimed at solving real life problems using supervised and unsupervised algorithms capable of finding even the finest causalities and correlations between any given phenomena portrayed in data. Given the current extraordinary software capabilities, we can exploit this tool in practically any field – Oncology. For instance, a medical speciality which focuses on Cancer treatment can make use of these models to provide a more accurate diagnosis when it comes to Breast Cancer Detection. In this article we delve into a catalogue of Machine Learning models and discuss their effectiveness through specific criteria in order to choose the most suitable one for this problem. The Analytic Hierarchy Process displayed conclusive results assigning to the Random Forest the highest scores in each one of the analyses employed, over 10% better than the Logistic Regression, the second highest evaluated model in the overall analysis. The models we developed with data describing different features of different breast tumour nuclei, therefore, for another type of data results may differ. El Aprendizaje de Máquina comprende una amplia gama de modelos que pretenden resolver problemas mediante algoritmos Supervisados y No Supervisados, éstos son capaces de encontrar relaciones causales y correlaciones que pueden pasar desapercibidas por otros métodos. Dados los avances tecnológicos, en concreto software, se pueden utilizar estas herramientas a varias disciplinas, como lo es Oncología. Ésta es una especialidad médica que se enfoca en el Cáncer y puede ser beneficiada al utilizar estos modelos para detección de Cáncer de Mama. En el presente artículo, exploramos un catálogo de modelos de Aprendizaje de Máquina Supervisados y estudiamos su eficiencia mediante diferentes criterios, para encontrar el más adecuado para resolver este problema. El método Analytic Hierarchy Process brindó resultados claros, mediante el cual se asignó al Random Forest como el mejor modelo en los tres análisis que se llevaron a cabo; con una calificación más de 10% más alta que el segundo mejor modelo, la Regresión Logística. Estos modelos fueron entrenados con datos sobre diferentes células de tumores en mamas, por lo que, con diferentes datos, los resultados pueden variar.