Mario González

Game Developer

Software Developer

Introducción al Machine Learning

Machine Learning y Lógica Difusa en la Medicina y la Seguridad Alimentaria

La inteligencia artificial ha revolucionado numerosos campos, y la medicina y la seguridad alimentaria no son la excepción. En este proyecto, combiné técnicas avanzadas de Machine Learning (ML) y lógica difusa para abordar dos problemas clave junto a un compañero:

  1. El diagnóstico automático de enfermedades dermatológicas a partir de síntomas clínicos.
  2. La identificación de hongos venenosos y comestibles usando modelos de aprendizaje automático.

Ambos casos presentan desafíos únicos que fueron abordados con diversas metodologías, desde modelos tradicionales de clasificación hasta redes neuronales profundas con Keras.

Diagnóstico de Enfermedades Dermatológicas con Machine Learning

Preprocesamiento y Análisis de Datos

Para este estudio, utilicé un conjunto de datos clínicos de dermatología, procesándolo para eliminar valores nulos y normalizar variables. A través de técnicas de exploración de datos (EDA) como boxplots, violinplots y matrices de correlación, pude visualizar patrones relevantes en distintas enfermedades cutáneas.

Uno de los hallazgos clave fue la alta correlación entre ciertas características, como el enrojecimiento y la descamación, lo que permitió afinar los modelos de clasificación.

Comparación de Modelos de Machine Learning

Probé distintos modelos supervisados para clasificar las enfermedades dermatológicas en seis categorías:

  • Random Forest (precisión del 98%)
  • Gradient Boosting (precisión del 96%)
  • Support Vector Machine (SVM) (precisión del 70%)
  • Árboles de Decisión (precisión del 93%)

El modelo Random Forest fue el más efectivo y se mejoró aún más con Bagging, una técnica que reduce la varianza en la clasificación. También utilicé matrices de confusión para analizar los errores y detectar clases difíciles de predecir.

Red Neuronal con Keras

A continuación, implementé una red neuronal con Keras, optimizando su arquitectura para clasificación multiclase. Tras probar distintas configuraciones de neuronas y capas ocultas, determiné que los mejores resultados se obtenían con arquitecturas de (30,20) y (40,30) neuronas, alcanzando métricas superiores al 97% en precisión, recall y F1-score.

Si bien la red neuronal tuvo un rendimiento similar a Random Forest, su principal ventaja radica en la capacidad de generalización y detección de patrones más complejos.

Lógica Difusa para Diagnóstico Médico

Además del enfoque basado en ML, desarrollé un sistema de lógica difusa que permite diagnosticar enfermedades a partir de síntomas introducidos por el usuario. Este método es ideal en situaciones donde los síntomas no son categóricos, sino que varían en intensidad.

Por ejemplo, en lugar de decir que un paciente tiene o no fiebre, se pueden establecer rangos como leve, moderada o alta, permitiendo un diagnóstico más flexible.

Identificación de Hongos Comestibles y Venenosos con Machine Learning

Importancia del Problema

La identificación errónea de hongos silvestres puede ser letal. Existen especies visualmente similares entre sí, pero con efectos drásticamente opuestos: algunas son nutritivas y seguras, mientras que otras contienen toxinas mortales.

El uso de Machine Learning permite desarrollar un sistema automático que analiza características como color, forma, textura y hábitat para determinar si un hongo es seguro o peligroso.

Modelo de Clasificación para Hongos

Para este análisis, utilicé un dataset con características extraídas de distintos hongos. Se probaron múltiples modelos, incluyendo:

  • Random Forest → Precisión del 99.2%
  • SVM → Precisión del 95.7%
  • Red Neuronal con Keras → Precisión del 98.5%

Los modelos basados en árboles de decisión como Random Forest fueron los más efectivos, ya que pueden manejar de manera eficiente atributos categóricos como el color de las esporas o la presencia de volva en la base del tallo.

Problema y Riesgos

Los hongos venenosos pueden causar intoxicaciones graves si se confunden con especies comestibles. Para abordar esto, entrené modelos de Machine Learning capaces de identificar hongos seguros y peligrosos a partir de características como:

  • Color de esporas
  • Forma y textura del sombrero
  • Presencia de volva o anillo en el tallo

Entrenamiento y Evaluación de Modelos

Los modelos se entrenaron con un conjunto de datos de hongos clasificados y se validaron con una partición de prueba del 20% de los datos para medir su efectividad.

ModeloPrecisiónRecallF1-score
Random Forest99.2%99.0%99.1%
Support Vector Machine95.7%94.8%95.1%
Red Neuronal (Keras)98.5%98.3%98.4%

Al igual que en el caso de dermatología, Random Forest ofreció los mejores resultados, clasificando correctamente la mayoría de los hongos con un 99.2% de precisión.