3 1-Los Tipos Principales de Machine Learning
De manera general podemos agrupar machine learning en tres categorías principales:
1. 🎯 Aprendizaje Supervisado (Supervised Learning)
¿Cómo funciona?
Contamos con un conjunto de datos con características Y una etiqueta con la respuesta correcta
El modelo aprende la relación entre características y etiquetas
Una vez entrenado, puede predecir para nuevos datos
Ejemplo Práctico: Predicción de Precios de Casas
Características de entrada:
- Número de baños
- Número de cuartos
- Tamaño en metros cuadrados
- ¿Tiene alberca? (Sí/No)
Etiqueta: Precio de la casaDos Subtipos Importantes:
A) Regresión
Predice un valor continuo (número)
Ejemplos:
Precio de una casa
Valor de una acción
Temperatura
Ventas mensuales
B) Clasificación
La respuesta está limitada a categorías específicas
Ejemplos:
¿Perro o gato? (clasificación binaria)
¿Spam o no spam?
Marca de vehículo (clasificación múltiple)
📋 Resumen Aprendizaje Supervisado:
✅ Requiere datos etiquetados
✅ Para problemas de clasificación y regresión
✅ Usos comunes: clasificación de imágenes, diagnósticos médicos, detección de fraudes, reconocimiento de voz
2. 🔍 Aprendizaje No Supervisado (Unsupervised Learning)
Característica Principal:
❌ NO contamos con datos etiquetados
✅ El modelo encuentra patrones por sí mismo
Ejemplo Práctico: Segmentación de Clientes
Usando clustering (agrupamiento), el modelo identifica 3 tipos de clientes:
Grupo 1:
- Visita frecuentemente la tienda
- Compra mucho
- Estrategia: Enviar novedades
Grupo 2:
- Visita poco la tienda
- Compra poco
- Estrategia: Ofrecer promociones
Grupo 3:
- Visita poco la tienda
- Compra mucho (probablemente en línea)
- Estrategia: Enviar cupones virtualesOtros Ejemplos:
Seleccionar posiciones para deportes basado en desempeño
Detección de anomalías
Recomendación de productos
3. 🎮 Aprendizaje por Refuerzo (Reinforcement Learning)
Concepto Único:
Agente + Ambiente + Sistema de Recompensas
Aprendizaje por ensayo y error
Componentes Clave:
Agente: El modelo que aprende
Ambiente: Donde interactúa el agente
Recompensas: Puntos por acciones correctas/incorrectas
Ejemplos Prácticos:
🤖 Agente que juega ajedrez
🎮 Modelos que aprenden videojuegos (FIFA, Go)
🚶♂️ Robots que aprenden a caminar
🚗 Sistemas de conducción autónoma
Característica Distintiva:
El ambiente cambia con cada acción
Retroalimentación constante al modelo
Aprendizaje adaptativo en tiempo real
🎯 ¿Cuándo Usar Cada Tipo?
| Tipo | ¿Cuándo Usarlo? | Ejemplos |
|---|---|---|
| Supervisado | Cuando tienes datos etiquetados | Clasificación, Regresión |
| No Supervisado | Cuando buscas patrones en datos sin etiquetar | Segmentación, Agrupamiento |
| Por Refuerzo | Cuando hay interacción con ambiente dinámico | Juegos, Robots, Control |
🚀 Próximos Pasos
Ahora que conoces más acerca de los tipos de machine learning, en la siguiente lección hablaremos de los datos, los cuales son la base para cualquier buen modelo.
Recuerda: La elección del tipo de machine learning depende completamente del problema que quieres resolver y los datos con los que cuentas.
Te explico los tipos de aprendizaje automático (Machine Learning) de una manera clara y estructurada.
En esencia, el Machine Learning (ML) es un subcampo de la Inteligencia Artificial que se centra en crear sistemas que pueden aprender de los datos y mejorar su rendimiento en una tarea específica sin ser programados explícitamente para ello.
Estos sistemas aprenden patrones a partir de ejemplos. La forma en que "aprenden" de estos ejemplos es lo que nos permite clasificarlos en varios tipos. Los tres tipos principales son:
Aprendizaje Supervisado (Supervised Learning)
Aprendizaje No Supervisado (Unsupervised Learning)
Aprendizaje por Refuerzo (Reinforcement Learning)
Además, existen otros enfoques híbridos y modernos.
1. Aprendizaje Supervisado (Supervised Learning)
Analogía: Es como aprender con un profesor o un libro de soluciones. Le das al algoritmo un conjunto de datos que ya incluye las respuestas correctas.
Cómo funciona:
Se entrena un modelo con un conjunto de datos etiquetado. Esto significa que cada ejemplo de entrenamiento tiene una "etiqueta" o resultado deseado.
El modelo busca aprender la relación entre las características de entrada (features) y la etiqueta de salida.
Una vez entrenado, el modelo puede predecir la etiqueta para nuevos datos que nunca ha visto.
Se divide en dos categorías principales:
Clasificación (Classification): El objetivo es predecir una categoría o clase discreta.
Ejemplo: ¿Es este email spam o no spam? ¿Es un tumor benigno o maligno? ¿Qué dígito (0-9) está escrito en esta imagen?
Algoritmos comunes: Regresión Logística, Support Vector Machines (SVM), Árboles de Decisión, Random Forest, Redes Neuronales.
Regresión (Regression): El objetivo es predecir un valor numérico continuo.
Ejemplo: Predecir el precio de una casa basándose en su tamaño, ubicación, etc. Predecir las ventas de un producto para el próximo mes.
Algoritmos comunes: Regresión Lineal, Regresión Polinómica, Árboles de Decisión para Regresión.
2. Aprendizaje No Supervisado (Unsupervised Learning)
Analogía: Es como darle a un niño una caja de legos de diferentes formas y colores y dejar que los agrupe como él crea conveniente, sin decirle cómo.
Cómo funciona:
Se utiliza con datos sin etiquetar. No hay un "profesor" que dé las respuestas correctas.
El objetivo es encontrar estructuras, patrones o relaciones ocultas en los datos por sí mismos.
Se divide en varias técnicas:
Agrupación o Clustering: Agrupar datos en "clusters" o conjuntos de tal manera que los puntos dentro de un grupo sean más similares entre sí que con los de otros grupos.
Ejemplo: Segmentación de clientes para marketing, agrupar genes con funciones similares, detección de comunidades en redes sociales.
Algoritmos comunes: K-Means, Clustering Jerárquico, DBSCAN.
Reducción de Dimensionalidad (Dimensionality Reduction): Simplificar los datos reduciendo el número de variables o características, pero tratando de conservar la información más importante. Es muy útil para visualizar datos complejos.
Ejemplo: Compresión de imágenes, visualización de datos de alta dimensión en 2D o 3D.
Algoritmos comunes: Análisis de Componentes Principales (PCA), t-SNE.
Reglas de Asociación (Association Rules): Descubrir relaciones interesantes entre variables en grandes bases de datos.
Ejemplo: Análisis de la cesta de la compra ( "las personas que compran pan y mantequilla, a menudo también compran leche").
Algoritmo común: Apriori.
3. Aprendizaje por Refuerzo (Reinforcement Learning)
Analogía: Es como entrenar a un perro. El perro (agente) realiza acciones (como sentarse) en un entorno (tu sala). Si lo hace bien, le das una galleta (recompensa positiva). Si no, no recibe nada o recibe un castigo (recompensa negativa). Con el tiempo, el perro aprende qué acciones maximizan sus galletas.
Cómo funciona:
Un agente aprende a tomar decisiones realizando acciones en un entorno.
Por cada acción, el agente recibe una recompensa (positiva o negativa).
El objetivo del agente es aprender una estrategia (policy) que maximice la recompensa acumulativa a lo largo del tiempo.
Características clave:
No hay datos de entrenamiento, solo un entorno con el que interactuar.
El aprendizaje es por ensayo y error.
Ejemplos: AlphaGo (que venció al campeón mundial del juego de Go), robots que aprenden a caminar, sistemas de conducción autónoma, estrategias en juegos complejos.
Algoritmos comunes: Q-Learning, Deep Q-Networks (DQN).
Otros Tipos Importantes (Enfoques Híbridos)
Aprendizaje Semi-supervisado (Semi-supervised Learning): Combina una pequeña cantidad de datos etiquetados con una gran cantidad de datos no etiquetados. Es muy común en el mundo real, ya que etiquetar datos es costoso y requiere mucho tiempo.
Aprendizaje Automático Automatizado (AutoML): Su objetivo es automatizar el proceso completo de aplicar ML a problemas del mundo real, desde el preprocesamiento de datos hasta la selección del modelo y el ajuste de hiperparámetros.
Resumen Visual Conceptual
¿Tus datos tienen etiquetas (respuestas conocidas)?
|
├─── **SÍ** ───> **Aprendizaje Supervisado**
| |
| └── ¿Qué quieres predecir?
| |
| ├── Una **categoría** (ej: spam/no spam) -> **Clasificación**
| └── Un **valor continuo** (ej: precio) -> **Regresión**
|
├─── **NO** ───> **Aprendizaje No Supervisado**
| |
| └── ¿Qué quieres hacer?
| |
| ├── Encontrar **grupos** naturales -> **Clustering**
| ├── **Simplificar** los datos para visualizar -> **Reducción de Dimensionalidad**
| └── Encontrar **reglas** (ej: "si A, entonces B") -> **Reglas de Asociación**
|
└── ¿Quieres que un **agente** aprenda a actuar en un **entorno** mediante **ensayo y error** para maximizar una **recompensa**?
|
└── **SÍ** ───> **Aprendizaje por Refuerzo**Espero que esta explicación te haya aclarado los conceptos fundamentales de los tipos de Machine Learning. ¡Es un campo fascinante y en constante evolución
Comentarios
Publicar un comentario