¿Qué es un LLM (Large Language Model)?

 

¿Qué es un LLM (Large Language Model)?

Definición Simple: Un LLM es un modelo de lenguaje grande entrenado con enormes cantidades de texto para entender y generar lenguaje humano.

Analogía: Piensa en un LLM como un estudiante superdotado que ha leído todo internet:

  • Ha visto billones de documentos, libros, código, etc.

  • Aprendió patrones del lenguaje, gramática, conceptos

  • Puede conversar, traducir, programar, analizar texto

Ejemplos de LLMs:

  • GPT-4 (OpenAI)

  • Llama 2/3 (Meta)

  • DeepSeek (el que mencionas)

  • Claude (Anthropic)

  • Mistral

Características clave:

  • Tamaño: 7B a 70B+ parámetros

  • Entrenados con texto general

  • Pueden fine-tunearse para tareas específicas


Ollama vs DeepSeek Local

Ollama - El Gestor de LLMs

bash
# Ollama es como un "gestor de paquetes" para LLMs
ollama pull llama2:7b     # Descarga un modelo
ollama run llama2:7b      # Ejecuta el modelo
ollama list               # Lista modelos instalados

Qué hace Ollama:

  • Descarga y gestiona modelos LLM

  • Proporciona una API local para interactuar

  • Optimiza automáticamente para tu hardware

  • Interfaz web incluida

DeepSeek Local - El Modelo Específico

python
# DeepSeek es un MODELO específico que puedes ejecutar con Ollama
from transformers import AutoTokenizer, AutoModelForCausalLM

# Cargar DeepSeek localmente
tokenizer = AutoTokenizer.from_pretrained("deepseek-ai/deepseek-coder-6.7b")
model = AutoModelForCausalLM.from_pretrained("deepseek-ai/deepseek-coder-6.7b")

La relación:

text
Ollama (gestor) → Puede ejecutar → DeepSeek (modelo)

Cómo usar DeepSeek con Ollama:

bash
# Instalar DeepSeek usando Ollama
ollama pull deepseek-coder:6.7b

# Ejecutarlo
ollama run deepseek-coder:6.7b

Tipos de DeepSeek:

  • deepseek-coder: Especializado en programación

  • deepseek-llm: Modelo de lenguaje general


¿Qué son los Agentes de IA?

Definición: Un agente de IA es un sistema que usa un LLM como "cerebro" para tomar decisiones y ejecutar acciones de forma autónoma.

Analogía del Agente:

text
LLM = El cerebro que piensa
Agente = La persona completa (cerebro + herramientas + capacidad de acción)

Componentes de un Agente:

  1. LLM: Toma decisiones

  2. Herramientas: Funciones que puede ejecutar

  3. Memoria: Recuerda conversaciones pasadas

  4. Planificador: Define estrategias para alcanzar objetivos

Ejemplo Práctico de Agente:

python
# Pseudocódigo de un agente simple
class AgenteInvestigador:
    def __init__(self):
        self.llm = LLM()  # Cerebro
        self.herramientas = [buscar_web, leer_archivo, calcular]  # Herramientas
        self.memoria = []  # Historial
    
    def investigar(self, pregunta):
        # 1. El LLM decide qué hacer
        decision = self.llm.pensar("¿Cómo investigar: " + pregunta)
        
        # 2. Ejecuta herramientas
        if decision == "buscar_web":
            resultado = self.buscar_web(pregunta)
        elif decision == "leer_archivo":
            resultado = self.leer_archivo("datos.txt")
        
        # 3. Sintetiza la respuesta
        respuesta = self.llm.sintetizar(resultado)
        return respuesta

Ejemplos Reales de Agentes

Agente de Programación:

python
# Un agente que puede escribir y probar código
agente_programador = Agente(
    herramientas=[
        escribir_codigo,
        ejecutar_pruebas,
        depurar_errores,
        documentar
    ]
)

# Puede recibir: "Crea una API REST con Python"
# Y automáticamente: escribe código → ejecuta pruebas → corrige errores

Agente de Investigación:

python
agente_investigador = Agente(
    herramientas=[
        buscar_internet,
        analizar_documentos,
        resumir_informacion,
        generar_reporte
    ]
)

# Puede: "Investiga sobre el cambio climático 2024"
# Resultado: Busca info → Analiza → Genera reporte completo

Agente Personal:

python
agente_personal = Agente(
    herramientas=[
        leer_emails,
        gestionar_calendario,
        hacer_reservas,
        comprar_online
    ]
)

Cómo Empezar con Todo Esto

Paso 1: Instalar Ollama

bash
# Ve a https://ollama.ai/ y descarga
# O en terminal (Linux/Mac):
curl -fsSL https://ollama.ai/install.sh | sh

Paso 2: Probar Diferentes Modelos

bash
# Probar varios modelos
ollama pull llama2:7b
ollama pull mistral:7b
ollama pull deepseek-coder:6.7b

# Ver cuál te gusta más
ollama run deepseek-coder:6.7b

Paso 3: Crear tu Primer Agente Simple

python
# Ejemplo básico con LangChain
from langchain.agents import Tool, AgentType, initialize_agent
from langchain.llms import Ollama

# Conectar con Ollama local
llm = Ollama(model="deepseek-coder:6.7b")

# Definir herramientas simples
def calculadora(expresion):
    return eval(expresion)

def buscador_texto(palabra):
    # Buscar en archivos locales
    with open("datos.txt", "r") as f:
        contenido = f.read()
    return palabra in contenido

# Crear agente
herramientas = [
    Tool(name="Calculadora", func=calculadora, 
         description="Útil para cálculos matemáticos"),
    Tool(name="Buscador", func=buscador_texto,
         description="Busca palabras en archivos locales")
]

agente = initialize_agent(tools=herramientas, llm=llm, 
                         agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION)

# Usar el agente
resultado = agente.run("Calcula 15 * 8 y busca si existe la palabra 'python' en mis archivos")

Resumen de Diferencias

ConceptoQué esEjemplo
LLMModelo de lenguajeDeepSeek, Llama 2
OllamaGestor/ejecutor de LLMsSoftware que ejecuta DeepSeek
AgenteSistema autónomo con LLM + herramientasAsistente que programa/investiga

Flujo Completo:

text
Ollama (software) → Ejecuta → DeepSeek (LLM) → Puede ser parte de → Agente (sistema autónomo)

¿Te gustaría que profundice en cómo instalar Ollama y ejecutar tu primer modelo local, o prefieres un ejemplo más detallado de cómo crear un agente específico?

Comentarios

Entradas más populares de este blog

¿Qué es la Inteligencia Artificial (IA)?

3.2 Los datos: la base de cualquier modelo

3 3 tus primeros modelos primer modelo librerias