Modelos
La sección de nivel superior models declara los modelos de IA que utiliza tu aplicación de Compose. Por lo general, estos modelos se descargan (pull) como artefactos OCI, los ejecuta un ejecutor de modelos (model runner) y se exponen como una API que los contenedores de tus servicios pueden consumir.
Los servicios solo pueden acceder a los modelos cuando se les concede explícitamente mediante un atributo models dentro del elemento de nivel superior services.
Ejemplos
Ejemplo 1
services:
app:
image: app
models:
- ai_model
models:
ai_model:
model: ai/modelEn este ejemplo básico:
- El servicio
apputiliza el modeloai_model. - El
ai_modelse define como un artefacto OCI (ai/model) que es descargado y servido por el ejecutor de modelos. - Docker Compose inyecta la información de conexión, por ejemplo
AI_MODEL_URL, en el contenedor.
Ejemplo 2
services:
app:
image: app
models:
my_model:
endpoint_var: MODEL_URL
models:
my_model:
model: ai/model
context_size: 1024
runtime_flags:
- "--a-flag"
- "--another-flag=42"En esta configuración avanzada:
- El servicio
apphace referencia amy_modelutilizando la sintaxis larga. - Compose inyecta la URL del ejecutor de modelos como la variable de entorno
MODEL_URL.
Atributos
model(obligatorio): El identificador del artefacto OCI para el modelo. Esto es lo que Compose descarga y ejecuta a través del ejecutor de modelos.context_size: Define el tamaño máximo de contexto de tokens para el modelo.runtime_flags: Una lista de flags de línea de comandos en crudo que se pasan al motor de inferencia cuando se inicia el modelo.
Recursos adicionales
Para obtener más ejemplos e información sobre el uso de model, consulta
Usar modelos de IA en Compose