01 · Copilotos LLM
Asistentes ajustados
al dominio
Asistentes ajustados al dominio para operadores de planta, equipos jurídicos, analistas e ingenieros de campo. Con generación aumentada por recuperación, citas de evidencia y un rastro de respuestas auditable.
RAG
Uso de herramientas
Registro de auditoría
02 · Inteligencia predictiva
Predicción de fallas
y detección de anomalías
Predicción de fallas, detección de anomalías y modelos de pronóstico entrenados con datos operativos — firmas de vibración, telemetría, flujos de transacciones, historiales de reclamaciones.
Series de tiempo
Gradient boosting
Detección de anomalías
03 · Pipelines de MLOps
El andamiaje
que mantiene viva la IA
Infraestructura de entrenamiento, evaluación, despliegue y monitoreo. Ejecuciones reproducibles, modelos registrados y reversiones. El andamiaje aburrido que mantiene la IA en producción durante años.
Reproducible
Registro de modelos
Reversiones
04 · Integración de modelos fundacionales
Cableado de producción
para Claude, GPT, Cohere
Cableado de producción para Anthropic Claude, OpenAI, Cohere y Azure AI Foundry — con prompt caching, uso de herramientas, salidas estructuradas y políticas de respaldo.
Claude
OpenAI
Prompt caching
05 · Desarrollo de modelos a medida
Cuando los modelos fundacionales
no son la respuesta
Cuando los modelos fundacionales no son la respuesta correcta: ML clásico, gradient boosting, aprendizaje profundo, series de tiempo y pilotos de aprendizaje por refuerzo — cuando se justifica.
XGBoost
PyTorch
Pilotos de RL
06 · Evaluación y seguridad
Evaluaciones, red-team,
cumplimiento de políticas
Evaluaciones offline y online, conjuntos de referencia, bucles de revisión humana, red-teaming y cumplimiento de políticas — integrados en el pipeline de despliegue, no como una ocurrencia tardía.
Conjuntos de referencia
Red-team
Revisión humana
Si no podemos escribir los criterios de cancelación, no podemos justificar la construcción.
Toda colaboración de IA en Droz comienza con un ejercicio de encuadre del problema de una a dos semanas. El objetivo es identificar la decisión que la IA cambiará — un plan de mantenimiento, un enrutamiento de triaje, una resolución de reclamaciones, una puntuación de adquisiciones — y el costo de equivocarse hoy en esa decisión.
A partir de ahí, trabajamos hacia atrás hasta los datos, la selección del modelo, la integración y el despliegue. La mayoría de las colaboraciones eliminan uno o dos comienzos en falso en esta fase: la carga de trabajo que "suena a LLM" es en realidad un motor de reglas estructurado; la tarea de predicción que "necesita aprendizaje profundo" en realidad quiere gradient boosting sobre mejores características.
El resultado del descubrimiento es un resumen por escrito: la decisión, la línea base, los enfoques candidatos, los datos, el ROM aproximado y los criterios de cancelación. Firmable; revisable; auditable.
01 · Entrenamiento
01
Entrenamiento
Pipelines reproducibles en Databricks, SageMaker o Azure ML. Conjuntos de datos versionados, características registradas, experimentos rastreados. Cada modelo tiene un linaje.
02 · Evaluación
02
Evaluación
Evaluaciones offline sobre un conjunto de referencia + pruebas reservadas; evaluaciones de seguridad / red-team; intervalos de confianza estadística en la métrica principal. No se promueve ningún modelo que no haya aprobado.
03 · Despliegue
03
Despliegue
Lanzamientos canary. Ejecuciones en sombra. Blue-green para modelos en línea. Actualización por lotes para modelos de pronóstico. Cada despliegue es reversible con un solo clic.
04 · Monitoreo
04
Monitoreo
Detección de desviaciones en entradas, salidas y decisiones posteriores. Tableros de calidad. Colas de revisión humana para predicciones de baja confianza. Alertas que despiertan a la guardia.
Un sistema de IA solo es útil cuando vive dentro del flujo de trabajo del operador. Integramos los modelos detrás de una API versionada, con registro estructurado, acceso basado en roles y un panel de evidencia que el operador puede auditar.
Del lado del LLM, entregamos contratos de uso de herramientas, esquemas de salida (Pydantic en el backend; Zod en el frontend), prompt caching y respaldos elegantes. Del lado del ML, entregamos predicciones por lotes a su data warehouse, inferencia en línea detrás de un API gateway y un feature store en el que el modelo confía.
También construimos la superficie humana — el tablero, las alertas, los controles de anulación, la cola de revisión. El objetivo es el apoyo a la decisión, no el reemplazo de la decisión.
Vocabulario de integración
- API versionada (REST + OpenAPI)
- Contrato de uso de herramientas (LLM)
- Esquemas de salida (Pydantic / Zod)
- Política de prompt caching
- Respaldos y circuit breakers
- RBAC + registro de auditoría
- Panel de evidencia para revisión del operador
- Anulación y humano en el bucle
Socios de modelos fundacionales
Anthropic (Claude), OpenAI, Cohere, Azure AI Foundry, AWS Bedrock.
Claude
OpenAI
Cohere
Azure AI Foundry
AWS Bedrock
Plataformas de ML
Databricks, Azure ML, SageMaker, Vertex AI.
Databricks
Azure ML
SageMaker
Vertex AI
Frameworks
PyTorch, scikit-learn, XGBoost, LightGBM, transformers, sentence-transformers, LangGraph (donde la orquestación lo justifica).
PyTorch
XGBoost
LightGBM
LangGraph
Datos e infraestructura
Snowflake, PostgreSQL + pgvector, Pinecone, Weaviate, Parquet, Apache Spark, Airflow, Kubeflow.
Snowflake
pgvector
Pinecone
Airflow