Esta página fue traducida automáticamente. La versión en inglés es la autoritativa. Ver en inglés
§ Software · 03 · Inteligencia · Insignia

IA que genera resultados — no presentaciones.

Diseñamos y desplegamos IA que llega a producción. Copilotos impulsados por LLM, modelos predictivos y pipelines de ML — seleccionados, construidos, evaluados, desplegados y monitoreados por un equipo senior que se responsabiliza del sistema durante su primer año de operación.

Servicio
03 de 06 · Insignia
Socios de modelos fundacionales
Anthropic · OpenAI · Cohere
Plataformas en la nube
Azure AI Foundry · AWS Bedrock · Databricks
Colaboración
Liderada por socios principales
§ Capacidades

Lo que construimos.

01 · Copilotos LLM

Asistentes ajustados
al dominio

Asistentes ajustados al dominio para operadores de planta, equipos jurídicos, analistas e ingenieros de campo. Con generación aumentada por recuperación, citas de evidencia y un rastro de respuestas auditable.

RAG Uso de herramientas Registro de auditoría
02 · Inteligencia predictiva

Predicción de fallas
y detección de anomalías

Predicción de fallas, detección de anomalías y modelos de pronóstico entrenados con datos operativos — firmas de vibración, telemetría, flujos de transacciones, historiales de reclamaciones.

Series de tiempo Gradient boosting Detección de anomalías
03 · Pipelines de MLOps

El andamiaje
que mantiene viva la IA

Infraestructura de entrenamiento, evaluación, despliegue y monitoreo. Ejecuciones reproducibles, modelos registrados y reversiones. El andamiaje aburrido que mantiene la IA en producción durante años.

Reproducible Registro de modelos Reversiones
04 · Integración de modelos fundacionales

Cableado de producción
para Claude, GPT, Cohere

Cableado de producción para Anthropic Claude, OpenAI, Cohere y Azure AI Foundry — con prompt caching, uso de herramientas, salidas estructuradas y políticas de respaldo.

Claude OpenAI Prompt caching
05 · Desarrollo de modelos a medida

Cuando los modelos fundacionales
no son la respuesta

Cuando los modelos fundacionales no son la respuesta correcta: ML clásico, gradient boosting, aprendizaje profundo, series de tiempo y pilotos de aprendizaje por refuerzo — cuando se justifica.

XGBoost PyTorch Pilotos de RL
06 · Evaluación y seguridad

Evaluaciones, red-team,
cumplimiento de políticas

Evaluaciones offline y online, conjuntos de referencia, bucles de revisión humana, red-teaming y cumplimiento de políticas — integrados en el pipeline de despliegue, no como una ocurrencia tardía.

Conjuntos de referencia Red-team Revisión humana
§ Descubrimiento

No empezamos por el modelo. Empezamos por la decisión.

Si no podemos escribir los criterios de cancelación, no podemos justificar la construcción.

Toda colaboración de IA en Droz comienza con un ejercicio de encuadre del problema de una a dos semanas. El objetivo es identificar la decisión que la IA cambiará — un plan de mantenimiento, un enrutamiento de triaje, una resolución de reclamaciones, una puntuación de adquisiciones — y el costo de equivocarse hoy en esa decisión.

A partir de ahí, trabajamos hacia atrás hasta los datos, la selección del modelo, la integración y el despliegue. La mayoría de las colaboraciones eliminan uno o dos comienzos en falso en esta fase: la carga de trabajo que "suena a LLM" es en realidad un motor de reglas estructurado; la tarea de predicción que "necesita aprendizaje profundo" en realidad quiere gradient boosting sobre mejores características.

El resultado del descubrimiento es un resumen por escrito: la decisión, la línea base, los enfoques candidatos, los datos, el ROM aproximado y los criterios de cancelación. Firmable; revisable; auditable.

§ Enfoque

Modelos fundacionales vs. a medida — cuándo usar cada uno.

A · Modelos fundacionales

Claude, GPT, Cohere, Azure AI Foundry

  • La tarea es rica en lenguaje (redactar, resumir, clasificar texto libre, conversar).
  • Necesita lanzar en semanas, no en trimestres.
  • La flexibilidad de esquema importa más que el costo de latencia.
  • La generación aumentada por recuperación (RAG) le da al modelo el contexto del dominio que necesita.
B · Modelos a medida

Entrenados, propios, deterministas

  • La tarea es estructurada (pronóstico, puntuación, detección de anomalías, visión).
  • La latencia de inferencia debe ser inferior a 50 ms o el costo debe ser determinista.
  • Los datos de entrenamiento existen y son lo bastante grandes (por lo general más de 10 000 ejemplos etiquetados).
  • Necesita la propiedad total de los pesos del modelo y del pipeline de entrenamiento.
Híbrido · el caso común

El modelo fundacional orquesta el flujo de trabajo; los modelos a medida manejan las subtareas deterministas. Diseñamos ambas mitades y el contrato entre ellas.

§ MLOps

Entrenamiento → Evaluación → Despliegue → Monitoreo.

01 · Entrenamiento
01
Entrenamiento

Pipelines reproducibles en Databricks, SageMaker o Azure ML. Conjuntos de datos versionados, características registradas, experimentos rastreados. Cada modelo tiene un linaje.

02 · Evaluación
02
Evaluación

Evaluaciones offline sobre un conjunto de referencia + pruebas reservadas; evaluaciones de seguridad / red-team; intervalos de confianza estadística en la métrica principal. No se promueve ningún modelo que no haya aprobado.

03 · Despliegue
03
Despliegue

Lanzamientos canary. Ejecuciones en sombra. Blue-green para modelos en línea. Actualización por lotes para modelos de pronóstico. Cada despliegue es reversible con un solo clic.

04 · Monitoreo
04
Monitoreo

Detección de desviaciones en entradas, salidas y decisiones posteriores. Tableros de calidad. Colas de revisión humana para predicciones de baja confianza. Alertas que despiertan a la guardia.

§ Integración

El modelo es un servicio. Conectamos el servicio a su negocio.

Un sistema de IA solo es útil cuando vive dentro del flujo de trabajo del operador. Integramos los modelos detrás de una API versionada, con registro estructurado, acceso basado en roles y un panel de evidencia que el operador puede auditar.

Del lado del LLM, entregamos contratos de uso de herramientas, esquemas de salida (Pydantic en el backend; Zod en el frontend), prompt caching y respaldos elegantes. Del lado del ML, entregamos predicciones por lotes a su data warehouse, inferencia en línea detrás de un API gateway y un feature store en el que el modelo confía.

También construimos la superficie humana — el tablero, las alertas, los controles de anulación, la cola de revisión. El objetivo es el apoyo a la decisión, no el reemplazo de la decisión.

Vocabulario de integración
  • API versionada (REST + OpenAPI)
  • Contrato de uso de herramientas (LLM)
  • Esquemas de salida (Pydantic / Zod)
  • Política de prompt caching
  • Respaldos y circuit breakers
  • RBAC + registro de auditoría
  • Panel de evidencia para revisión del operador
  • Anulación y humano en el bucle
§ Stack

Herramientas y tecnologías.

Socios de modelos fundacionales

Anthropic (Claude), OpenAI, Cohere, Azure AI Foundry, AWS Bedrock.

Claude OpenAI Cohere Azure AI Foundry AWS Bedrock
Plataformas de ML

Databricks, Azure ML, SageMaker, Vertex AI.

Databricks Azure ML SageMaker Vertex AI
Frameworks

PyTorch, scikit-learn, XGBoost, LightGBM, transformers, sentence-transformers, LangGraph (donde la orquestación lo justifica).

PyTorch XGBoost LightGBM LangGraph
Datos e infraestructura

Snowflake, PostgreSQL + pgvector, Pinecone, Weaviate, Parquet, Apache Spark, Airflow, Kubeflow.

Snowflake pgvector Pinecone Airflow

Referencias cruzadas — Perfiles completos de socios · Todas las tecnologías · Capa base en la nube.

§ Trabajo de referencia

Dónde funciona en producción.

§ Industrias atendidas
Donde aterriza la IA.

A continuación, seis sectores representativos. La lista completa de 17 vive en la visión general de industrias.

§ Colabore con Droz · Inteligencia
¿IA que ya debería estar funcionando? La diseñamos, la construimos, la evaluamos, la desplegamos y nos hacemos cargo de la rotación de guardia.