01 · Copilotes LLM
Assistants adaptés
au domaine
Des assistants adaptés au domaine pour les exploitants d'usine, les équipes juridiques, les analystes et les ingénieurs de terrain. Augmentés par la récupération, avec citations à l'appui et une trace de réponse auditable.
RAG
Utilisation d'outils
Journal d'audit
02 · Intelligence prédictive
Prédiction de défaillances
et détection d'anomalies
Prédiction de défaillances, détection d'anomalies et modèles de prévision entraînés sur des données opérationnelles — signatures vibratoires, télémétrie, flux de transactions, historiques de réclamations.
Séries temporelles
Gradient boosting
Détection d'anomalies
03 · Pipelines MLOps
L'échafaudage
qui garde l'IA en vie
Infrastructure d'entraînement, d'évaluation, de déploiement et de surveillance. Exécutions reproductibles, modèles enregistrés et retours en arrière. L'échafaudage ennuyeux qui maintient l'IA en production pendant des années.
Reproductible
Registre de modèles
Retours en arrière
04 · Intégration de modèles de base
Câblage de production
pour Claude, GPT, Cohere
Câblage de production pour Anthropic Claude, OpenAI, Cohere et Azure AI Foundry — avec mise en cache des invites, utilisation d'outils, sorties structurées et politiques de repli.
Claude
OpenAI
Mise en cache des invites
05 · Développement de modèles sur mesure
Quand les modèles de base
ne sont pas la réponse
Quand les modèles de base ne sont pas la bonne réponse : ML classique, gradient boosting, apprentissage profond, séries temporelles et projets pilotes d'apprentissage par renforcement — lorsque c'est justifié.
XGBoost
PyTorch
Pilotes RL
06 · Évaluation et sécurité
Évaluations, red-team,
conformité aux politiques
Évaluations hors ligne et en ligne, jeux de référence, boucles de révision humaine, red-teaming et conformité aux politiques — intégrés au pipeline de déploiement, pas en après-coup.
Jeux de référence
Red-team
Révision humaine
Si nous ne pouvons pas écrire les critères d'arrêt, nous ne pouvons pas justifier la construction.
Chaque collaboration en IA chez Droz débute par un exercice de cadrage du problème d'une à deux semaines. L'objectif est de cerner la décision que l'IA viendra changer — un plan de maintenance, un acheminement de triage, l'arbitrage d'une réclamation, l'évaluation d'un approvisionnement — et le coût de mal prendre cette décision aujourd'hui.
À partir de là, nous remontons jusqu'aux données, à la sélection du modèle, à l'intégration et au déploiement. La plupart des collaborations éliminent un ou deux faux départs dans cette phase : la charge de travail qui « sonne comme du LLM » est en fait un moteur de règles structuré; la tâche de prédiction qui « a besoin d'apprentissage profond » veut en réalité du gradient boosting sur de meilleures caractéristiques.
Le résultat de la découverte est un sommaire écrit : la décision, la référence de base, les approches candidates, les données, l'ordre de grandeur approximatif et les critères d'arrêt. Signable; révisable; auditable.
01 · Entraînement
01
Entraînement
Pipelines reproductibles dans Databricks, SageMaker ou Azure ML. Jeux de données versionnés, caractéristiques enregistrées, expériences suivies. Chaque modèle a une lignée.
02 · Évaluation
02
Évaluation
Évaluations hors ligne sur un jeu de référence + tests réservés; évaluations de sécurité / red-team; intervalles de confiance statistiques sur la métrique principale. Aucun modèle n'est promu sans avoir réussi.
03 · Déploiement
03
Déploiement
Déploiements canari. Exécutions fantômes. Bleu-vert pour les modèles en ligne. Rafraîchissement par lots pour les modèles de prévision. Chaque déploiement est réversible en un clic.
04 · Surveillance
04
Surveillance
Détection de dérive sur les entrées, les sorties et les décisions en aval. Tableaux de bord de qualité. Files de révision humaine pour les prédictions à faible confiance. Des alertes qui réveillent l'équipe de garde.
Un système d'IA n'est utile que lorsqu'il vit à l'intérieur du flux de travail de l'exploitant. Nous intégrons les modèles derrière une API versionnée, avec journalisation structurée, accès basé sur les rôles et un panneau de preuves que l'exploitant peut auditer.
Du côté LLM, nous livrons des contrats d'utilisation d'outils, des schémas de sortie (Pydantic côté serveur; Zod côté interface), la mise en cache des invites et des replis gracieux. Du côté ML, nous livrons des prédictions par lots vers votre entrepôt de données, l'inférence en ligne derrière une passerelle d'API et un magasin de caractéristiques auquel le modèle se fie.
Nous bâtissons aussi la surface humaine — le tableau de bord, les alertes, les contrôles de dérogation, la file de révision. Le but est l'aide à la décision, pas le remplacement de la décision.
Vocabulaire d'intégration
- API versionnée (REST + OpenAPI)
- Contrat d'utilisation d'outils (LLM)
- Schémas de sortie (Pydantic / Zod)
- Politique de mise en cache des invites
- Replis et disjoncteurs
- RBAC + journal d'audit
- Panneau de preuves pour révision par l'exploitant
- Dérogation et humain dans la boucle
Partenaires de modèles de base
Anthropic (Claude), OpenAI, Cohere, Azure AI Foundry, AWS Bedrock.
Claude
OpenAI
Cohere
Azure AI Foundry
AWS Bedrock
Plateformes de ML
Databricks, Azure ML, SageMaker, Vertex AI.
Databricks
Azure ML
SageMaker
Vertex AI
Cadriciels
PyTorch, scikit-learn, XGBoost, LightGBM, transformers, sentence-transformers, LangGraph (là où l'orchestration le justifie).
PyTorch
XGBoost
LightGBM
LangGraph
Données et infrastructure
Snowflake, PostgreSQL + pgvector, Pinecone, Weaviate, Parquet, Apache Spark, Airflow, Kubeflow.
Snowflake
pgvector
Pinecone
Airflow