Cette page a été traduite automatiquement. La version anglaise fait foi. Voir en anglais
§ Logiciels · 03 · Intelligence · Phare

Une IA qui produit des résultats — pas des présentations.

Nous concevons et déployons une IA qui aboutit en production. Des copilotes propulsés par des LLM, des modèles prédictifs et des pipelines de ML — sélectionnés, bâtis, évalués, déployés et surveillés par une équipe principale qui assume le système durant sa première année d'exploitation.

Service
03 sur 06 · Phare
Partenaires de modèles de base
Anthropic · OpenAI · Cohere
Plateformes infonuagiques
Azure AI Foundry · AWS Bedrock · Databricks
Collaboration
Dirigée par un partenaire principal
§ Capacités

Ce que nous bâtissons.

01 · Copilotes LLM

Assistants adaptés
au domaine

Des assistants adaptés au domaine pour les exploitants d'usine, les équipes juridiques, les analystes et les ingénieurs de terrain. Augmentés par la récupération, avec citations à l'appui et une trace de réponse auditable.

RAG Utilisation d'outils Journal d'audit
02 · Intelligence prédictive

Prédiction de défaillances
et détection d'anomalies

Prédiction de défaillances, détection d'anomalies et modèles de prévision entraînés sur des données opérationnelles — signatures vibratoires, télémétrie, flux de transactions, historiques de réclamations.

Séries temporelles Gradient boosting Détection d'anomalies
03 · Pipelines MLOps

L'échafaudage
qui garde l'IA en vie

Infrastructure d'entraînement, d'évaluation, de déploiement et de surveillance. Exécutions reproductibles, modèles enregistrés et retours en arrière. L'échafaudage ennuyeux qui maintient l'IA en production pendant des années.

Reproductible Registre de modèles Retours en arrière
04 · Intégration de modèles de base

Câblage de production
pour Claude, GPT, Cohere

Câblage de production pour Anthropic Claude, OpenAI, Cohere et Azure AI Foundry — avec mise en cache des invites, utilisation d'outils, sorties structurées et politiques de repli.

Claude OpenAI Mise en cache des invites
05 · Développement de modèles sur mesure

Quand les modèles de base
ne sont pas la réponse

Quand les modèles de base ne sont pas la bonne réponse : ML classique, gradient boosting, apprentissage profond, séries temporelles et projets pilotes d'apprentissage par renforcement — lorsque c'est justifié.

XGBoost PyTorch Pilotes RL
06 · Évaluation et sécurité

Évaluations, red-team,
conformité aux politiques

Évaluations hors ligne et en ligne, jeux de référence, boucles de révision humaine, red-teaming et conformité aux politiques — intégrés au pipeline de déploiement, pas en après-coup.

Jeux de référence Red-team Révision humaine
§ Découverte

Nous ne commençons pas par le modèle. Nous commençons par la décision.

Si nous ne pouvons pas écrire les critères d'arrêt, nous ne pouvons pas justifier la construction.

Chaque collaboration en IA chez Droz débute par un exercice de cadrage du problème d'une à deux semaines. L'objectif est de cerner la décision que l'IA viendra changer — un plan de maintenance, un acheminement de triage, l'arbitrage d'une réclamation, l'évaluation d'un approvisionnement — et le coût de mal prendre cette décision aujourd'hui.

À partir de là, nous remontons jusqu'aux données, à la sélection du modèle, à l'intégration et au déploiement. La plupart des collaborations éliminent un ou deux faux départs dans cette phase : la charge de travail qui « sonne comme du LLM » est en fait un moteur de règles structuré; la tâche de prédiction qui « a besoin d'apprentissage profond » veut en réalité du gradient boosting sur de meilleures caractéristiques.

Le résultat de la découverte est un sommaire écrit : la décision, la référence de base, les approches candidates, les données, l'ordre de grandeur approximatif et les critères d'arrêt. Signable; révisable; auditable.

§ Approche

Modèles de base ou sur mesure — quoi utiliser et quand.

A · Modèles de base

Claude, GPT, Cohere, Azure AI Foundry

  • La tâche est riche en langage (rédaction, résumé, classification de texte libre, conversation).
  • Vous devez livrer en semaines, pas en trimestres.
  • La souplesse de schéma importe plus que le coût de latence.
  • La génération augmentée par récupération (RAG) fournit au modèle le contexte de domaine dont il a besoin.
B · Modèles sur mesure

Entraînés, possédés, déterministes

  • La tâche est structurée (prévision, évaluation, détection d'anomalies, vision).
  • La latence d'inférence doit être sous les 50 ms ou le coût doit être déterministe.
  • Les données d'entraînement existent et sont suffisamment volumineuses (généralement plus de 10 000 exemples étiquetés).
  • Vous avez besoin de la pleine propriété des poids du modèle et du pipeline d'entraînement.
Hybride · le cas courant

Le modèle de base orchestre le flux de travail; les modèles sur mesure prennent en charge les sous-tâches déterministes. Nous concevons les deux moitiés et le contrat qui les relie.

§ MLOps

Entraînement → Évaluation → Déploiement → Surveillance.

01 · Entraînement
01
Entraînement

Pipelines reproductibles dans Databricks, SageMaker ou Azure ML. Jeux de données versionnés, caractéristiques enregistrées, expériences suivies. Chaque modèle a une lignée.

02 · Évaluation
02
Évaluation

Évaluations hors ligne sur un jeu de référence + tests réservés; évaluations de sécurité / red-team; intervalles de confiance statistiques sur la métrique principale. Aucun modèle n'est promu sans avoir réussi.

03 · Déploiement
03
Déploiement

Déploiements canari. Exécutions fantômes. Bleu-vert pour les modèles en ligne. Rafraîchissement par lots pour les modèles de prévision. Chaque déploiement est réversible en un clic.

04 · Surveillance
04
Surveillance

Détection de dérive sur les entrées, les sorties et les décisions en aval. Tableaux de bord de qualité. Files de révision humaine pour les prédictions à faible confiance. Des alertes qui réveillent l'équipe de garde.

§ Intégration

Le modèle est un service. Nous câblons le service dans votre entreprise.

Un système d'IA n'est utile que lorsqu'il vit à l'intérieur du flux de travail de l'exploitant. Nous intégrons les modèles derrière une API versionnée, avec journalisation structurée, accès basé sur les rôles et un panneau de preuves que l'exploitant peut auditer.

Du côté LLM, nous livrons des contrats d'utilisation d'outils, des schémas de sortie (Pydantic côté serveur; Zod côté interface), la mise en cache des invites et des replis gracieux. Du côté ML, nous livrons des prédictions par lots vers votre entrepôt de données, l'inférence en ligne derrière une passerelle d'API et un magasin de caractéristiques auquel le modèle se fie.

Nous bâtissons aussi la surface humaine — le tableau de bord, les alertes, les contrôles de dérogation, la file de révision. Le but est l'aide à la décision, pas le remplacement de la décision.

Vocabulaire d'intégration
  • API versionnée (REST + OpenAPI)
  • Contrat d'utilisation d'outils (LLM)
  • Schémas de sortie (Pydantic / Zod)
  • Politique de mise en cache des invites
  • Replis et disjoncteurs
  • RBAC + journal d'audit
  • Panneau de preuves pour révision par l'exploitant
  • Dérogation et humain dans la boucle
§ Pile technologique

Outils et technologies.

Partenaires de modèles de base

Anthropic (Claude), OpenAI, Cohere, Azure AI Foundry, AWS Bedrock.

Claude OpenAI Cohere Azure AI Foundry AWS Bedrock
Plateformes de ML

Databricks, Azure ML, SageMaker, Vertex AI.

Databricks Azure ML SageMaker Vertex AI
Cadriciels

PyTorch, scikit-learn, XGBoost, LightGBM, transformers, sentence-transformers, LangGraph (là où l'orchestration le justifie).

PyTorch XGBoost LightGBM LangGraph
Données et infrastructure

Snowflake, PostgreSQL + pgvector, Pinecone, Weaviate, Parquet, Apache Spark, Airflow, Kubeflow.

Snowflake pgvector Pinecone Airflow

Renvois — Profils complets des partenaires · Technologies complètes · Couche infonuagique sous-jacente.

§ Travaux de référence

Où cela tourne en production.

§ Industries desservies
Où l'IA se déploie.

Six secteurs représentatifs ci-dessous. La liste complète des 17 se trouve dans l'aperçu des industries.

§ Collaborez avec Droz · Intelligence
Une IA qui devrait déjà être en production ? Nous l'architecturons, la bâtissons, l'évaluons, la déployons et assumons la rotation de garde.