Glossaire IA générative — 50+ termes définis

Fondamentaux de l'IA générative

Intelligence artificielle

Ensemble de techniques permettant à une machine d'imiter des fonctions cognitives humaines comme l'apprentissage, le raisonnement ou la perception. L'IA regroupe des approches très diverses — règles expertes, machine learning, deep learning — dont l'IA générative est la forme la plus récente et la plus visible.

IA générative

Branche de l'IA capable de produire du contenu nouveau — texte, image, code, audio — à partir d'exemples d'entraînement et d'une instruction utilisateur. Elle repose sur des modèles de fondation entraînés sur des volumes massifs de données et accessibles via API.

LLM (grand modèle de langage)

Modèle de deep learning entraîné sur de vastes corpus de texte pour comprendre et générer du langage naturel. GPT-4, Claude et Gemini sont des exemples de LLM. Leur taille — mesurée en milliards de paramètres — détermine en partie leurs capacités. Voir nos solutions chatbot & RAG

Modèle de fondation

Grand modèle pré-entraîné sur des données massives, conçu pour être spécialisé ou affiné pour des cas d'usage variés sans repartir de zéro. Les modèles de fondation réduisent considérablement le coût et le délai de mise en œuvre de projets IA en entreprise.

GPT

Architecture de réseau de neurones basée sur les transformers, popularisée par OpenAI. Signifie Generative Pre-trained Transformer. GPT-3.5, GPT-4 et GPT-4o sont les versions successives qui ont démocratisé l'accès aux LLM grand public et en entreprise.

Token

Unité de base traitée par un LLM : fragment de mot ou signe de ponctuation. En français, un mot courant équivaut à environ 1,3 token. Le coût et la vitesse d'un modèle se mesurent en nombre de tokens consommés, ce qui rend la gestion du prompt déterminante pour le TCO.

Prompt

Instruction ou question soumise à un modèle d'IA pour obtenir une réponse. La qualité du prompt détermine en grande partie la pertinence de la sortie. Un prompt peut inclure un contexte, des exemples, des contraintes de format et un rôle assigné au modèle.

Prompt engineering

Discipline consistant à concevoir et optimiser les instructions transmises à un LLM pour obtenir des résultats précis, cohérents et exploitables. Elle inclut des techniques comme le few-shot prompting, le chain-of-thought ou les system prompts. Cadrons votre stratégie IA

Hallucination

Phénomène par lequel un LLM génère des informations factuellement fausses présentées avec assurance. Les hallucinations résultent du fonctionnement statistique des modèles. La détection et la réduction des hallucinations — notamment via RAG et guardrails — sont un enjeu clé en production.

Contexte (fenêtre de contexte)

Nombre maximal de tokens que le modèle peut traiter simultanément — entrée et sortie confondues. Une fenêtre large (128 000 tokens ou plus) permet d'analyser de longs documents en une seule requête et réduit la nécessité d'un découpage complexe.

Température

Paramètre entre 0 et 2 qui règle le caractère aléatoire des réponses d'un LLM. Une valeur basse (0–0,3) favorise la précision et la reproductibilité, utile pour les tâches analytiques. Une valeur élevée (0,7–1,2) favorise la créativité et la diversité des réponses.

Multimodal

Qualifie un modèle capable de traiter simultanément plusieurs types de données : texte, image, audio, vidéo. GPT-4o et Gemini sont des modèles multimodaux. Cette capacité ouvre des cas d'usage d'analyse documentaire complexe (factures, plans, diagrammes).

Techniques & architectures

RAG

Retrieval-Augmented Generation : technique qui enrichit les réponses d'un LLM en lui fournissant des documents pertinents récupérés en temps réel depuis une base de connaissances. Le RAG réduit les hallucinations, ancre les réponses dans vos données et évite le coût d'un fine-tuning. Découvrir nos chatbots RAG

Embedding

Représentation numérique (vecteur) d'un texte, d'une image ou d'un autre contenu dans un espace mathématique à haute dimension. Deux contenus sémantiquement proches ont des vecteurs proches, ce qui permet une recherche par similarité plutôt que par mots-clés exacts.

Base vectorielle

Base de données spécialisée dans le stockage et la recherche d'embeddings par similarité sémantique. Pinecone, Chroma, Weaviate ou pgvector en sont des exemples. Elle constitue le composant central d'une architecture RAG.

Fine-tuning

Ré-entraînement ciblé d'un modèle de fondation sur un corpus spécialisé pour lui faire adopter un style, un vocabulaire métier ou une expertise spécifique. Plus coûteux que le RAG, il est pertinent quand le comportement du modèle doit être profondément modifié. Voir notre offre intégration & ingénierie

RLHF

Reinforcement Learning from Human Feedback : technique d'alignement où des évaluateurs humains notent les réponses du modèle pour l'orienter vers des sorties plus utiles, honnêtes et inoffensives. C'est la méthode utilisée pour affiner ChatGPT et Claude.

Transformer

Architecture de réseau de neurones introduite en 2017 dans l'article "Attention is All You Need". Fondée sur le mécanisme d'attention, elle permet de traiter des séquences longues en parallèle. Elle est à la base de la quasi-totalité des grands modèles de langage actuels.

Agent IA

Système autonome qui utilise un LLM pour planifier et exécuter des tâches en plusieurs étapes, en appelant des outils externes (API, bases de données, navigateur). Un agent peut déléguer à d'autres agents, gérer des états et s'adapter dynamiquement à l'avancement de la tâche. Découvrir nos agents IA sur mesure

Function calling

Capacité d'un LLM à détecter qu'une requête nécessite l'appel d'une fonction ou d'une API externe et à structurer les paramètres correspondants en JSON. C'est le mécanisme fondamental qui permet aux agents IA d'interagir avec les systèmes d'information.

Chain-of-thought

Technique de prompting qui demande au modèle de décomposer son raisonnement étape par étape avant de répondre, en explicitant chaque inférence intermédiaire. Elle améliore significativement la précision sur les tâches complexes de raisonnement, de calcul ou d'analyse.

Distillation

Processus de compression où un petit modèle (élève) apprend à reproduire le comportement d'un grand modèle (enseignant), en s'entraînant sur ses sorties. Permet d'obtenir un modèle léger et rapide conservant l'essentiel des capacités de son prédécesseur.

Quantization

Technique de réduction de la taille d'un modèle en diminuant la précision numérique de ses poids (ex. de 32 bits à 4 bits). Elle permet son exécution sur des machines moins puissantes ou en local, au prix d'une légère dégradation des performances.

Guardrails

Mécanismes de contrôle placés en entrée et en sortie d'un LLM pour filtrer les requêtes ou réponses indésirables — contenu toxique, fuite de données sensibles, réponses hors périmètre. Ils constituent une couche de sécurité essentielle en déploiement entreprise.

Déploiement & MLOps

POC (preuve de concept)

Prototype fonctionnel à périmètre restreint, développé en quelques semaines pour valider la faisabilité technique et la valeur métier d'un projet avant d'industrialiser. Un POC réussi réduit le risque des investissements suivants. Cadrons votre POC IA

MLOps

Ensemble de pratiques, d'outils et de processus pour industrialiser le cycle de vie des modèles de machine learning : développement, tests, déploiement, monitoring et mise à jour continue. Inspiré des pratiques DevOps, il vise à réduire la friction entre data science et production. Notre offre intégration & ingénierie

LLMOps

Extension des pratiques MLOps spécifique aux grands modèles de langage, intégrant la gestion des versions de prompts, l'évaluation des sorties, le contrôle des coûts au token et la surveillance des dérives de comportement en production.

API

Interface de programmation applicative permettant à deux logiciels de communiquer. Les LLM sont généralement exposés via une API REST que vos applications appellent à la demande. L'architecture API-first facilite l'intégration au système d'information existant.

Inférence

Phase d'utilisation d'un modèle entraîné pour générer une réponse à partir d'une entrée. Distincte de la phase d'entraînement, l'inférence est continue en production. Le coût et la latence d'inférence sont les principaux facteurs de dimensionnement et de budgétisation.

Latence

Temps écoulé entre l'envoi d'une requête à un LLM et la réception du premier token de réponse. La latence est critique pour les cas d'usage interactifs (assistants, chatbots). Elle dépend de la taille du modèle, de l'infrastructure et de la charge sur les serveurs.

Coût au token

Unité de facturation des API LLM exprimée en dollars ou euros par million de tokens traités en entrée et en sortie. Il détermine directement le coût total de possession (TCO) d'une solution IA et varie d'un facteur 100 entre les modèles du marché.

On-premise vs cloud

Choix d'hébergement d'un modèle : en interne sur vos serveurs (on-premise) pour maîtriser les données et éviter la dépendance à un fournisseur, ou sur une infrastructure tierce (cloud) pour la flexibilité, la scalabilité et l'accès aux derniers modèles.

Observabilité

Capacité à surveiller en temps réel le comportement d'un système IA en production : logs de requêtes, métriques de qualité, traces d'exécution et alertes permettant de détecter les dérives, les erreurs et les abus avant qu'ils n'impactent les utilisateurs.

Évaluation (eval)

Processus de mesure systématique de la qualité des sorties d'un LLM sur un jeu de tests représentatif des cas d'usage réels. Indispensable avant la mise en production, après chaque changement de modèle ou de prompt, et en surveillance continue.

Données d'entraînement

Corpus de textes, images ou autres contenus sur lequel un modèle apprend ses paramètres. Leur qualité, leur représentativité et leur conformité au RGPD conditionnent directement les performances et la sécurité juridique du modèle en production.

Vectorisation

Processus de conversion de documents textuels en embeddings numériques avant leur indexation dans une base vectorielle. C'est l'étape de préparation clé dans la construction d'un pipeline RAG : la qualité de la segmentation et du modèle d'embedding impacte directement la pertinence des réponses.

Réglementaire & conformité

AI Act

Règlement européen sur l'intelligence artificielle (UE 2024/1689) qui classe les systèmes d'IA par niveau de risque et impose des obligations de conformité aux fournisseurs et déployeurs. Entré en vigueur en août 2024, il s'applique progressivement jusqu'en 2027. Notre accompagnement conformité IA

RGPD

Règlement Général sur la Protection des Données (UE 2016/679) : cadre juridique européen régissant la collecte, le traitement et la conservation des données personnelles. Tout projet IA traitant des données d'utilisateurs européens doit en respecter les principes. Cadrons la conformité de votre projet

nLPD (Suisse)

Nouvelle Loi fédérale suisse sur la Protection des Données, entrée en vigueur le 1er septembre 2023. Elle aligne la Suisse sur le niveau de protection du RGPD européen et s'impose à tout projet IA traitant des données de personnes domiciliées en Suisse.

Système d'IA à haut risque

Catégorie définie par l'AI Act pour les systèmes utilisés dans des domaines sensibles : emploi, crédit, santé, justice, infrastructure critique. Ils sont soumis à des exigences renforcées de transparence, de documentation, d'audit et de supervision humaine.

Données personnelles

Toute information permettant d'identifier directement ou indirectement une personne physique : nom, email, adresse IP, identifiant de cookie. Leur traitement dans un contexte IA est strictement encadré par le RGPD et la nLPD suisse.

Anonymisation

Transformation irréversible de données personnelles de façon à rendre impossible toute ré-identification, même en croisant d'autres sources. Les données véritablement anonymisées sortent du champ d'application du RGPD, à la différence de la pseudonymisation.

Souveraineté des données

Capacité d'une organisation à contrôler où ses données sont hébergées, traitées et à qui elles sont accessibles. Cet enjeu est central lors du choix entre cloud public américain et solutions on-premise ou cloud souverain européen.

Transparence algorithmique

Obligation pour un système d'IA d'expliquer ses décisions ou recommandations de manière compréhensible pour les utilisateurs et les régulateurs. L'AI Act la rend obligatoire pour les systèmes à haut risque et les modèles d'IA générative grand public.

Biais algorithmique

Erreur systématique d'un modèle résultant de données d'entraînement non représentatives ou d'hypothèses de conception, pouvant produire des résultats discriminatoires selon le genre, l'origine ou l'âge. Sa détection et sa correction font partie des obligations de l'AI Act.

IA de confiance

Concept promu par la Commission européenne depuis 2019 désignant une IA licite (conforme au droit), éthique (respectueuse des valeurs fondamentales) et robuste (fiable techniquement). Il constitue le cadre de référence des politiques IA de nombreuses organisations.

Métier & organisation

ROI

Return on Investment : rapport entre les gains générés par un projet IA (temps économisé, erreurs évitées, chiffre d'affaires additionnel) et les coûts engagés (développement, infrastructure, formation, maintenance). Son estimation préalable est un jalon clé du cadrage stratégique. Estimer le ROI de votre projet IA

ESN

Entreprise de Services du Numérique : société qui met à disposition de ses clients des experts IT en régie ou au forfait. Une ESN IA se spécialise dans les profils data science, ingénierie LLM et MLOps, souvent plus difficiles à recruter directement. Découvrir notre ESN IA

Régie

Mode de prestation où un expert est mis à disposition du client pour travailler sous sa direction opérationnelle, facturé à la journée ou au mois. La régie convient aux projets longs ou évolutifs où le client souhaite piloter directement les travaux.

Forfait

Mode de prestation où le prestataire s'engage sur un livrable défini pour un prix et un délai fixes, avec une obligation de résultat. Le forfait convient aux projets bien cadrés (ex. développement d'un POC ou d'une solution IA clé en main).

Conduite du changement

Ensemble des actions d'accompagnement humain et organisationnel déployées pour faciliter l'adoption d'un nouveau système ou d'une nouvelle pratique IA par les équipes. Sans conduite du changement, les meilleures solutions IA restent sous-utilisées.

Cas d'usage

Situation concrète dans laquelle l'IA apporte une valeur mesurable à un processus métier spécifique. L'identification et la priorisation des cas d'usage — selon leur ROI, leur faisabilité et leur risque — est la première étape de tout projet IA sérieux.

Acculturation IA

Processus de montée en compréhension et en compétences pratiques de l'IA pour les collaborateurs non-techniques, visant à réduire les freins, corriger les idées reçues et identifier des opportunités d'usage dans leur quotidien métier.

Gouvernance de l'IA

Cadre organisationnel définissant qui décide, qui contrôle et qui est responsable des systèmes d'IA en production : politiques d'usage, rôles et responsabilités, comités de validation, processus d'audit et de mise à jour des modèles.

Copilote (Copilot)

Assistant IA intégré à un outil existant (Microsoft 365, GitHub, Salesforce…) pour augmenter la productivité de l'utilisateur sans remplacer son jugement. Le modèle copilote maintient l'humain dans la boucle décisionnelle. Déployer Copilot en entreprise

ChatGPT Enterprise

Version de ChatGPT dédiée aux entreprises, offrant des garanties de confidentialité des données (non utilisées pour l'entraînement), un contexte étendu, un SSO, des contrôles d'administration centralisés et un SLA. Notre accompagnement ChatGPT Enterprise

Productivité augmentée

Gain de capacité de traitement ou de qualité de travail obtenu grâce à l'assistance de l'IA, sans suppression de poste mais avec redistribution des tâches répétitives vers les activités à plus forte valeur ajoutée. C'est l'objectif principal de la plupart des projets IA en entreprise.

Time-to-value

Délai entre le démarrage d'un projet IA et la première valeur métier mesurable. Raccourcir ce délai via un POC bien cadré et des itérations courtes est un objectif central de notre démarche, pour maintenir l'engagement des équipes et justifier les investissements. Accélérer votre time-to-value

Glossaire de l'IA générative