Transcription d'entretien — IA Whisper, RGPD, NVivo

L'essentiel à retenir

●Précision Tier 1 en français : 93-95 % sur audio propre. Comparable à l'anglais. La précision réelle dépend principalement de la qualité d'enregistrement (micros, salle, ambiance), pas de l'accent ou de la variante régionale.
●5-10 minutes pour un entretien d'une heure. Vs ~6 heures pour une transcription manuelle. Économie temps massive pour les chercheurs ayant 20-100 entretiens à analyser.
●Hébergement AWS eu-west-2 (Londres) — résidence UE. Conforme RGPD article 44 (transferts internationaux). Différenciateur clé vs Otter, Trint et Sonix (hébergés aux USA).
●Pas d'entraînement IA sur vos enregistrements. Engagement explicite, pas une option opt-out. Important pour sources confidentielles en journalisme et entretiens sensibles en recherche.
●Export vers tous les CAQDAS courants. DOCX pour NVivo et ATLAS.ti, JSON pour MAXQDA, TXT pour Sphinx et Modalisa (logiciels français), format IRaMuTeQ pour analyse statistique de discours.
●Étiquetage automatique des locuteurs (diarisation). Speaker 1, Speaker 2… renommés dans l'éditeur (Enquêteur, Marie, Pierre). Précision 90-95 % pour 2-4 locuteurs sur micros séparés, 75-85 % pour focus groups multi-locuteurs.
●Tarifs : 0,003 € à 0,01 €/minute. 100-300× moins cher qu'un transcripteur humain français (1,50-3 €/min). Plan Pro à 10 $/mois couvre 41 entretiens d'une heure — volume typique d'une thèse ou d'une enquête journalistique complète.

Comment transcrire un entretien (3 étapes)

Workflow identique quel que soit le contexte — entretien individuel, focus group, entretien téléphonique, ou interview à distance.

1
Téléchargez l'enregistrement
Glissez votre fichier audio (MP3, WAV, M4A) ou vidéo (MP4, MOV) dans VexaScribe. Limite 5 Go et 10 heures par fichier. Compatible avec Zoom H-series, smartphones, micros USB, Riverside, SquadCast pour entretien à distance.
2
L'IA transcrit en français
Whisper Large-v3 traite l'audio. Un entretien d'une heure se transcrit en 5-10 minutes avec étiquetage automatique des locuteurs et horodatages au mot près. La langue est détectée automatiquement — le français de France, du Québec, de Belgique et de Suisse sont gérés.
3
Éditez et exportez vers CAQDAS
Renommez les locuteurs (Enquêteur → Marie, Pierre…), corrigez les noms propres, anonymisez si nécessaire. Exportez DOCX pour NVivo/ATLAS.ti, JSON pour MAXQDA, TXT pour Sphinx/Modalisa. Délai typique : entretien prêt pour codage 30-60 minutes après l'enregistrement.

Cas d'usage par profession

La transcription IA d'entretien sert six familles d'usage en France, chacune avec ses contraintes propres (consentement, anonymisation, conservation).

Journaliste d'investigation

Mediapart, Le Monde, Le Figaro, Radio France

Sources confidentielles, entretiens téléphoniques, interviews en off. Workflow : enregistrement smartphone ou enregistreur dédié → transcription VexaScribe → relecture et anonymisation → archivage sécurisé. Critère décisif : aucun entraînement IA sur les enregistrements (protection des sources).

Chercheur en sciences sociales (entretien semi-directif)

Sociologie, anthropologie, sciences politiques, sciences de l'éducation

Corpus de 20-100 entretiens semi-directifs ou compréhensifs pour thèse ou article. Workflow : transcription IA en lot → import DOCX dans NVivo ou ATLAS.ti → codage thématique. Économise 80 % du temps vs transcription manuelle (~6h/h d'entretien → ~30 min/h pour relecture).

Chercheur en UX et design

Entretiens utilisateurs, tests d'usabilité, focus groups produit

Cycles courts de 10-20 entretiens utilisateurs par phase de recherche. Workflow : enregistrement Zoom/Teams → transcription en 1h après l'entretien → extraction des verbatims clés pour rapport de recherche. AI summaries (plans payants) pré-extraient les insights.

Responsable RH

Entretiens d'embauche, entretiens annuels, sortie collaborateurs

Documenter les entretiens d'embauche pour traçabilité, ou les entretiens annuels avec accord du salarié (Code du travail article L1222-4). Workflow : enregistrement avec consentement écrit → transcription → archivage dans le dossier salarié. Anonymisation requise si publication interne.

Avocat / juriste

Entretien client préparatoire, interrogatoire informel, enquêtes internes

Transcription IA pour analyse préparatoire (non admissible en cour). Workflow : transcription → analyse stratégique → si dépôt formel requis, sous-traitance à transcripteur assermenté pour version certifiée. VexaScribe = research-grade uniquement.

Consultant / coach

Entretiens diagnostic, séances de coaching, audits internes clients

Documentation de séances pour suivi client. Workflow : enregistrement avec consentement → transcription → extraction des points clés et plans d'action via résumé IA → rapport client. Délai typique : transcription disponible 10 min après fin de séance.

Précision IA pour entretiens en français

Le français est en Tier 1 de Whisper Large-v3 — environ 5-7 % de Word Error Rate sur audio propre, soit 93-95 % de précision. La précision réelle dépend principalement des conditions d'enregistrement.

Type d'enregistrement	Précision	Temps de relecture
Entretien individuel en studio (micros lavalier)	94-97 %	5-10 min/h
Entretien semi-directif au bureau (deux micros)	92-95 %	10-15 min/h
Entretien Zoom/Teams (micro intégré)	88-92 %	15-20 min/h
Entretien terrain (smartphone, environnement contrôlé)	85-90 %	20-25 min/h
Entretien téléphonique (qualité 8 kHz)	78-85 %	25-35 min/h
Focus group 4-6 participants (micros boundary)	82-88 %	25-35 min/h
Entretien compréhensif avec superpositions fréquentes	82-88 %	25-30 min/h

Les noms propres d'informateurs, lieux et organisations restent à 20-30 % d'erreur. Pour les benchmarks Whisper détaillés voir précision Whisper (en anglais).

RGPD, CNIL et consentement

Les entretiens enregistrés contiennent par définition des données à caractère personnel — voix, propos, parfois informations identifiantes. Le RGPD et les recommandations CNIL encadrent strictement leur traitement, en particulier pour la recherche scientifique et le journalisme.

Structure responsable / sous-traitant

Vous (chercheur, journaliste, RH) êtes le responsable de traitement au sens RGPD article 4. VexaScribe agit comme sous-traitant — nous traitons les données sur vos instructions, sans réutilisation. Cette structure est la configuration standard recommandée par la CNIL pour les services externes de transcription.

Consentement préalable

Information écrite préalable obligatoire : finalité de la recherche, durée de conservation, droits d'accès et d'effacement, mention du sous-traitant utilisé (VexaScribe, hébergement AWS UE). Consentement signé pour entretiens de recherche destinés à publication. Modèles de consentement disponibles auprès du DPO de votre université ou via les guides CNIL pour la recherche.

Hébergement et résidence des données

AWS eu-west-2 (Londres) — toutes les données restent dans l'Union européenne. Chiffrement TLS 1.2+ en transit, AES-256 au repos. Pas de transfert vers les États-Unis. Conforme RGPD article 44 et compatible avec les exigences universitaires françaises sur la protection des données de recherche.

Durée de conservation et suppression

Vous contrôlez la conservation. Suppression individuelle de fichiers ou de compte entier depuis le tableau de bord. La CNIL recommande pour la recherche : durée de conservation alignée sur la durée du projet + période d'archivage légal si publication. Les enregistrements anonymisés peuvent être conservés plus longtemps.

Pas d'entraînement IA sur vos données

Engagement contractuel explicite — VexaScribe n'utilise pas les enregistrements ou transcriptions des utilisateurs pour entraîner des modèles d'IA. Différence importante avec certains services concurrents qui peuvent utiliser les données utilisateurs par défaut (configuration opt-in à vérifier).

Voir politique de confidentialité et conditions d'utilisation pour les engagements complets. La CNIL publie des guides spécifiques pour la recherche scientifique sur cnil.fr.

Export vers NVivo, ATLAS.ti, MAXQDA, Sphinx

Les exports VexaScribe sont compatibles avec tous les principaux logiciels CAQDAS (Computer-Assisted Qualitative Data Analysis Software) utilisés en France et internationalement, ainsi que les logiciels d'analyse de discours français.

Logiciel	Popularité en France	Format VexaScribe	Workflow d'import
NVivo (QSR International)	Très répandu (sociologie, sciences éducation)	DOCX	Fichier > Importer > Document. Locuteurs préservés comme attributs.
ATLAS.ti	Répandu (sciences politiques, anthropologie)	DOCX	Documents > Add documents > Word. Codage thématique direct.
MAXQDA	Répandu (sciences sociales, santé publique)	DOCX ou JSON	Import direct DOCX ; JSON pour timing au mot près sur extraits multimédia.
Sphinx Quali (Le Sphinx Développement)	Logiciel français — universités françaises et instituts d'étude	TXT	Importer texte > Document. Adapté à l'analyse mixte quali/quanti.
Modalisa (Kynos)	Logiciel français — recherche universitaire et marketing	TXT ou CSV	Importer documents textuels. Analyse lexicométrique intégrée.
IRaMuTeQ (logiciel libre)	Recherche académique française — analyse statistique de discours	TXT (corpus formaté)	Préparation du corpus avec marqueurs **_* pour locuteurs.

Pour le format SRT (entretien filmé en ethnographie visuelle ou entretien sur Zoom enregistré) voir générateur SRT.

Anonymisation des entretiens

L'anonymisation est requise avant publication des résultats de recherche, et fortement recommandée pour les sources journalistiques sensibles. Trois approches selon le niveau de protection requis.

Anonymisation manuelle (15-30 min/entretien)

Rechercher/Remplacer dans l'éditeur VexaScribe ou dans Word après export DOCX. Substituez chaque nom d'informateur par un pseudonyme cohérent (Informateur 1, Marie, Pierre…), chaque nom d'organisation par une description générique. Approche la plus contrôlable mais la plus chronophage.

Anonymisation semi-automatique avec NLP (5-10 min/entretien)

Utilisez spaCy (français) ou un outil NER pour détecter automatiquement les entités nommées (personnes, organisations, lieux), puis revue manuelle des suggestions. Workflow le plus efficace pour des corpus de 20+ entretiens en sciences sociales.

Anonymisation contextuelle (recommandée par la CNIL)

Au-delà des noms, retirer aussi les éléments contextuels potentiellement identifiants : poste exact (« directrice marketing de [grande entreprise sectorielle] »), ville précise, année et événement spécifiques. Critère RGPD : un tiers ne doit pas pouvoir réidentifier la personne à partir du texte publié. Approche obligatoire pour publication académique avec sujets vulnérables.

Le seuil d'anonymisation requis dépend du contexte de publication : un mémoire universitaire interne tolère moins de protection qu'une publication ouverte ou un article de presse à diffusion massive. Documentez votre démarche d'anonymisation dans la méthodologie pour traçabilité.

Comparatif des outils de transcription d'entretien

Six outils principaux pour la transcription d'entretiens en français. Critères clés : précision FR, hébergement de données (UE vs USA), formats d'export CAQDAS, et tarif effectif.

Outil	Modèle	Tarif	UE	Idéal pour
VexaScribe	Whisper Large-v3	2-20 $/mois	Oui (Londres)	Workflow recherche, journalisme et RH — meilleur rapport qualité/prix, hébergement UE, export multi-format
Authôt	Propriétaire (FR)	~0,20 €/min	Oui (France)	Petits volumes occasionnels — service français, paie au volume
Otter.ai	Propriétaire	16,99-30 $/mois	Non (USA)	Entretiens live (audio) — précision FR inférieure à Whisper sur tests indépendants
Trint	Propriétaire	60-100 $/mois	Variable	Salles de rédaction — workflow journalisme avec collaboration multi-rédacteurs
Sonix	Propriétaire	5 $/h PAYG ou abonnement	Non	Petits volumes ponctuels — paiement à l'heure d'audio
Transcripteur humain (Translated, freelance)	Humain	1,50-3 €/min (research-grade), 3-5 €/min (certifié)	Variable	Verbatim certifié pour usage juridique ou entretien hautement sensible

Tarifs vérifiés juin 2026. Voir aussi toutes les alternatives.

IA vs verbatim certifié

Deux approches très différentes selon l'usage final de la transcription. Le verbatim certifié reste nécessaire pour des cas précis ; l'IA suffit pour la grande majorité des usages.

Transcription IA (research-grade)

✓Précision 93-95 % sur français propre
✓5-10 min par heure d'entretien
✓0,003-0,01 €/min — 100-300× moins cher
✓Structure éditée (paragraphes, ponctuation)
⚠Pas admissible en cour

Idéal pour : recherche qualitative, journalisme, RH, entretiens UX, coaching, audit interne

Verbatim certifié (humain assermenté)

✓Précision 98-99 %, fidélité absolue à l'oral
✓Admissible en cour, valeur probante
✓Inclut hésitations, répétitions, faux départs
⚠12-48h de délai typique
⚠3-5 €/min — significativement plus cher

Nécessaire pour : déposition judiciaire, témoignage avec valeur probante, accord contractuel enregistré

Approche hybride courante en sciences sociales : transcription IA pour l'ensemble du corpus, relecture humaine ciblée sur les extraits destinés à citation directe. Atteint 90 % de la qualité verbatim à 5 % du coût.

Tarifs et estimation de coût

Tarification VexaScribe en équivalent volumes d'entretien. Calcul basé sur entretiens moyens de 60 minutes.

Plan	Prix	Minutes incluses	≈ Entretiens/mois	Pour qui ?
Essai gratuit	0 $	30 minutes uniques	1 entretien de 30 min	Tester avant de souscrire
Starter	2 $/mois	200 minutes/mois	3 entretiens de 60 min	Mémoire de master, stage RH ponctuel
Basic	5 $/mois	1 000 minutes/mois	16 entretiens de 60 min	Article académique, enquête journalistique courte
Pro	10 $/mois	2 500 minutes/mois	41 entretiens de 60 min	Thèse en sciences sociales, équipe RH active, projet de recherche annuel
Studio	20 $/mois	6 000 minutes/mois	100 entretiens de 60 min	Laboratoire de recherche, salle de rédaction, cabinet de conseil

Coût effectif sur le plan Pro : ~0,24 $ par entretien d'une heure. Voir détails complets sur la page tarifs.

Questions fréquentes

Comment transcrire un entretien en français ?

Téléchargez votre enregistrement (MP3, WAV, M4A, MP4 jusqu'à 5 Go et 10 heures) sur VexaScribe. Whisper Large-v3 d'OpenAI détecte automatiquement le français (Tier 1, précision 93-95 % sur audio propre) et génère une transcription complète en 5-10 minutes pour un entretien d'une heure. Sortie : transcription avec étiquetage automatique des locuteurs (Speaker 1, Speaker 2…), horodatages au mot près, export en TXT, DOCX, SRT, VTT, JSON. Compatible avec les principaux outils CAQDAS (NVivo, ATLAS.ti, MAXQDA, Sphinx). 30 minutes gratuites à l'inscription.

Quelle précision pour un entretien semi-directif ou compréhensif ?

Sur audio propre (deux locuteurs, micros séparés, salle calme), la précision atteint 93-95 % en français — comparable à l'anglais. Pour un entretien semi-directif typique en bureau ou en salle de réunion avec micro intégré (laptop, smartphone), la précision descend à 88-92 %. Les entretiens compréhensifs avec circulation libre des locuteurs et superpositions de paroles fréquentes baissent à 82-88 %. Les noms propres (informateurs, lieux, organisations) restent à 20-30 % d'erreur — toujours relire avant analyse qualitative ou citation publique.

Le RGPD est-il respecté pour des entretiens de recherche ?

Oui. VexaScribe stocke tous les fichiers sur AWS eu-west-2 (Londres), avec chiffrement TLS 1.2+ en transit et AES-256 au repos. Nous n'entraînons pas de modèles IA sur vos enregistrements. Pour la recherche universitaire française, vous restez le responsable de traitement au sens RGPD article 4 — VexaScribe agit comme sous-traitant. Vous gardez la maîtrise de la durée de conservation : suppression individuelle des fichiers ou compte entier depuis le tableau de bord. La CNIL recommande cette structure pour les enregistrements d'entretiens : sous-traitant avec stockage UE, suppression contrôlée par le chercheur, pas de réutilisation des données.

Combien coûte la transcription d'entretien par rapport au tarif français ?

VexaScribe : entre 0,003 € et 0,01 € par minute selon le plan (2 à 20 $/mois pour 200 à 6 000 minutes). Pour comparaison : Authôt (service français IA) facture environ 0,20 €/min ; les transcripteurs humains français facturent typiquement 1,50 à 3 €/min pour de l'entretien non-technique, et 3-5 €/min pour entretien spécialisé (médical, juridique). Sur le plan Pro VexaScribe (10 $/mois, 2 500 minutes), 41 heures d'entretien sont transcrites — soit le volume d'une thèse en sciences sociales ou d'une enquête journalistique complète, pour 0,24 $ par heure d'entretien.

L'export est-il compatible avec NVivo, ATLAS.ti, MAXQDA ?

Oui. Les exports VexaScribe sont compatibles avec tous les principaux CAQDAS utilisés en France et en Europe. (1) DOCX pour NVivo et ATLAS.ti : import direct via Fichier > Importer > Document, les locuteurs sont préservés comme attributs de codage. (2) JSON pour MAXQDA et workflow Python/R personnalisé : timing au mot près pour navigation rapide entre extrait et audio original. (3) TXT pour Sphinx (logiciel français d'analyse quali/quanti) et Modalisa (logiciel universitaire français). (4) SRT/VTT si vous travaillez avec de la vidéo (entretien filmé, ethnographie visuelle).

Comment gérer le consentement des informateurs (RGPD article 4) ?

Le consentement doit être obtenu avant l'enregistrement, conformément au RGPD article 4 et aux recommandations CNIL pour la recherche. VexaScribe ne fournit pas de formulaire de consentement type — c'est la responsabilité du chercheur ou du journaliste. Bonnes pratiques universellement reconnues en France : (1) Information écrite préalable (finalité de la recherche, durée de conservation, droits d'accès et d'effacement). (2) Consentement signé pour les entretiens enregistrés à des fins de recherche. (3) Anonymisation au moment de la transcription (remplacement des noms par pseudonymes). (4) Mention du sous-traitant utilisé (VexaScribe, AWS eu-west-2). Voir les recommandations CNIL pour la recherche scientifique.

Comment anonymiser les entretiens avant publication ?

Trois approches selon le degré de sensibilité. (1) Anonymisation manuelle — utilisez Rechercher/Remplacer dans l'éditeur VexaScribe ou dans Word après export DOCX. Remplacez tous les noms d'informateurs par des pseudonymes cohérents (Informateur 1, Marie, Pierre…). 15-30 minutes par entretien. (2) Anonymisation semi-automatique — utilisez un outil NLP comme spaCy (français) pour détecter automatiquement les entités nommées (personnes, organisations, lieux), puis revue manuelle. (3) Anonymisation par contexte — au-delà des noms, retirez aussi les éléments contextuels identifiants (poste exact, ville, année d'événement). Critère RGPD : un tiers ne doit pas pouvoir identifier la personne à partir du texte publié.

Quelle est la différence avec une transcription verbatim certifiée ?

Une transcription IA produite par VexaScribe est research-grade : 93-95 % de précision, structure éditée (paragraphes, ponctuation), idéale pour analyse qualitative, articles académiques, journalisme d'investigation. Une transcription verbatim certifiée est produite par un transcripteur humain assermenté : 98-99 % de précision, fidélité absolue à l'oral (incluant hésitations, répétitions, faux départs), assortie d'un cachet officiel pour usage juridique. Cas où le verbatim certifié reste nécessaire : dépositions judiciaires, témoignages avec valeur probante, accords contractuels enregistrés. Pour tous les autres cas, la transcription IA + relecture humaine donne 90 % de la qualité verbatim à 5 % du prix.

Peut-on transcrire un entretien collectif (focus group) ?

Oui. La diarisation automatique gère bien 2 à 10 locuteurs distincts. Pour un focus group de 6-8 participants avec un animateur, la précision de séparation des locuteurs est de 75-85 % en raison des superpositions fréquentes. Conseils pour améliorer : (1) Utilisez des micros boundary (table) à éviter l'echo, ou idéalement un micro par participant. (2) Demandez aux participants de se présenter au début (l'IA capture l'empreinte vocale pour mieux les séparer ensuite). (3) Rappelez la règle « un seul locuteur à la fois » — utile à la fois pour la diarisation et pour l'analyse qualitative postérieure.

Mes entretiens sont-ils utilisés pour entraîner des modèles IA ?

Non. VexaScribe n'entraîne pas de modèles d'intelligence artificielle sur les enregistrements ou transcriptions de ses utilisateurs. C'est un engagement explicite, inscrit dans les conditions d'utilisation — pas une option opt-out par défaut. Cette politique diffère de certains concurrents américains (notamment Otter.ai dans certaines configurations) qui peuvent utiliser les données utilisateurs par défaut pour améliorer leurs modèles. Pour les entretiens de recherche sensibles, sources confidentielles en journalisme, ou entretiens RH internes, cette garantie de non-réutilisation est essentielle.

Méthodologie & sources

Les chiffres de précision en français (5-7 % WER Tier 1, 93-95 % de précision sur audio propre) proviennent de (1) l'évaluation FLEURS française dans le papier technique Whisper d'OpenAI (septembre 2023), (2) reproductions sur Common Voice France, et (3) benchmarks internes VexaScribe sur 80 entretiens en français couvrant les types listés dans le tableau de précision. Word Error Rate calculé selon la formule NIST standard.

Les recommandations RGPD et CNIL référencées sont issues des guides publics de la Commission Nationale de l'Informatique et des Libertés (cnil.fr) sur la recherche scientifique et le traitement des données personnelles dans le cadre d'entretiens. Vérifiez les évolutions réglementaires régulièrement — la doctrine CNIL évolue avec les contentieux et les avis du Conseil européen de la protection des données (CEPD).

Tarifs concurrents (Authôt ~0,20 €/min, Otter $16,99-$30/mois, Trint $60-$100/mois, Sonix ~$5/h, transcription humaine 1,50-5 €/min) reflètent les prix publics affichés en juin 2026. Vérifiez sur les sites des éditeurs avant tout engagement.

VexaScribe est le produit derrière cette page ; les comparaisons aux autres outils visent à aider les chercheurs, journalistes et professionnels RH francophones à choisir l'outil adapté à leur cadre, pas à dénigrer la concurrence. Pour le processus éditorial complet voir standards éditoriaux.

Testez sur votre prochain entretien

30 minutes de transcription IA gratuites. Sans carte bancaire. Données hébergées en UE (Londres), pas d'entraînement IA sur vos enregistrements, conforme RGPD.

Commencer gratuitement →Voir les fonctionnalités

L'essentiel à retenir

Comment transcrire un entretien (3 étapes)

Téléchargez l'enregistrement

L'IA transcrit en français

Éditez et exportez vers CAQDAS

Cas d'usage par profession

Journaliste d'investigation

Chercheur en sciences sociales (entretien semi-directif)

Chercheur en UX et design

Responsable RH

Avocat / juriste

Consultant / coach

Précision IA pour entretiens en français

RGPD, CNIL et consentement

Structure responsable / sous-traitant

Consentement préalable

Hébergement et résidence des données

Durée de conservation et suppression

Pas d'entraînement IA sur vos données

Export vers NVivo, ATLAS.ti, MAXQDA, Sphinx

Anonymisation des entretiens

Anonymisation manuelle (15-30 min/entretien)

Anonymisation semi-automatique avec NLP (5-10 min/entretien)

Anonymisation contextuelle (recommandée par la CNIL)

Comparatif des outils de transcription d'entretien

IA vs verbatim certifié

Transcription IA (research-grade)

Verbatim certifié (humain assermenté)

Tarifs et estimation de coût

Questions fréquentes

Méthodologie & sources

Testez sur votre prochain entretien

Guides associés

Transcription podcast

Transcription audio en texte

Transcription de réunion

Prise de notes IA

Alternatives à Happy Scribe

Tarifs

Fonctionnalités

Transcription IA

Transcrire et traduire

Transcription vidéo en texte

Générateur de sous-titres SRT

Recherche qualitative (anglais)

Diarisation des locuteurs

MP3 et M4A en texte

Ajouter des sous-titres à une vidéo

Transcription gratuite — comparatif 2026

Interview transcription (anglais)