Transcription audio gratuite dans votre navigateur
Fait tourner VoxScriber Nano (open-source) dans votre navigateur — IA locale, jusqu'à 10 min par fichier, précision basique (~85%). Pour un usage professionnel, découvrez Premium.
La transcription s'effectue localement dans votre navigateur. Vous pouvez partager le résultat avec nous de façon optionnelle (avec consentement) pour améliorer le service. Limite : 10 min par fichier, précision ~85%.
Gratuit vs Premium — les différences
| Gratuit (navigateur) | Premium (cloud) | |
|---|---|---|
| Limite par fichier | 10 min | 10 horas |
| Précision | ~85% | >95% |
| Diarisation (qui parle) | ❌ | ✅ |
| Horodatages par mot | ❌ | ✅ |
| Support vidéo (MP4/MOV) | ❌ | ✅ |
| Formats d'export | TXT, SRT, VTT | DOCX, PDF, JSON… |
| Vitesse (1h audio) | ~2 min / 1h | ~2 min / 1h |
| Confidentialité | 100% local | ☁️ + 🔒 |
IA locale
La transcription s'effectue dans votre navigateur. Le partage avec nos serveurs est optionnel (avec consentement).
Rapide et local
Le traitement IA se fait directement dans votre navigateur, sans file d'attente.
99 langues
Détecte automatiquement la langue de votre audio.
Sans inscription
Commencez immédiatement, sans créer de compte.
Comment ça marche
Importez ou enregistrez l'audio
Glissez un fichier MP3, WAV, M4A, OGG ou utilisez votre microphone directement.
L'IA tourne sur votre appareil
Whisper AI se télécharge une fois et reste en cache. Pas d'attente la prochaine fois.
Copiez ou téléchargez le texte
Résultat en quelques secondes. Téléchargez en .txt ou copiez en un clic.
Quelle est la précision de la transcription dans le navigateur ?
La transcription dans le navigateur exécute le modèle Whisper d'OpenAI directement sur votre appareil via WebAssembly. Nous proposons trois tailles de modèle, et la précision dépend de celle que vous choisissez :
- Nano (~40 Mo) — Par défaut. Environ 85 % de précision sur une parole claire. Idéal pour les notes rapides, les messages vocaux et les brouillons. Le seul modèle qui fonctionne sur iOS.
- Mini (~150 Mo) — Environ 90 % de précision. Un bon compromis si votre appareil dispose de 4 Go ou plus de RAM et que vous avez besoin d'une sortie plus propre.
- Plus (~500 Mo) — L'option locale la plus précise, approchant 93 % sur un audio clair. Plus lent à télécharger et à exécuter ; idéal sur les ordinateurs de bureau avec 8 Go ou plus de RAM.
Ce qui réduit la précision pour tout modèle local : bruit de fond, plusieurs personnes qui parlent en même temps, accents prononcés et enregistrements à faible débit comme les notes vocales compressées. Si vous avez besoin d'une précision professionnelle supérieure à 95 %, de repères temporels au niveau du mot ou d'étiquettes d'intervenant, cela nécessite des modèles cloud — voir la comparaison ci-dessus.
Transcription dans le navigateur ou cloud : de laquelle avez-vous besoin ?
La transcription dans le navigateur est l'outil idéal lorsque la vie privée est primordiale ou que l'audio est court : rien n'est téléchargé, rien n'est à supprimer par la suite, et cela ne coûte rien. Le compromis est la vitesse et la précision — votre CPU traite environ une heure d'audio en vingt minutes, et le modèle local ignore les étiquettes d'intervenant et le minutage au niveau du mot.
La transcription cloud est l'outil idéal lorsque vous travaillez : réunions, entretiens, cours, enregistrements juridiques. Des GPU dédiés transforment une heure d'audio en texte en environ deux minutes avec une précision de plus de 95 %, identifient jusqu'à 30 intervenants différents, acceptent des fichiers jusqu'à 10 heures et exportent en DOCX, PDF et JSON en plus des formats de sous-titres.
Une règle empirique pratique : si vous seriez à l'aise de lire l'enregistrement à voix haute dans un café, la vitesse et la précision du cloud l'emportent. Si l'audio est sensible — une consultation médicale, une réunion confidentielle, une note vocale privée — l'outil navigateur garde tout sur votre machine et vous donne quand même une transcription utilisable en quelques minutes. Beaucoup de nos utilisateurs combinent les deux : notes privées rapides dans le navigateur, travail professionnel dans le cloud.
Voir les offres Premium →Formats audio pris en charge
Importez des fichiers MP3, WAV, M4A, OGG, OPUS, FLAC ou WEBM — tout ce que votre navigateur peut décoder. Les sources courantes fonctionnent directement : notes vocales WhatsApp (OPUS), mémos vocaux iPhone (M4A), fichiers d'enregistreur Android, enregistrements Zoom (M4A/MP4), messages vocaux Telegram (OGG) et fichiers de podcast (MP3). Les conteneurs vidéo comme MP4 et MOV sont décodés pour leur piste audio lorsque le navigateur prend en charge le codec. Si un fichier ne se charge pas, la cause habituelle est un codec inhabituel dans un conteneur courant — le convertir d'abord en MP3 résout le problème dans presque tous les cas.
Besoin d'un format différent d'abord ? Utilisez nos convertisseurs gratuits : convertisseur audio gratuit MP3 / WAV / OGG / AAC
Besoin de plus ? Découvrez le Premium
Pour un usage professionnel — diarisation, longs fichiers, analyse IA et tous les formats d'export.
Diarisation des locuteurs
Identifie automatiquement qui parle dans chaque segment. Parfait pour les réunions, interviews et podcasts.
Fichiers jusqu'à 10 heures
Le modèle local supporte 10 min. Premium gère des fichiers jusqu'à 10 heures.
Résumé, sentiment et thèmes
L'IA analyse le contenu et génère un résumé, une analyse de sentiment et une extraction de thèmes.
Export complet
Exportez en SRT, VTT, DOCX, JSON et PDF — idéal pour les sous-titres, documents et automatisations.
Questions fréquentes
Transcription gratuite en 20 langues
Whisper prend en charge 99 langues avec détection automatique, et nous maintenons une page dédiée pour chacune des 20 langues les plus demandées, avec des notes sur la façon dont le modèle traite cette langue spécifique. Choisissez la vôtre ci-dessous — le transcripteur présélectionne la bonne langue pour une meilleure précision.