Transcrivez l'audio en texte localement avec Whisper IA dans votre navigateur via WebGPU

Qu'est-ce que l'outil de transcription vocale IA ?

L'outil de transcription vocale IA convertit vos enregistrements audio en texte écrit à l'aide du modèle Whisper d'OpenAI, exécuté entièrement dans votre navigateur. Grâce à l'accélération WebGPU, le processus de transcription s'effectue localement sur votre appareil — vos fichiers audio ne sont jamais envoyés à un serveur externe. C'est idéal pour transcrire des réunions, des entretiens, des cours ou tout contenu audio confidentiel.

Comment utiliser cet outil

Choisissez un modèle Whisper dans le menu déroulant. Les modèles plus petits sont plus rapides mais moins précis.
Sélectionnez la langue de votre audio ou laissez la détection automatique.
Cliquez sur « Charger le modèle IA » pour télécharger les poids du modèle. Cette opération n'est nécessaire qu'une seule fois.
Glissez-déposez un fichier audio ou cliquez sur la zone de dépôt.
Activez les horodatages si vous souhaitez des segments temporels dans la transcription.
Cliquez sur « Transcrire » et attendez le résultat.

Fonctionnement technique

Cet outil utilise le modèle Whisper d'OpenAI, compilé pour s'exécuter dans le navigateur via ONNX Runtime Web avec WebGPU comme backend. L'audio est décodé, rééchantillonné à 16 kHz en mono, puis traité par l'architecture encodeur-décodeur de Whisper pour produire un texte.

Formats audio pris en charge

L'outil accepte les formats MP3, WAV, FLAC, OGG, M4A et WEBM. La taille maximale est de 100 Mo. Les enregistrements longs sont automatiquement découpés en segments pour le traitement.

Questions fréquentes

Mon audio est-il envoyé à un serveur ?

Non. Le modèle Whisper s'exécute entièrement dans votre navigateur grâce à WebGPU. Votre fichier audio reste sur votre appareil pendant tout le processus. Aucune donnée n'est transmise à un service externe.

Quelles langues sont prises en charge ?

Whisper prend en charge plus de 90 langues, dont le français, l'anglais, le japonais, l'allemand, l'espagnol, le chinois, le coréen et bien d'autres. Vous pouvez sélectionner manuellement la langue ou utiliser la détection automatique.

Quelle est la taille maximale des fichiers ?

L'outil accepte les fichiers audio jusqu'à 100 Mo. Pour des résultats optimaux, les fichiers de moins de 25 minutes produisent généralement les transcriptions les plus fiables.

Transcription Vocale IA