Deux fonctions de dictée vocale sous Windows : ce que chacune est vraiment
Windows en 2026 propose deux fonctions de dictée distinctes. La plupart des articles en ligne les traitent comme un seul produit. Ce n'en est pas un.
Voice Typing (activé par Win+H) est un outil de dictée basé sur le cloud. Microsoft le documente explicitement : pour utiliser Voice Typing, vous devez être connecté à internet. À chaque session de dictée, l'audio de votre micro est envoyé aux services Azure Speech de Microsoft pour la transcription. Le texte revient et est collé dans le champ de texte actif, et l'audio (selon Microsoft) est dé-identifié et non conservé sans consentement - mais il a quitté votre appareil.
Voice Access est la fonction plus récente, ajoutée dans Windows 11 22H2 (octobre 2022). C'est un outil d'accessibilité plus large qui inclut la dictée, mais permet aussi de contrôler le système d'exploitation à la voix : ouvrir des applis, cliquer sur des boutons, faire défiler, naviguer. La partie dictée de Voice Access tourne sur l'appareil, hors ligne. Elle n'existe pas sous Windows 10. Sous Windows 10, vous avez l'ancien outil "Reconnaissance vocale Windows", une fonction différente.
La différence pratique : Voice Typing prend en charge plus de langues mais a toujours besoin d'internet. Voice Access tourne hors ligne mais prend en charge moins de langues. Aucun des deux ne fait les deux.
La couverture linguistique : le vrai sujet
Voice Access - l'option hors ligne - ne prend en charge que 11 langues : six variantes de l'anglais (États-Unis, Royaume-Uni, Inde, Nouvelle-Zélande, Canada, Australie), deux espagnols (Espagne, Mexique), allemand, français (France et Canada), italien, japonais, chinois simplifié et chinois traditionnel (Taïwan). C'est tout.
Ce qui manque : russe, portugais (Brésil et Portugal), polonais, néerlandais, suédois, danois, norvégien, finnois, tchèque, hongrois, grec, turc, hindi, arabe, coréen, thaï, vietnamien et des dizaines d'autres. Microsoft a confirmé sur son propre forum de support que les limites linguistiques de Voice Access sont voulues, sans engagement de feuille de route pour les étendre.
Voice Typing - l'option cloud - prend en charge davantage de langues (~43, dont le portugais, le coréen, le thaï, le turc, le vietnamien, le hindi). Mais il envoie votre audio à Microsoft à chaque dictée. Pour quiconque dicte des informations clients, des notes médicales, du code source ou tout contenu sensible, "STT cloud sans option hors ligne" est la mauvaise architecture.
SnailText exécute Whisper en local. Whisper est multilingue par conception - le même modèle qui traite l'anglais traite 100+ langues, y compris toutes celles que l'option hors ligne de Microsoft ne couvre pas. La dictée en français fonctionne dans SnailText. Le russe, le polonais, le néerlandais : tout sur la même installation. Aucun module linguistique à télécharger. Aucun détour par le cloud.
Le délai d'inactivité de Win+H - la plainte la plus citée
Voice Typing de Windows a un délai d'inactivité non personnalisable qui met fin à la session de dictée après environ 5 à 10 secondes de pause. Le nombre exact ne figure pas dans les supports marketing de Microsoft, mais c'est le sujet de plusieurs fils d'utilisateurs. La réponse dans tous : impossible de le modifier.
Pour rédiger un e-mail de plus de deux paragraphes, cela signifie réactiver Win+H deux ou trois fois dans le même message. Pour les flux où l'on réfléchit en dictant - notes de recherche, plans de traitement, brouillons où les pauses de réflexion sont normales - la coupure donne l'impression que l'outil lutte contre vous.
SnailText tourne tant que vous maintenez le raccourci enfoncé, ou jusqu'à ce que vous appuyiez de nouveau pour arrêter. Il n'y a pas de délai d'inactivité. Un vidage d'idées de cinq minutes se dicte en une seule session.
"Fluid Dictation" exige du matériel spécial - la plupart des PC ne sont pas éligibles
La campagne marketing de Microsoft en 2025 pour Voice Typing s'est concentrée sur "Fluid Dictation" - une couche de finition qui ajoute la ponctuation automatique, supprime les tics de langage (euh, hum) et corrige la grammaire en temps réel. Les avis sur cette fonction sont positifs quand elle marche.
La documentation de Microsoft indique que Fluid Dictation exige un PC Copilot+ - c'est-à-dire une NPU (unité de traitement neuronal) dédiée dans le matériel : Snapdragon X (portables Surface de 2024+), Intel Core Ultra avec NPU ou AMD Ryzen AI. Et elle n'est disponible qu'en anglais.
En 2026, le parc de PC Copilot+ reste réduit. Un PC Windows 11 standard acheté en 2022 ou 2023, sans NPU, a l'expérience de base de Voice Typing - sans correction grammaticale automatique, sans suppression des tics, sans finition en temps réel. Le marketing de 2025 s'applique à peut-être 5-10 % du parc Windows.
Comment SnailText comble les lacunes de la dictée vocale sous Windows
Traitement local. SnailText exécute le modèle Whisper sur votre PC - CPU sur les machines plus anciennes, Vulkan sur les iGPU AMD et Intel, CUDA sur les GPU NVIDIA. L'audio est capté dans un buffer en RAM, traité par le modèle, le texte transcrit est collé au curseur et l'audio est supprimé. Vérifiez dans votre moniteur réseau - aucun trafic sortant pendant la dictée.
Toute langue prise en charge par Whisper. Plus de 100 langues sur la même installation, sans module à télécharger. Le russe fonctionne comme l'anglais. Le portugais fonctionne comme le français. Aucune lacune par région - voyez aussi notre page dictée hors ligne pour l'argument d'architecture.
Sans délai d'inactivité. Appuyez sur le raccourci, parlez aussi longtemps que vous voulez - cinq secondes ou cinq minutes - appuyez de nouveau pour arrêter. La transcription est un bloc unique.
Raccourci configurable. Par défaut Ctrl+Space ; réattribuez-le à toute combinaison qui n'entre pas en conflit avec vos autres raccourcis.
Fonctionne dans toute appli. SnailText colle dans le champ de texte actif, comme Ctrl+V. Slack, Chrome, VS Code, Cursor, émulateurs de terminal, formulaires web, Anki - partout où un clavier fonctionne, la dictée fonctionne.
Gratuit au départ. Le modèle Whisper Base compact couvre la dictée du quotidien en français et en anglais ; Pro ajoute des modèles Whisper plus grands et plus de 25 langues européennes via Parakeet TDT.
Comment configurer la dictée vocale sous Windows en 60 secondes
1. Téléchargez l'installeur SnailText sur snailtext.app/download/windows/.
2. Lancez l'installeur. Windows SmartScreen peut alerter parce que SnailText n'a pas encore de signature Authenticode délivrée par une autorité de certification reconnue par Microsoft - cliquez sur "Informations complémentaires" → "Exécuter quand même".
3. Au premier lancement, SnailText télécharge le modèle Whisper par défaut (Base, environ 80 Mo) et le charge.
4. Définissez votre raccourci global dans les Réglages. Par défaut Ctrl+Space.
5. Ouvrez n'importe quelle appli - Slack, Chrome, Word, Notion, votre IDE. Appuyez sur le raccourci. Parlez. Appuyez de nouveau. Le texte transcrit apparaît au curseur.