Hoe het werkt

Drie stappen. Meer niet.

Een sneltoets, een microfoon, een tekstveld. Al het andere blijft verborgen tot je het echt nodig hebt.

Het verloop

Druk, spreek, plak.

01

Druk op de sneltoets

⌥ Space

Standaard: ⌥ Space op Mac, Ctrl Space op Windows. Aanpasbaar in Instellingen. De pil onderaan je scherm wordt wakker - eerst een neutrale kleur, dan rood zodra de opname start. Je cursor blijft precies waar je aan het typen was.
02

Spreek natuurlijk

Praat alsof je iets aan een collega uitlegt. Dicteer geen leestekens - hij leidt komma's, punten en vraagtekens af uit je spraak. Lange stiltes worden automatisch weggeknipt (dat is onze VAD die zijn werk doet); herstarts en "uhms" verbeter je in dezelfde edit-ronde die je na het typen ook zou doen.
03

Laat los, plak

⌥ Space

Druk opnieuw op de sneltoets. De pil wordt paars tijdens het transcriberen - meestal minder dan een seconde op een GPU, 1-3 seconden op een moderne CPU. Daarna verschijnt de tekst. Daar waar je cursor stond, met alle woorden die je hebt gezegd.

Achter de schermen

Hoe offline dicteren echt werkt.

De technische details, in gewone taal. Als je hier overheen leest - dat is juist de bedoeling. Niets hiervan verandert hoe je de app gebruikt.

01 — Engine

whisper.cpp draait op je eigen machine

We gebruiken whisper.cpp, de open source C++-port van OpenAI's Whisper. Hij draait volledig op je CPU of GPU - geen internetverbinding nodig zodra het model is gedownload. Audio wordt in RAM verwerkt en weggegooid op het moment dat we je tekst hebben. Niets op schijf, niets op een server.

whisper.cpp op GitHub →

02 — Stilte

Silero VAD knipt de stilte weg

Voice Activity Detection (VAD) bepaalt wat spraak is en wat niet, voordat Whisper het ziet. Zonder VAD hallucineert Whisper woorden uit achtergrondgeluid - het klassieke "thank you for watching" dat uit het niets opduikt. Silero VAD draait in milliseconden en knipt de stille stukken weg voordat ze het model bereiken.

03 — Hardware

GPU als je die hebt, CPU als je die niet hebt

Op Windows gebruiken we Vulkan; op Mac gebruiken we Metal. Beide worden automatisch gedetecteerd en werken met elke GPU die je hebt - NVIDIA, AMD, Intel Arc, Apple Silicon. Geen drivers te installeren. Heeft je machine geen bruikbare GPU, dan vallen we terug op de CPU. De compacte modellen draaien prima op een gewone CPU in 1-3 seconden voor korte zinnen.

Want to go deeper? Read Offline dictation — voice typing without the cloud for the architectural argument, GDPR and HIPAA implications, and how to verify any dictation app is actually offline. For Mac specifics, see Dictation for Mac.

Het tweede model

Daarna poetst een taalmodel het op.

Spraakherkenning geeft je een ruwe transcriptie. Een tweede model, dat ook lokaal draait, bewerkt die tot iets dat je kunt versturen. Die tweede stap maakt het tot AI-dicteren. Het is een Pro-functie, in beta, en je kunt het uitzetten.

01 — Opschoning

Stopwoorden eruit, leestekens erin

Een compact Gemma-model leest de transcriptie en maakt hem netjes: "uh" en "weet je" eruit, leestekens en hoofdletters hersteld, grammaticale fouten verbeterd, merknamen correct geschreven (github wordt GitHub). Het draait op jouw hardware, dus de transcriptie wordt nooit geupload zoals dat bij AI-dicteertools in de cloud gebeurt.

Gemma op ai.google.dev →

02 — Profielen

Vijf onderwerpprofielen, jouw stijlkeuze

Kies een profiel dat past bij wat je dicteert: Algemeen, Ontwikkeling & IT, Schrijven, Zakelijk of Academisch. Het profiel Ontwikkeling herstelt code-identifiers in jouw conventie (snake_case, camelCase, kebab-case, PascalCase), zodat "recording completed" recording_completed wordt. Schrijven behoudt je eigen stem en slaat het herschrijven van identifiers helemaal over.

03 — Controle

Standaard behoudend, uit wanneer je wilt

De opschoning is afgesteld om je betekenis te behouden, niet om die te herschrijven, en laat tekst met rust als die al schoon is. Hij kan ook de toon verschuiven of vertalen. Wil je liever de exacte woorden? Zet de stap uit en krijg pure, woordelijke spraak naar tekst. AI-dicteren is een modus die je aanzet, geen filter waar je aan vastzit.

Wat is AI-dicteren? →

Modi

Een sneltoets, meerdere persoonlijkheden.

Een modus is een opgeslagen combinatie: welk model, welke taal, welk woordenboek, welke snippets. Wissel ertussen direct vanuit de pil.

Code

Vergrendeld op Engels. Woordenboek geladen met kubectl, gRPC, async/await, de API-namen van je team. Nul misverstanden bij het technische jargon dat je dagelijks gebruikt.

Lange teksten

Groter model voor hogere nauwkeurigheid. Woordenboek geladen met namen en termen uit je project. Snippets klaar voor koppen, callouts en terugkerende zinnen.

Slack snel

Compact model voor directe respons. Snippets voor je standup-sjabloon, je sjabloon om een vergadering af te wijzen, je /sig-handtekening.

De modi zelf (model + taal) werken op elk plan. Automatisch vervangen van woordenboek en snippets zijn Pro-functies.

Woordenboek en snippets Pro

Vervang en breid uit in een oogwenk.

Automatisch vervangen draait tijdens het transcriberen op het Pro-plan.

Woordenboek

Correcties op woordniveau

Vertel SnailText dat "see plus plus" altijd C++ moet worden. Of dat "k eight s" naar k8s moet uitbreiden, niet naar "kates". Eigen toewijzingen voor technisch jargon, productnamen of namen van collega's die Whisper steeds verkeerd verstaat. Houdt rekening met woordgrenzen en behoudt hoofdletters. Geen regex nodig.

zeg "see plus plus"

→ C++

Snippets

Sjablonen op spraakcommando

Spraaktriggers die uitbreiden tot langere teksten. Zeg "slash sig" en je volledige e-mailhandtekening verschijnt. Zeg "slash standup" en je standup-sjabloon voor de ochtend verschijnt. De triggerwoorden komen niet in het eindresultaat terecht.

zeg "slash sig"

→ Best,
Pavel
—
Software Architect

Fouten

Hij zal iets verkeerd verstaan. Jij houdt de controle.

Whisper is goed. Niet perfect. Lange technische zinnen, zeldzame namen, ongewoon jargon - daar kan hij over struikelen. Drie dingen helpen.

Eigen woordenboek (Pro)

Voeg je probleemwoorden een keer toe; ze zijn geen fouten meer. Vocabulaire specifiek voor je stack, namen van collega's, codenamen van projecten - alles gaat er een keer in en gedraagt zich voor altijd goed. Automatisch vervangen draait op het Pro-plan.

Grotere Pro-modellen

De nauwkeurigheidscurve is echt - de geavanceerde lokale modellen vangen op wat de compacte missen, vooral in andere talen dan het Engels en bij lange technische zinnen.

Handmatig bewerken na het plakken

De tekst belandt in je gewone editor - je cursor, je toetsenbord, je vertrouwde edit-sneltoetsen. Verbeter wat je niet bevalt op dezelfde manier als waarop je elke typefout zou verbeteren.

Er zit geen AI-autobewerking tussen jou en de tekst. Wat je zei, is wat er geplakt wordt.

Meer niet

Dit is het hele product.

Ongeveer dertig seconden om te installeren. Een paar minuten extra om aan de sneltoets te wennen. Daarna een sneltoets voor de rest van je leven.

Downloaden voor Mac Of voor Windows →

Nog niet zeker? Bekijk de prijzen →