SnailText
PT

Voz para texto no Mac

Voz para texto no Mac — ditado em qualquer app, sem nuvem

·

Pressione um atalho, fale, o texto aparece no cursor. Funciona no Slack, Notion, VS Code, Mail — onde você digitar. O áudio fica no seu Mac, roda no Apple Silicon Metal.

O resumo

Voz para texto no Mac significa um app de macOS que converte fala em texto em qualquer aplicativo, com o modelo de reconhecimento de voz rodando localmente no Apple Silicon. O macOS tem o Apple Dictation integrado — útil para frases curtas dentro de apps da Apple, mas para automaticamente após 30 segundos de silêncio e se integra de forma inconsistente com apps de terceiros. O SnailText executa o modelo Whisper localmente com aceleração GPU Metal — sem corte por silêncio, funciona em qualquer campo de texto via atalho global, o áudio nunca sai do dispositivo.

Apple Dictation vs SnailText, estruturalmente

O macOS tem ditado integrado. Para uso breve e casual dentro de Notes ou Mensagens funciona. Para trabalho contínuo tem limitações estruturais.

RecursoApple DictationSnailText
Duração da gravaçãoPara automaticamente após 30 segundos de silêncio (conforme documentação da Apple); integração inconsistente com apps de terceirosIlimitada — roda até você pressionar o atalho novamente
Onde funcionaApps nativas da Apple e um subconjunto de apps de terceiros que optam por issoQualquer campo de texto em qualquer app — Slack, VS Code, Cursor, Telegram, terminais, inputs web
Tamanho do modeloModelo compacto da Apple, não selecionável pelo usuárioWhisper Tiny até Large v3 (Parakeet TDT no Pro) — escolha o equilíbrio
Vocabulário personalizadoNão editável pelo usuário além do que a Apple já conheceDicionário para nomes próprios + snippets para texto repetitivo (Pro)
Atalho de tecladoFixo em Fn-Fn ou modificador único; conflitos de ativação em muitos appsCmd+Shift+Space global (configurável); sem roubo de foco
Garantia offline"Enhanced Dictation" baixa modelo offline; o comportamento padrão varia por versão do macOSSempre offline por design — sem opção de nuvem, sem toggle para esquecer

O recurso da Apple é melhor entendido como uma comodidade do sistema. O SnailText é a ferramenta que você usa quando o ditado faz parte de como você realmente trabalha.

Por que o Apple Dictation não é suficiente para o ditado diário

O Apple Dictation funciona. Roda no dispositivo em qualquer Mac com chip M1 ou posterior, a transcrição é aceitável para frases curtas e não custa nada. Para uma mensagem rápida ou uma busca de uma linha, cumpre o papel.

Deixa de ser suficiente quando você tenta usá-lo para trabalho real. A documentação da Apple afirma que o Dictation não tem limite de duração estrito no Apple Silicon — mas para automaticamente após 30 segundos de silêncio detectado, o que inclui as pausas naturais enquanto você pensa. Reativar o atalho duas ou três vezes em um único e-mail vira rotina.

O segundo problema é a precisão em conteúdo técnico. O Apple Dictation vai bem com fala clara e geral, e visivelmente pior com código, jargão, inglês com sotaque e vocabulário específico de domínio. Ferramentas de terceiros rodando modelos Whisper são materialmente melhores.

O terceiro é o limite de integração. O Apple Dictation funciona dentro de apps da Apple e na maioria dos campos de texto nativos do macOS. Não tem um fluxo consistente em web apps, apps Electron ou terminais. Você acaba desativando em metade dos lugares onde quer usar.

Ditado no Apple Silicon: por que o Whisper é rápido nos chips M

O motor whisper.cpp, que alimenta a maioria dos apps modernos de ditado no Mac incluindo o nosso, compila com aceleração GPU Metal por padrão no Apple Silicon. Metal é a API de GPU da Apple e, nos chips M, fica diretamente sobre o pool de memória unificada. Os pesos do modelo e o buffer de áudio ficam na mesma memória física que o código do seu app — sem cópia de memória entre CPU e GPU.

Esse único detalhe arquitetural explica por que os Macs com chip M executam modelos Whisper maiores mais rápido que hardware Intel equivalente, muitas vezes em tempo real ou mais rápido. No Windows, a mesma classe de modelo normalmente requer uma GPU discreta NVIDIA para alcançar latência comparável.

Para dados de latência por chip de M1 a M4 com Whisper Small / Medium / Large v3, veja nossa análise detalhada de ditado para Mac. O SnailText também faz streaming de inferência em frases fechadas enquanto você fala, então a espera real no cursor parece menor do que o tempo de passada do modelo sugere.

Voz para texto no Mac para código, documentos e trabalho clínico

O atalho é o mesmo em todos os apps. Cmd+Shift+Space (configurável). Pressione uma vez, a gravação começa. Pressione novamente, o texto transcrito aparece no cursor. Sem menu, sem barra de ferramentas, sem mudança de foco. Veja como funciona para o pipeline completo.

O dicionário personalizado (Pro) cuida das palavras que o Whisper ainda não conhece — os nomes do seu stack, dos seus colegas, termos legais específicos da jurisdição, códigos DSM para clínicos. Adicione um termo uma vez e o SnailText substitui a versão mal entendida antes de chegar ao campo de texto.

O áudio nunca sai do seu Mac. O buffer fica na RAM durante a gravação e é descartado assim que o texto fica pronto. Verificável no Little Snitch ou Lulu — sem tráfego de saída durante o ditado. No Windows? Veja voz para texto no Windows.

Perguntas frequentes

Funciona em Macs Intel?

+

Tecnicamente sim, em modo degradado. O motor whisper.cpp funciona em CPUs Intel, mas a velocidade de inferência sem aceleração Metal é significativamente mais lenta. O ditado em tempo real com o modelo small é borderline aceitável em um iMac Intel de alto desempenho de 2019 ou 2020. Recomendamos Apple Silicon (M1 ou posterior) para a experiência real.

Qual a diferença do Apple Dictation?

+

O Apple Dictation está integrado no macOS, roda no dispositivo no Apple Silicon e é gratuito. A documentação da Apple indica que não há limite de duração estrito, mas o Dictation para automaticamente após 30 segundos de silêncio — pausas para pensar contam. Também não há extensibilidade (vocabulário personalizado, snippets, atalho configurável). O SnailText executa modelos Whisper maiores, não tem corte por silêncio, suporta vocabulário personalizado e snippets (Pro), e funciona com um atalho unificado em todos os apps, incluindo Slack, ferramentas em navegador e terminais.

Você envia meu áudio para algum servidor?

+

Não. O Whisper local roda no nosso app no seu Mac. O buffer de áudio fica na RAM durante a sessão de gravação e não é escrito no disco. Não enviamos áudio para nenhum servidor em nenhum modo, gratuito ou pago.

Usa o Neural Engine?

+

Não — e tudo bem. O whisper.cpp roda no Metal, a API de computação GPU de propósito geral da Apple. O Neural Engine é um acelerador separado, acessível apenas pelos frameworks privados da Apple (Core ML, MLX); não existe um backend ggml público para ele em 2026. O caminho Metal nos chips M é rápido o suficiente para que a ausência de um backend ANE não importe para a latência do ditado.

E quanto a HIPAA, GDPR, setores regulados?

+

O caminho mais simples para conformidade em ditado por voz é não transmitir o áudio para lugar nenhum. O Whisper local faz exatamente isso — sem Business Associate Agreement, sem Acordo de Processamento de Dados, sem avaliação de transferência internacional. Dados que nunca saem do seu dispositivo são os mais fáceis de manter em conformidade.

Qual é a precisão da voz para texto no Mac com o SnailText?

+

A precisão depende do modelo Whisper escolhido, da qualidade do microfone e do seu padrão de fala. O plano gratuito inclui o Whisper Base, que lida bem com o ditado cotidiano em inglês e português. O Pro adiciona Whisper Medium e Large v3 para melhor jargão técnico, inglês com sotaque e ambientes barulhentos.

Voz para texto no Mac. Local. Grátis para começar.

Baixe para macOS 12 ou posterior. Apple Silicon recomendado. Sem conta necessária.