SnailText
ES

Voz a texto en Mac

Voz a texto en Mac — dictado en cualquier app, sin nube

·

Pulsa un atajo, habla, el texto aparece en el cursor. Funciona en Slack, Notion, VS Code, Mail — donde escribas. El audio se queda en tu Mac, corre en Apple Silicon Metal.

El resumen

Voz a texto en Mac significa una app de macOS que convierte habla en texto en cualquier aplicación, con el modelo de reconocimiento de voz corriendo localmente en Apple Silicon. macOS incluye Apple Dictation integrado — útil para frases cortas dentro de apps de Apple, pero se detiene automáticamente tras 30 segundos de silencio y se integra de forma inconsistente con apps de terceros. SnailText ejecuta el modelo Whisper localmente con aceleración GPU Metal — sin corte por silencio, funciona en cualquier campo de texto con un atajo global, el audio nunca sale de tu dispositivo.

Apple Dictation vs SnailText, estructuralmente

macOS incluye dictado integrado. Para uso breve y casual dentro de Notes o Messages funciona. Para trabajo sostenido tiene límites estructurales.

CaracterísticaApple DictationSnailText
Duración de la grabaciónSe detiene automáticamente tras 30 segundos de silencio (según documentación de Apple); integración inconsistente con apps de tercerosIlimitada — corre hasta que vuelves a pulsar el atajo
Dónde funcionaApps nativas de Apple y un subconjunto de apps de terceros que optan por elloCualquier campo de texto en cualquier app — Slack, VS Code, Cursor, Telegram, terminales, inputs web
Tamaño del modeloModelo compacto de Apple, no seleccionable por el usuarioWhisper Tiny hasta Large v3 (Parakeet TDT en Pro) — elige tu equilibrio
Vocabulario personalizadoNo editable por el usuario más allá de lo que Apple ya conoceDiccionario para nombres propios + fragmentos para texto repetitivo (Pro)
Atajo de tecladoFijo a Fn-Fn o modificador único; conflictos de activación en muchas appsCmd+Shift+Space global (configurable); sin robo de foco
Garantía offline"Enhanced Dictation" descarga modelo offline; el comportamiento por defecto varía según la versión de macOSSiempre offline por diseño — sin opción de nube, sin toggle que olvidar

Lo de Apple se entiende mejor como una comodidad del sistema. SnailText es la herramienta a la que recurres cuando el dictado es parte de cómo trabajas de verdad.

Por qué Apple Dictation no es suficiente para el dictado diario

Apple Dictation funciona. Corre en el dispositivo en cualquier Mac con chip M1 o posterior, la transcripción es aceptable para frases cortas y no cuesta nada. Para un mensaje rápido o una búsqueda de una línea, cumple.

Deja de ser suficiente en cuanto intentas usarlo para trabajo real. La documentación de Apple indica que Dictation no tiene tiempo límite estricto en Apple Silicon — pero se detiene automáticamente tras 30 segundos de silencio detectado, lo que incluye las pausas naturales mientras piensas. Reactivar el atajo dos o tres veces en un mismo email se convierte en rutina.

El segundo problema es la precisión en contenido técnico. Apple Dictation va bien con habla clara y general, y visiblemente peor con código, jerga, inglés con acento y vocabulario específico de dominio. Las herramientas de terceros que ejecutan modelos Whisper son materialmente mejores.

El tercero es el límite de integración. Apple Dictation funciona dentro de las apps de Apple y la mayoría de campos de texto nativos de macOS. No tiene un flujo consistente en web apps, apps Electron ni terminales. Acabas desactivándolo en la mitad de los lugares donde querrías usarlo.

Dictado en Apple Silicon: por qué Whisper va rápido en los chips M

El motor whisper.cpp, que impulsa la mayoría de apps modernas de dictado en Mac incluyendo la nuestra, compila con aceleración GPU Metal por defecto en Apple Silicon. Metal es la API GPU de Apple y, en los chips M, se asienta directamente sobre el pool de memoria unificada. Los pesos del modelo y el buffer de audio viven en la misma memoria física que el código de tu aplicación — sin copias de memoria entre CPU y GPU.

Ese único detalle arquitectónico explica por qué los Mac con chip M ejecutan modelos Whisper más grandes más rápido que hardware Intel equivalente, a menudo en tiempo real o mejor. En Windows, la misma clase de modelo normalmente requiere una GPU discreta NVIDIA para alcanzar una latencia comparable.

Para datos de latencia por chip de M1 a M4 con Whisper Small / Medium / Large v3, consulta nuestro análisis en profundidad de dictado para Mac. SnailText también hace streaming de inferencia en frases cerradas mientras hablas, así que la espera real en el cursor se siente más corta de lo que sugiere el tiempo de pasada del modelo.

Voz a texto en Mac para código, documentos y trabajo clínico

El atajo es el mismo en todas las apps. Cmd+Shift+Space (configurable). Pulsas una vez, empieza la grabación. Pulsas de nuevo, el texto transcrito aparece en el cursor. Sin menú, sin barra de herramientas, sin cambio de foco. Consulta cómo funciona para el pipeline completo.

El diccionario personalizado (Pro) gestiona las palabras que Whisper aún no conoce — los nombres de tu stack, los de tus colegas, términos legales específicos de la jurisdicción, códigos DSM para clínicos. Añade un término una vez y SnailText sustituye la versión mal escuchada antes de llegar al campo de texto.

El audio nunca sale de tu Mac. El buffer permanece en RAM durante la grabación y se descarta en cuanto el texto está listo. Verificable en Little Snitch o Lulu — sin tráfico saliente durante el dictado. ¿En Windows? Consulta voz a texto en Windows.

Preguntas frecuentes

¿Funciona en Macs Intel?

+

Técnicamente sí, en modo degradado. El motor whisper.cpp funciona en CPUs Intel pero la velocidad de inferencia sin aceleración Metal es significativamente más lenta. El dictado en tiempo real con el modelo small es bordeline aceptable en un iMac Intel de gama alta de 2019 o 2020. Recomendamos Apple Silicon (M1 o posterior) para la experiencia real.

¿En qué se diferencia de Apple Dictation?

+

Apple Dictation está integrado en macOS, corre en el dispositivo en Apple Silicon y es gratuito. La documentación de Apple indica que no tiene un tiempo límite estricto, pero Dictation se detiene automáticamente tras 30 segundos de silencio — las pausas para pensar cuentan. Tampoco hay extensibilidad (vocabulario personalizado, fragmentos, atajo configurable). SnailText ejecuta modelos Whisper más grandes, no tiene corte por silencio, admite vocabulario personalizado y fragmentos (Pro), y funciona con un atajo unificado en todas las apps, incluyendo Slack, herramientas en navegador y terminales.

¿Subes mi audio a algún servidor?

+

No. Whisper local corre en nuestra app en tu Mac. El buffer de audio permanece en RAM durante la sesión de grabación y no se escribe en disco. No subimos audio a ningún servidor en ningún modo, gratuito o de pago.

¿Usa el Neural Engine?

+

No — y está bien así. whisper.cpp corre en Metal, la API de cómputo GPU de propósito general de Apple. El Neural Engine es un acelerador separado, solo accesible a través de los frameworks privados de Apple (Core ML, MLX); no existe un backend ggml público para él en 2026. El camino Metal en chips M es lo bastante rápido como para que la ausencia de un backend ANE no importe para la latencia del dictado.

¿Qué hay de HIPAA, GDPR, sectores regulados?

+

El camino más sencillo al cumplimiento para el dictado por voz es no transmitir el audio a ningún lugar. Whisper local hace exactamente eso — sin Business Associate Agreement, sin Acuerdo de Procesamiento de Datos, sin evaluación de transferencia internacional de datos. Los datos que nunca salen de tu dispositivo son los más fáciles de mantener en regla.

¿Qué precisión tiene la voz a texto en Mac con SnailText?

+

La precisión depende del modelo Whisper que elijas, la calidad del micrófono y tu patrón de habla. El plan gratuito incluye Whisper Base, que maneja bien el dictado cotidiano en inglés y español. Pro añade Whisper Medium y Large v3 para mejor jerga técnica, inglés con acento y entornos ruidosos.

Voz a texto en Mac. Local. Gratis para empezar.

Descarga para macOS 12 o posterior. Apple Silicon recomendado. Sin cuenta.