Voltar ao blog

Ditado privado e offline no Mac: o guia completo

Qual a aplicação de ditado para Mac que protege verdadeiramente os seus dados? Processamento local, BYOK, sem áudio armazenado — uma comparação honesta face às aplicações cloud.

Está a ditar um email sensível, notas médicas ou código proprietário, e uma questão não larga: para onde vai realmente a sua voz? A maioria das aplicações de ditado envia o seu áudio para os seus servidores, transcreve-o do seu lado e, por vezes, guarda-o “para melhorar o serviço.” Se a privacidade é importante para si, o critério principal não é a qualidade da transcrição — é quem é dono dos seus dados e por onde eles passam.

Este artigo corta através das promessas de marketing e da realidade técnica, e explica como funciona uma abordagem verdadeiramente respeitadora da privacidade no macOS.

O problema real das aplicações de ditado na cloud

Uma aplicação de ditado “cloud” típica segue este caminho: o microfone capta o áudio, a aplicação envia-o para o servidor da empresa, um modelo transcreve-o, e depois o texto volta. Surgem três zonas de opacidade.

  • Armazenamento de áudio. Muitos serviços guardam as suas gravações, pelo menos temporariamente. Leia as políticas: “podemos reter áudio para treinar os nossos modelos” é uma frase comum.
  • Conta obrigatória. O histórico do seu ditado está ligado à sua identidade, em infraestrutura que não controla.
  • Opacidade do processamento. Não tem ideia de quais subcontratantes veem o quê. Para dados profissionais ou regulados (RGPD, confidencialidade médica, NDAs), isso é um risco real.

“Encriptado” não significa “privado.” A encriptação protege os dados em trânsito; nada diz sobre o que é retido assim que o áudio chega ao destino.

Offline, local, BYOK — não confundir

Estes três termos são agrupados constantemente. Sejamos precisos.

AbordagemPara onde vai o áudioConta necessáriaQuem vê os seus dados
100% offline (modelo corre na máquina)Lado nenhum — tudo fica no MacNãoApenas você
BYOK (as suas próprias chaves de API)Para o fornecedor que escolherApenas do lado do fornecedorVocê + o seu fornecedor, sob o seu contrato
Cloud clássicaPara os servidores do editorSim, com o editorO editor e os seus subcontratantes

100% offline é o ideal absoluto: nada sai do computador. A contrapartida é que a qualidade depende de modelos locais, que costumam ser mais pesados e menos refinados para pontuação ou conteúdo multilingue.

BYOK (Bring Your Own Key) é um compromisso altamente prático. Traz as suas próprias chaves de API (OpenAI, Gemini, Groq). O áudio vai diretamente para esse fornecedor, sob a sua conta e os seus termos, sem intermediário a revender ou arquivar. Nenhum editor de terceiros se interpõe entre você e o motor. Costuma ser o melhor equilíbrio entre privacidade, controlo e qualidade do texto.

O que uma aplicação respeitadora da privacidade deve garantir

Antes de instalar qualquer coisa, verifique estes pontos concretos:

  1. Sem áudio armazenado. A gravação é usada para a transcrição e depois descartada. Sem arquivo, sem “biblioteca de voz.”
  2. Sem servidor intermediário do editor. Ou o processamento é local, ou o áudio vai diretamente para o fornecedor que escolheu.
  3. Aplicação nativa e leve. Uma verdadeira aplicação macOS construída para Apple Silicon — não um browser disfarçado que pede permissões a torto e a direito.
  4. Transparência sobre as chaves. Deve saber onde as suas chaves de API são armazenadas (idealmente no keychain do macOS) e para onde vai cada pedido.
  5. Sem conta forçada para usar no dia a dia.

Como o Speech Flow trata isto

O Speech Flow é uma aplicação nativa do macOS (~50 MB, otimizada para Apple Silicon) construída em torno do BYOK. Prima Ctrl, fala, e texto limpo e pontuado — com todos os “hms” removidos — é inserido diretamente no cursor, em qualquer aplicação. Um LLM reescreve em tempo real e até adapta o tom à aplicação onde está a escrever.

Do lado dos dados: traz as suas chaves (OpenAI, Gemini ou Groq), o áudio vai diretamente para o fornecedor que escolheu, e nenhum áudio é alguma vez retido. Não existe nenhum servidor do Speech Flow a agir como intermediário. Mantém o controlo do contrato de processamento de dados — porque é seu. A aplicação é bilingue e multilingue (francês, inglês, espanhol, italiano).

Para uma comparação detalhada com uma alternativa cloud popular, consulte a nossa página Speech Flow vs Wispr Flow. E se quiser os detalhes exatos de preços, tudo está na página de preços.

Sejamos honestos sobre as limitações: o BYOK não é 100% offline. O seu áudio viaja para um fornecedor de IA — mas fá-lo sob a sua conta e os seus termos, e não através de um intermediário opaco. Se o seu requisito é que absolutamente nada saia da máquina, um modelo estritamente local continua a ser a única resposta — e a qualidade da reescrita será mais limitada.

FAQ

O meu áudio é gravado em algum lado?
Não. Com o Speech Flow, o áudio é usado para produzir a transcrição e depois descartado. Não existe nenhum arquivo das suas gravações do lado do editor.

O BYOK é genuinamente mais privado do que a cloud clássica?
Sim, num ponto essencial: nenhum editor de terceiros se interpõe entre você e o motor de transcrição. O áudio vai diretamente para o fornecedor que escolheu, sob a sua conta, as suas chaves e o seu contrato de processamento de dados.

Funciona totalmente offline, sem qualquer ligação?
Não em modo BYOK: os modelos de transcrição correm do lado do fornecedor, por isso é necessária ligação. O funcionamento totalmente offline exige um modelo a correr no seu Mac, o que implica compromissos de qualidade.

Saber mais

Se procura uma aplicação de ditado para Mac que coloque a privacidade em primeiro lugar sem sacrificar a qualidade do texto, o Speech Flow merece uma tentativa: nativo, leve, BYOK, sem retenção de áudio. Licença vitalícia a €69 (as suas chaves) ou um plano tudo-incluído a €10/mês. Os detalhes estão na página de preços — escolha o que melhor se adapta às suas necessidades.