Transcrever português-BR com jargão radiológico: o caminho não óbvio
O motor propõe; o médico decide. Speech-to-report gera um laudo estruturado e revisável em segundos, não um texto cru a formatar à mão.
Por que motor genérico falha em laudo radiológico
O reconhecimento de voz genérico tem desempenho ruim em radiologia brasileira por três motivos:
- Vocabulário: termos como 'hipersinal-T2', 'contraste hepatobiliar', 'hepatocolédoco' e 'calcificação peri-aortocava' não aparecem com frequência em bases genéricas de fala, gerando erros ou aproximações inventadas.
- Eponímia e acrônimos: 'sinal de Schmorl', 'fossa de Treitz', 'BI-RADS', 'TI-RADS', 'PI-RADS' são vulneráveis à corrupção — 'BI-RADS' vira 'abirads' no pior caso.
- Regionalismo e sotaque: o radiologista brasileiro fala com prosódia diferente entre regiões (São Paulo, Ceará, Rio Grande do Sul, Amazonas). Bases genéricas sub-representam essas variantes.
O que entra num motor radiológico-PT
- Léxico controlado por modalidade: cada tipo de exame (TC, RM, US, RX, mamografia, Doppler) tem terminologia específica, com ponderação bayesiana.
- Eponímia médica: vocabulário fixo incluindo Schmorl, Treitz, Retzius, Calot, Couinaud, Klatskin, Murphy, Rovsing — protegidos contra corrupção.
- Sistemas de classificação: 'BI-RADS 0 a 6 com 4A/4B/4C, TI-RADS 1 a 5, PI-RADS 1 a 5', com grafia consistente, incluindo hífens.
- Medidas e unidades: conversão automática ('um vírgula cinco centímetros' → '1,5 cm'), precisão decimal por modalidade e acurácia de lateralidade.
- Anatomia regional: lobos pulmonares (LSE, LSD, LM, LIE, LID), segmentos hepáticos (Couinaud I a VIII), quadrantes mamários (QSE, QSD, QIE, QID).
- Ajuste regional: fine-tuning contínuo por instituição e região.
Speech-to-text vs speech-to-report
Speech-to-text transcreve o ditado literalmente; speech-to-report gera um laudo estruturado. A distinção está no formato de saída e no fluxo do médico. Com speech-to-report, o radiologista recebe um laudo já estruturado, com seções, vocabulário padronizado e coerência automática entre achados e impressão. O tempo de revisão cai drasticamente porque o formato é revisável em segundos, em vez de exigir formatação manual.
Erros típicos do ditado genérico — e como contornar
Inversão de lateralidade
Alto risco clínico. Mitigado por validação de coerência e revisão obrigatória.
Medida sem unidade
Mitigado por entendimento contextual da convenção da modalidade.
Acrônimo destruído (BI-RADS → 'abirads')
Vocabulário protegido impede a corrupção.
Epônimo errado (Schmorl → 'esmore')
Dicionário fechado de epônimos radiológicos.
Concordância quebrada
Pós-processamento de correção para português-BR.
Pontuação aleatória
O motor aplica pontuação com base na prosódia e na estrutura do laudo.
Cabeçalhos ausentes
Técnica, achados e impressão gerados automaticamente por modalidade.
Métricas de qualidade — o que medir
Word error rate (WER) é insuficiente para domínios clínicos. As métricas relevantes incluem:
- Acurácia de terminologia (% de termos do vocabulário controlado reconhecidos corretamente).
- Acurácia de lateralidade (% de menções direita/esquerda preservadas corretamente).
- Acurácia de medidas (% de medidas com unidade correta).
- Acurácia de estrutura (% de laudos na estrutura correta por modalidade).
- Acurácia de classificação (% de categorias BI-RADS/TI-RADS corretas na conclusão).
- Taxa de correção (edições exigidas do médico) — a que mais se correlaciona com a satisfação clínica.
Em produção, vale acompanhar TAT mediano, proporção de laudos abaixo de 1 minuto e frequência de retrabalho.
Como medir num piloto
- Selecione 200 a 500 exames consecutivos cobrindo as modalidades relevantes (sem cherry-picking).
- Compare três cenários: ditado digital tradicional (baseline), ditado com motor genérico e speech-to-report radiológico — todos revisados pelo mesmo radiologista.
- Meça: tempo até a assinatura, correções por laudo, WER, acurácia de terminologia/lateralidade/medida/classificação.
- Avaliação cega: 50 laudos por cenário avaliados por um radiologista sênior quanto à qualidade (Likert 1 a 5).
- Verifique a consistência interprofissional: o speech-to-report produz laudos mais homogêneos entre radiologistas do que o ditado genérico?
- Valide a integração: o laudo final chega ao PACS/RIS sem retrabalho? As classificações aparecem nos campos corretos? O log de auditoria está completo?
Como a Laudos.AI aborda isso
O motor da Laudos.AI é treinado em terminologia radiológica brasileira, com vocabulário controlado por modalidade, vocabulário fixo para classificações (BI-RADS, TI-RADS, PI-RADS, Lung-RADS, LI-RADS, RECIST), epônimos protegidos, conversão automática de unidades e fine-tuning por instituição. O resultado: laudos estruturados, rapidamente revisáveis, com estrutura correta por modalidade e coerência de classificação.
A telemetria de produção mostra TAT mediano de 52s no laudo completo, da abertura do editor à assinatura. O motor propõe; o médico decide.
WER baixo não basta. Em radiologia, o que importa é não inverter lateralidade, não corromper acrônimo e não perder a unidade da medida — com revisão médica visível antes da assinatura.
Perguntas frequentes
Por que um reconhecimento de voz genérico não serve para laudo radiológico?
Porque ele falha em vocabulário médico (epônimos, termos como 'hipersinal-T2'), corrompe acrônimos de classificação (BI-RADS vira 'abirads') e sub-representa o sotaque regional brasileiro. Um motor radiológico-PT usa léxico controlado por modalidade, eponímia protegida e conversão de unidades.
Qual a diferença entre speech-to-text e speech-to-report?
Speech-to-text transcreve a fala literalmente; speech-to-report gera um laudo já estruturado, com seções, vocabulário padronizado e coerência entre achados e impressão — revisável em segundos pelo radiologista, que edita e assina.
WER é a métrica certa para avaliar transcrição clínica?
Não isoladamente. O que correlaciona com satisfação clínica é a taxa de correção. Vale medir também acurácia de terminologia, lateralidade, medidas, estrutura e classificação — métricas que o WER global não captura.
A Laudos.AI substitui o radiologista?
Não. A Laudos.AI estrutura e acelera o laudo, mas o médico revisa, edita e assina. O uso é assistivo, sob responsabilidade do radiologista (Resolução CFM 2.454/2026). A IA propõe; o médico decide.
Sobre o autor
Dr. Natan Paraíso Ribeiro — Radiologista formado no InRad/HC-FMUSP. Desenvolvedor único e acionista da Laudos.AI. Encarregado de Dados (DPO) pela LGPD. Escreve sobre IA em radiologia, governança clínica e a camada de laudo que vem depois da imagem.
Conteúdo de uso assistivo, sob responsabilidade do radiologista (Resolução CFM 2.454/2026; LGPD/ANPD). A Laudos.AI não substitui o radiologista nem realiza diagnóstico: a IA acelera a estrutura do laudo, e o médico revisa, edita e assina.
Referências
Estruture seus laudos com o Laudos.AI
Ditado em português com terminologia radiológica, estruturação automática por modalidade, sinalização de achados críticos (CRIT) e integração com seu PACS/RIS atual — com governança CFM 2.454/2026 e LGPD documentada, e o radiologista sempre no controle.