La Regla 2 Minuto de voz a texto en línea
Reconocimiento automático de vozWhisper es un maniquí basado en Transformer con una estructura de codificador-decodificador, entrenado tanto en datos exclusivamente en inglés como en datos multilingües. Los modelos en inglés se centraron en el reconocimiento del acento, mientras que los multilingües abordaron tanto el reconocimiento del deje