Presentació de veu a text, text a veu i més per a més de 1.100 idiomes

Presentació de veu a text, text a veu i més per a més de 1.100 idiomes

Jordi Mas al Twitter:

Meta publica nous models de síntesi i reconeixement de la parla per a 1.100 llengües. En la part de reconeixement per al català, quan es comparen amb Whisper d’OpenAI amb mètrica WER (més baixa, millor), Whisper és encara millor.

⚠️Els models de Meta són CC-BY-NC (no lliures) ☹️

https://lnkd.in/dFuVAndU