Un nuovo software Open Source per il riconoscimento vocale

La tematica è in continua evoluzione e progredisce con l’avanzare del tempo, attirando sempre più utenti all’interno di questa crescente cerchia.
Parliamo del riconoscimento vocale (ASR) e di un software rilasciato dal progetto Open AI, che si chiama Whisper. Innumerevoli organizzazioni hanno sviluppato sistemi di riconoscimento vocale altamente capaci, che sono alla base di svariati software e servizi che utilizziamo nel quotidiano dai giganti della tecnologia come Google, Amazon e Meta.

Ma ciò che rende diverso Whisper, secondo OpenAI, è che è stato addestrato con oltre 680.000 ore di dati raccolti dal web, che portano a un migliore riconoscimento di accenti, rumore di fondo e gergo tecnico. Inoltre, il suo utilizzo è abbastanza elementare: si da in pasto un file audio e magicamente ne restituisce a console il testo.

Altri due aspetti che ci fanno sorridere riguarda il fatto che il software è open source ed è accompagnato da un ampia documentazione che permette di essere operativi nel minor tempo possibile e, che supporta tante lingue, compreso l’italiano.
Ci sono anche alcuni limiti nell’area della previsione del testo e questo potrebbe portare ad includere nel testo alcune parole che non sono state effettivamente pronunciate.

Hai bisogno di assistenza sui tuoi progetti di Intelligenza Artificiale, Arte Generativa, Siti Internet, WordPress, Produzioni Video, Software Open Source?
Parla con noi:
la Redazione è operativa da lunedi a venerdi (10-13/16-19, festività escluse):
375 5204559

Detto questo, per chi si vuole avventurare nel testare Whisper nel repository Git è presente tutta la documentazione necessaria per poter procedere a piccoli passi.

Fonte: techcrunch.com
Fonte: wiki.ubuntu-it.org

Foto di Anete Lusina (rielab.)