Només 5 línies
La petita conversa quotidiana
6296

Generar audiollibres de qualitat és un moment gràcies als models de llenguatge i les veus neuronals

Tinc el llibre Duna de Frank Herbert a mig llegir. El vaig començar fa uns mesos, però no el dono acabat. El tinc en paper, però també en format EPUB, perquè així el porto sempre al damunt amb altres llibres. He pensat que, si l'escolto com a audiollibre, avançaré més ràpid mentre cuino o estenc la roba.

Normalment, llegeixo els llibres electrònics amb ReadEra. L’aplicació té una funció de lectura en veu alta, però és molt frustrant perquè és impossible d'escoltar atentament; és massa monòtona. Després d'investigar aplicacions d'Android de lectura en veu alta i veus TTS (Text-to-Speech) alternatives en català, he arribat a la conclusió que la IA ho faria molt millor utilitzant biblioteques existents.

En cinc minuts, ja tenia un script funcional. Amb deu minuts més, un script que generava fitxers MP3 ben etiquetats. La qualitat de l'àudio és excepcional gràcies a les veus neuronals de Microsoft.

Si voleu el codi, només me l'heu de demanar per missage privat.

p.d. Tots els que vivien de fer apps de merda plenes d'anuncis hauran de tancar paradeta a l'era dels models de llenguatge grans (LLM).

Comentaris

Comenta mitjançant Delta Chat