di Yim Hyunsu
20 luglio 2023
Traduzione di Koreana
In uno studio di registrazione poco illuminato di Seoul, i produttori dell’etichetta musicale K-pop che ha portato al successo mondiale il gruppo BTS stanno utilizzando l’intelligenza artificiale per fondere la voce di un cantante sudcoreano con quella di un madrelingua in altre cinque lingue.
La tecnologia ha permesso alla HYBE, la più grande etichetta musicale della Corea del Sud, di pubblicare a maggio un brano del cantante MIDNATT in sei lingue: coreano, inglese, spagnolo, cinese, giapponese e vietnamita.
Alcuni cantanti K-pop hanno pubblicato canzoni in inglese e giapponese oltre che in coreano, ma secondo HYBE l’applicazione della nuova tecnologia per una pubblicazione simultanea in sei lingue è una novità a livello mondiale e potrebbe aprire la strada all’utilizzo di questa tecnologia da parte di artisti più popolari.
“Ascolteremo prima la reazione e la voce dei fan, poi decideremo quali saranno le nostre prossime mosse”, ha dichiarato Chung Wooyong, responsabile della divisione interactive media di HYBE, in un’intervista presso lo studio dell’azienda.
Lee Hyun, 40 anni, noto come MIDNATT, che parla poco inglese e cinese oltre al coreano, ha registrato la canzone “Masquerade” in ogni lingua.
I testi sono stati letti da madrelingua e successivamente sono stati combinati con l’aiuto della tecnologia musicale di intelligenza artificiale della HYBE, ha dichiarato Chung.
La canzone è l’ultimo segno della crescente influenza dell’intelligenza artificiale nell’industria musicale, in un momento in cui i Grammy Awards hanno introdotto nuove regole per l’uso della tecnologia e i mash-up di canzoni generati dall’intelligenza artificiale invadono i social media.
“Abbiamo diviso un brano in diverse componenti: pronuncia, timbro, altezza e volume”, ha detto Chung. “Abbiamo esaminato la pronuncia, che è associata al movimento della lingua, e abbiamo usato la nostra immaginazione per vedere che tipo di risultato avremmo potuto ottenere usando la nostra tecnologia”.
In un confronto prima e dopo, mostrato alla Reuters, è stato aggiunto un suono vocale allungato alla parola “twisted” nel testo inglese, ad esempio, per ottenere un suono più naturale, mentre non è stato apportato alcun cambiamento rilevabile alla voce del cantante.
L’utilizzo dell’apprendimento profondo alimentato dal framework Neural Analysis and Synthesis (NANSY) sviluppato da Supertone rende il suono della canzone più naturale rispetto all’utilizzo di software non AI, ha dichiarato Choi Hee-doo, chief operating officer di Supertone.
HYBE ha annunciato l’acquisizione di Supertone per 45 miliardi di won (36 milioni di dollari) a gennaio, e ha dichiarato di voler rendere accessibile ai creatori e al pubblico parte della tecnologia AI utilizzata per le canzoni di MIDNATT, ma non ha specificato se intende addebitare dei costi.
ESPERIENZA IMMERSIVA
MIDNATT ha dichiarato che l’uso dell’IA gli ha permesso di avere uno “spettro più ampio di espressioni artistiche”.
“Sento che la barriera linguistica è stata eliminata e che è molto più facile per i fan di tutto il mondo avere un’esperienza coinvolgente con la mia musica”, ha dichiarato in un comunicato.
Anche se la tecnologia non è nuova, si tratta di un modo innovativo di utilizzare l’IA nella musica, ha dichiarato Valerio Velardo, direttore di The Sound of AI, un servizio di consulenza per l’IA musicale e audio con sede in Spagna.
A lungo termine, non solo i musicisti professionisti, ma anche una popolazione più ampia trarrà beneficio dalla tecnologia musicale AI, ha affermato Velardo.
“Abbasserà la barriera della creazione musicale. È un po’ come Instagram per le foto, ma per la musica”.
Per ora, la tecnologia di correzione della pronuncia di HYBE impiega “settimane o mesi” per fare il suo lavoro, ma quando il processo si velocizzerà, potrebbe servire per una gamma più ampia di scopi, come l’interpretazione nelle videoconferenze, ha detto Choi Jin-woo, il produttore di “Masquerade” di MIDNATT che si fa chiamare Hitchhiker.
Fonte originale qui
