Iceman parla grazie all'intelligenza artificiale, Spotify se la compra
Premessa: Top Gun: Maverick è nei cinema da quasi un mese, per cui ci permettiamo di fare un piccolo spoiler. Nel film, in alcune scene, è presente anche Tom Kazinsky, «Iceman» nella prima pellicola al fianco di Tom Cruise. L'attore, Val Kilmer, ha avuto il cancro. Il tumore alla gola gli è stato diagnosticato nel 2014 e, oltre alle cure, ha dovuto sottoporsi a un intervento di tracheotomia che gli ha causato la perdita quasi totale della voce. Nel sequel di Top Gun Iceman è malato di cancro e si esprime attraverso la digitazione delle parole su uno speciale computer che le riproduce. Ma riesce anche a pronunciare qualche frase. Come è stato possibile? Ecco il punto.
La startup che lavora con l'intelligenza artificiale
Il 9 agosto 2021 la Sonantic, una startup fondata nel 2018 con sede a Londra, ha diffuso un comunicato stampa in cui dichiarava: «L'anno scorso siamo stati contattati con una domanda interessante: "L'intelligenza artificiale è in grado di creare un modello vocale personalizzato per l'attore Val Kilmer?". Lui e il suo team sapevano che lo avrebbe aiutato a esplorare nuovi modi per comunicare, connettersi e realizzare qualcosa anche in futuro. Non vedevamo l'ora di "restituirgli" la sua voce». Detto, fatto. Il team di Val Kilmer ha fornito ore di filmati d'archivio con la voce dell'attore nelle pellicole in cui ha recitato. L'audio è stato pulito dal rumore di fondo e ne sono state generate delle trascrizioni da accoppiare con l'audio. Il Voice Engine ha quindi iniziato ad «addestrare» il modello con i dati e si è resa necessaria l'implementazione di nuovi algoritmi, perché il materiale non era sufficiente. Il deep learning è l’apprendimento profondo che ottimizza processi di intelligenza artificiale (AI), grazie al machine learning (ML), con cui le macchine possono «imparare». Un apprendimento automatico e gerarchico che imita il modo in cui gli umani acquisiscono alcune tipologie di conoscenza. «Abbiamo collaborato a questo modello vocale perché crediamo che aiuterà Val a connettersi con le persone e gli consentirà di continuare a raccontare storie che ci commuovono», ha dichiarato a suo tempo la co-fondatrice e CEO di Sonantic, Zeena Qureshi. L'altro fondatore, John Flynn, ha spiegato a Forbes di avere «generato più di 40 modelli vocali diversi, selezionando quello migliore a livello qualitativo ed espressivo».
È stato un successo. Il faccia a faccia tra il tenente Kazinsky e Maverick ha commosso gli spettatori. «La prima visione della scena con Tom mi ha davvero emozionato - ha scritto Val Kilmer in una mail indirizzata a USA Today -. Quasi 40 anni, un bel po’ di tempo per una reunion. Abbiamo riso tutto il giorno. Tom è grandioso e sorprendentemente divertente». Anche la figlia dell'attore, Mercedes Kilmer, ha espresso parole importanti: «Sono stata sul set, l'ho visto dal vivo e l'ho trovato straordinario - ha dichiarato al New York Post -. Significa molto per mio padre, che è orgoglioso del film. È ciò che ama fare. È stato molto speciale per lui trovarsi sul set insieme agli amici con cui ha realizzato il primo film quando aveva la mia età». E a proposito della Sonantic, Val Kilmer ha aggiunto: «Sono grato all'intero team che ha magistralmente restaurato la mia voce in un modo che non avrei mai immaginato possibile. Come esseri umani, la capacità di comunicare è il fulcro della nostra esistenza e gli effetti del cancro alla gola hanno reso difficile per gli altri capirmi. La possibilità di raccontare la mia storia, con una voce che sembri autentica e familiare, è un dono incredibilmente speciale».
Spotify acquisisce Sonantic
Sonantic è decollata insieme a Top Gun. Il suo nome è finito su tutte le testate che si occupano di cinema (e non solo), il suo uso dell'intelligenza artificiale ha permesso a Val Kilmer di fare il pieno al botteghino e di riprovare l'emozione di 36 anni prima. E tutto ciò ha attirato l'attezione di molti, tra cui Spotify. Il colosso della musica in streaming ha acquisito la startup. Un «momento spartiacque» come viene definito in una nota. «Dal momento in cui abbiamo fondato Sonantic , il nostro obiettivo era creare un'intelligenza artificiale all'avanguardia per offrire prestazioni vocali avvincenti e altamente espressive che avrebbero trasformato i prodotti e l'intrattenimento per sempre. Da soli, abbiamo creato una potente piattaforma che ha trasceso altre tecnologie vocali di intelligenza artificiale, consentendo ai creatori di generare voci straordinariamente realistiche che possono flirtare, piangere e gridare. Con la nostra piattaforma abbiamo offerto ai professionisti dell'intrattenimento e alle aziende nuovi modi per dare vita ai personaggi e abbiamo consentito loro di attingere a voci personalizzate».
Un nuovo grande capitolo per la startup. «Siamo davvero entusiasti della possibilità di portare la tecnologia vocale AI di Sonantic sulla piattaforma Spotify e di creare nuove esperienze per i nostri utenti - ha dichiarato Ziad Sultan, vicepresidente della divisione Personalizzazione di Spotify -. Questa integrazione ci permetterà di coinvolgere gli utenti in un modo nuovo e ancora più personalizzato». Nel comunicato della startup riguardo all’acquisizione si legge: «In Spotify, abbiamo identificato diverse potenziali opportunità per la sintesi vocale sulla nostra piattaforma, e riteniamo che nel lungo periodo, una voce di alta qualità sarà importante per aumentare i nostri ascolti. Per esempio, questa tecnologia potrebbe aiutarci a fornire agli utenti un contesto agli utenti sui prossimi consigli quando non guardano i loro schermi. L'uso della voce in questi momenti può ridurre le barriere alla creazione di nuove esperienze audio e aprire le porte a opportunità ancora più nuove». Zeena Qureshi e John Flynn si sono espressi in una dichiarazione congiunta. «Crediamo nel potere della voce e nella sua capacità di promuovere una connessione più profonda con gli ascoltatori di tutto il mondo e sappiamo di poter essere migliori che mai sulla piattaforma audio più grande del mondo».
Un passo, per Spotify, verso l'ampliamento dell'offerta di podcast che - come emerso nel corso dell'Investor Day - nel 2021 hanno generato 200 milioni di euro. Definita come «paradiso del suono», l'azienda vuole offrire nuove esperienze interattive e virtuali sia ai fan sia agli artisti. Di recente ha anche avviato un test di sperimentazione per permettere ad artisti selezionati di promuovere i loro NFT nell'app direttamente dal loro profilo sulla piattaforma.