Principale Innovare La nuova intelligenza artificiale di Google Text-to-Speech è così buona che scommettiamo che non puoi dirlo da un vero essere umano

La nuova intelligenza artificiale di Google Text-to-Speech è così buona che scommettiamo che non puoi dirlo da un vero essere umano

Il Tuo Oroscopo Per Domani

Riesci a distinguere tra il parlato al computer generato dall'intelligenza artificiale e un essere umano reale e vivo? Forse hai sempre pensato di poterlo fare. Forse sei affezionato ad Alexa e Siri ma credi che non confonderesti mai nessuno dei due con una vera donna.



Le cose stanno per diventare molto più interessanti. Gli ingegneri di Google hanno lavorato duramente per creare un sistema di sintesi vocale chiamato Tacotron 2 . Secondo a carta hanno pubblicato questo mese, il sistema crea prima uno spettrogramma del testo, una rappresentazione visiva di come dovrebbe suonare il discorso. Quell'immagine viene passata attraverso l'algoritmo WaveNet esistente di Google, che utilizza l'immagine per produrre un discorso umano dal suono estremamente naturale.

leone cuspide vergine donna innamorata

Utilizzando questo metodo, i ricercatori riferiscono: 'Il nostro modello raggiunge un punteggio medio di opinione (MOS) di 4,53 paragonabile a un MOS di 4,58 per il discorso registrato professionalmente'. (Un punteggio medio di opinione è un termine di telecomunicazioni che misura il suono realistico di qualcosa.)

Come dimostrano i campioni audio di Google, Tacotron 2 è in grado di rilevare dal contesto la differenza tra il sostantivo 'deserto' e il verbo 'deserto', nonché il nome 'presente' e il verbo 'presente' e modificarne la pronuncia di conseguenza. Può porre l'accento sulle parole in maiuscolo e applicare l'inflessione corretta quando si pone una domanda piuttosto che fare una dichiarazione.

E può generare un testo che suona così simile al linguaggio umano che è difficile o impossibile conoscere la differenza. Se vuoi vedere quanto è difficile, vai su Google pagina dei campioni audio e scorri verso il basso fino all'ultima serie di campioni, intitolata 'Tacotron 2 or Human?' Lì troverai Tacotron 2 e una persona reale che pronunciano frasi come 'Quella ragazza ha fatto un video sul rossetto di Star Wars'.



AVVISO SPOILER: Per metterti alla prova, ascolta i campioni e indovina quale è prima di leggere il resto di questa colonna.

Quindi quali campioni sono sintesi vocale e quali sono una vera voce umana? Gli ingegneri di Google non lo dicono, ma hanno lasciato un indizio molto grande. Ciascuno degli esempi di file .wav ha un nome file contenente il termine 'gen' o 'gt.' Sulla base del documento, è altamente probabile che 'gen' indichi il discorso generato da Tacotron 2 e 'gt' sia il vero discorso umano. ('GT' probabilmente sta per 'verità di base', un termine di apprendimento automatico che significa fondamentalmente 'il vero affare.')

Supponendo che sia corretto, ecco le risposte al test:

quanti anni ha Ottavia Bourdain?

'Quella ragazza ha fatto un video sul rossetto di Star Wars.'

Esempio 1: umano reale Real

Campione 2: Tacotron 2

'Ha conseguito un dottorato in sociologia alla Columbia University.'

Campione 1: Tacotron 2

Esempio 2: umano reale

'George Washington è stato il primo presidente degli Stati Uniti.'

Campione 1: Tacotron 2

Esempio 2: umano reale

che segno è il 2 settembre?

'Sono troppo impegnato per il romanticismo.'

Esempio 1: umano reale Real

Campione 2: Tacotron 2

Quanti ne hai azzeccati? E sapevi davvero la differenza, o dovevi solo indovinare?



Articoli Interessanti

Scelta Del Redattore

La neuroscienza afferma che questa regola TED Talk aiuterà la tua presentazione a distinguersi
La neuroscienza afferma che questa regola TED Talk aiuterà la tua presentazione a distinguersi
TED Talks dice ai relatori di evitare punti elenco sulle loro diapositive PowerPoint e di usare più immagini che parole.
19 idee su come spingersi al livello successivo
19 idee su come spingersi al livello successivo
Se non stai migliorando, stai peggiorando.
Chi è Jailyne Ojeda? Età, misure, patrimonio netto, chirurgia
Chi è Jailyne Ojeda? Età, misure, patrimonio netto, chirurgia
Sommario1 Chi è Jailyne Ojeda? Wiki Bio2 Infanzia e istruzione3 Carriera come modello e altre iniziative4 Vita amorosa e relazioni5 Hobby e altri interessi6 Patrimonio netto di Jailyne Chi è Jailyne Ojeda? Wiki Bio Jailyne Ojeda Ochoa è nata in Arizona, USA, il 9 gennaio 1998 – il suo segno zodiacale è Capricorno e tiene
Steve Austin Bio
Steve Austin Bio
Conoscere Steve Austin: biografia, relazione, sposato, moglie, patrimonio netto, etnia, stipendio, età, nazionalità, altezza, Wiki, social media, sesso, oroscopo. Chi è Steve Austin? Steve Austin, noto anche come 'Stone Cold' Steve Austin è un wrestler professionista, attore, presentatore e personaggio dei media americano in pensione.
Come Daymond John chiude gli scettici e perché pensa che la maggior parte degli imprenditori stia perdendo tempo
Come Daymond John chiude gli scettici e perché pensa che la maggior parte degli imprenditori stia perdendo tempo
L'imprenditore e star televisiva spiega il valore degli obiettivi e della grinta e degli idioti di 'Shark Tank'.
Cynthia Gibb Bio
Cynthia Gibb Bio
Conoscere Cynthia Gibb: biografia, relazione, divorzio, patrimonio netto, età, nazionalità, altezza, attrice, insegnante, ex modella, wiki, social media, genere, oroscopo. Chi è Cynthia Gibb? Cynthia Gibb è un'attrice, insegnante ed ex modella americana che ha recitato in film e televisione.
Alex Caruso Bio
Alex Caruso Bio
L'americano Alex Caruso è un giocatore di basket professionista, ha giocato per la G League dei Los Angeles Lakers della National Basketball Association (NBA) .Il 9 dicembre 2019, 142-125 vincono la partita contro i Timberwolves con 16 punti, 4 assist, 4 rimbalzi e 2 rubate in 30 minuti da Alex Caruso.