Ονομάζεται Google Translatotron. Και κάνει κάτι που θα μας φοβήσεις. Λίγο. Αν και στα πρώτα στάδια θα μπορεί να μεταφράζει τη…
…φωνή μας και να κρατά ΚΑΙ το ηχητικό χρώμα. Δείτε μερικά audio δείγματα στο 1:00.
Το Google Translate έχει τρία βήματα όπως λέει το blog post της εταιρίας: “automatic speech recognition to transcribe the source speech as text, machine translation to translate the transcribed text into the target language, and text-to-speech synthesis (TTS) to generate speech in the target language from the translated text.” Αυτό που λέμε γίνεται κείμενο, μετά γίνεται άλλη γλώσσα και μετά machine intelligence ‘μιλά’ τα λόγια μας στην άλλη γλώσσα.
Το Translatotron δεν έχει το ενδιάμεσο στάδιο και η Google το καταφέρνει με ένα νευρωνικό δίκτυο που μετατρέπει “spectrograms of speech” (spectrogram είναι η οπτική αναπαραγωγή του δικτύου συχνοτήτων σε ήχο).
“It makes use of two other separately trained components: a neural vocoder that converts output spectrograms to time-domain waveforms, and, optionally, a speaker encoder that can be used to maintain the character of the source speaker’s voice in the synthesized translated speech,” λέει η Google.
WoW.