Χτες ο Mark Zuckerberg ανακοίνωσε, το πρώτο σύστημα μετάφρασης ομιλίας με τεχνητή νοημοσύνη για μια άγραφη γλώσσα, την Χόκιεν(Hokkien). Το σύστημα μετάφρασης είναι το πρώτο ορόσημο για το έργο Universal Speech Translator (UST) της Meta AI, το οποίο εστιάζει…
…στην ανάπτυξη συστημάτων AI που παρέχουν μετάφραση ομιλίας σε πραγματικό χρόνο σε όλες τις γλώσσες, ακόμη και σε αυτές που ομιλούνται κυρίως. Ο Mark Zuckerberg μοιράστηκε για πρώτη φορά την πρόοδό της Meta σε αυτήν την έρευνα κατά τη διάρκεια της εκδήλωσης AI Inside the Lab τον Φεβρουάριο.
Η χρήση υπολογιστών για τη μετάφραση γλωσσών δεν είναι μια νέα ιδέα, όμως οι προηγούμενες προσπάθειες επικεντρώνονταν κυρίως στις γραπτές γλώσσες. Ωστόσο, οι περισσότερες από 7.000 ζωντανές γλώσσες, πάνω δηλαδή από το 40% των γλωσσών είναι κυρίως προφορικές και δεν έχουν ένα τυπικό ή ευρέως γνωστό σύστημα γραφής όπως η Χόκιεν. Οι ομιλητές άγραφων γλωσσών αντιμετωπίζουν συχνά δυσκολίες, όταν προσπαθούν να συμμετάσχουν σε διαδικτυακές κοινότητες, όπως το Μetaverse, και η Meta ευελπιστεί ότι αυτή η πρωτοβουλία θα τους διευκολύνει να επικοινωνούν με τρόπο που τους είναι φυσικός.
Η Χόκιεν είναι μόνο το πρώτο βήμα στην πορεία για τη μετάφραση 100 γλωσσών. Ως μέρος αυτής της εργασίας, κυκλοφορεί ένα demo, με ελεύθερη πρόσβαση, το μοντέλο μετάφρασης Χόκιεν, τα σύνολα δεδομένων αναφοράς και το matrix της ομιλίας.
Ελπίζοντας, ότι αυτό θα επιτρέψει στους ερευνητές να δημιουργήσουν τα δικά τους συστήματα μετάφρασης ομιλίας σε ομιλία (S2ST) και να αξιοποιήσουν τη δουλειά της Meta.