Voicebox to nowa sztuczna inteligencja opracowana przez spółkę Meta, właściciela Facebooka. To inteligentny generator mowy, tak potężny, że – jak firma twierdzi – przewyższa wszystkie istniejące do tej pory podobne rozwiązania.
Zacznijmy od kilku przykładów tego, co Voicebox już potrafi. Po pierwsze pozwala w zasadzie dowolnie i bardzo precyzyjnie edytować dowolny plik dźwiękowy. A więc możemy z jego pomocą usunąć np. z nagrania wywiadu lub reklamy wszelkie sumy lub odgłosy szczekającego psa lub hałas uliczny.
Po drugie, narzędzie na podstawie próbki głosu jest w stanie go idealnie zasymulować w dowolnej innej wypowiedzi. Zatem mają próbkę głosu np. naszego dziecka sprzed lat lub nieżyjącego członka rodziny, możemy teraz usłyszeć ich głosy z przeszłości jeszcze raz wypowiadające dowolne wpisanego z klawiatury teksty…
To nadal nie koniec. Dzięki Voicebox możemy też usłyszeć siebie lub kogokolwiek innego, którego dysponujemy próbką głosu, mówiącego w obcym języku – z odpowiednim akcentem. Meta twierdzi, że Voicebox może konwertować tekst pisany na słowa mówione w jednym lub wielu językach bez specjalnego szkolenia dla każdego języka osobno – warto posłuchać, jak to działa w praktyce. Szok.
Do tej pory Voicebox był uczony na próbkach pochodzących z 60 000 godzin angielskich audiobooków i 50 000 godzin wielojęzycznych plików dźwiękowych w sześciu językach
W sumie nowe narzędzie może pozwolić na stworzenie w przyszłości idealnych mechanicznych tłumaczy. Może też pomóc ludziom niedowidzącym i słabo słyszącym.
Może też stać się bardzo niebezpiecznym narzędziem do kreowania fikcyjnych wypowiedzi. Może pozbawić w przyszłości pracy miliony tłumaczy, lektorów i… nauczycieli języków obcych. Między innymi dlatego też Voicebox jest na razie publicznie niedostępny. Meta nie podaje, jakie ma dalej zamierzenia związane z tą sztuczną inteligencją.