Microsoft po cichu ujawnia nowy rodzaj sztucznej inteligencji (może cię po cichu wysadzić)

To przywilej być jednym z ostatnich ludzi.

Bardziej technicznie niepoprawny

Zdaję sobie sprawę, że w namacalnej przyszłości artyści znani wcześniej jako ludzie będą przejmującą mieszanką mięsa z frytkami.

Prawdopodobnie nie powinienem być zaskoczony, kiedy badacze Microsoftu przybyli, aby nieco przyspieszyć beznadziejną przyszłość.

To wszystko brzmiało tak niewinnie i tak naukowo. Tytuł pracy naukowców To było twórczo nieprzejrzyste: „Paradygmaty języka kodowania neuronowego to skrypty bez migawek do składania mowy”.

Jak myślisz, co to może oznaczać? Jest nowy i szybszy sposób Maszyna do pisania wypowiadanych słów?

także: Rewolucja w ChatGPT? Wygląda na to, że Microsoft ma wielkie plany dotyczące chatbota opartego na sztucznej inteligencji

Podsumowanie badaczy zaczyna się dość ładnie. Używa wielu słów, zwrotów i skrótów, które są nieznane, powiedzmy, wielu formom normalnego ludzkiego języka. Pokazuje, że model języka kodowania neuronowego nazywa się VALL-E.

Z pewnością ta nazwa ma cię zmiękczyć. Co może być przerażającego w technologii, która wygląda prawie jak ten uroczy mały robot z porywającego filmu?

będziemy, Może to: „VALL-E podkreśla możliwości uczenia się w kontekście i może być używany do syntezy wysokiej jakości osobistej mowy z zaledwie 3-sekundowym nagraniem niewidocznego mówcy jako podpowiedzi głosowej”.

Często chciałem podkreślić zdolności uczenia się. Zamiast tego musiałem uciekać się do czekania, aż się pojawią.

To, co wyłania się z ostatniego zdania badaczy, wywołuje dreszcze. Wielkie mózgi Microsoftu potrzebują teraz tylko 3 sekund, aby coś powiedzieć, aby udawać dłuższe zdania i być może wielkie przemówienia, których nie wygłosiłeś, ale brzmią tak jak ty.

Nie będę się zbytnio zagłębiał w naukę, bo żadne z nas nie odniesie z tego korzyści.

Wspomnę tylko, że VALL-E korzysta z biblioteki audio opracowanej przez jedną z najbardziej imponujących i niezawodnych firm na świecie – Meta. o nazwie Wolna liteTo magazyn 7000 osób mówiących łącznie 60 000 godzin.

Oczywiście słuchałem pracy VALL-E.

także: „Zobaczymy zupełnie nowy rodzaj komputera” — mówi pionier sztucznej inteligencji, Jeff Hinton

Słuchałem, jak mężczyzna mówi przez 3 sekundy. Następnie wysłuchałem ośmiosekundowego nagrania, które jego kopia VALL-E miała powiedzieć: „Następnie poruszali się ostrożnie wokół chaty po omacku, aby znaleźć coś, co pokazałoby, że Warrenton wykonał swoje zadanie”.

Ośmielam się zauważyć dużą, jeśli w ogóle, różnicę.

Prawdą jest, że wiele z tych twierdzeń brzmiało jak bardzo kiepskie fragmenty literatury osiemnastowiecznej. Przykład: „Tak więc ten zdrowy ludzki ojciec pocieszał swoją nieszczęśliwą córkę, a jej matka ponownie ją objęła, robiąc wszystko, co w jej mocy, by pocieszyć jej uczucia”.

Ale co mogę zrobić poza słuchaniem większej liczby przykładów podanych przez badaczy? Niektóre wersje VALL-E były bardziej podejrzane niż inne. Pisownia się nie zgadzała. Czuli się podzieleni.

Ogólny efekt jest jednak intymnie mrożący krew w żyłach.

Zostałeś już ostrzeżony, bo. Wiesz, że gdy dzwonią do ciebie oszuści, nie powinieneś z nimi rozmawiać, na wypadek gdyby cię nagrali, a następnie odtworzyli twój styl, aby twój nagi głos zamówił drogie produkty.

także: Korzystaj z personalizacji opartej na sztucznej inteligencji, aby blokować niechciane połączenia i SMS-y

Wydaje się jednak, że jest to inny poziom złożoności. Prawdopodobnie widziałeś już za dużo odcinków Peacock”schwytaćTam, gdzie deepfake’i służą jako normalna część rządu.Może naprawdę nie powinienem się martwić, ponieważ Microsoft jest obecnie tak miłą, nieobraźliwą firmą.

Jednak myśl, że ktoś może łatwo dać się nabrać, myśląc, że mówię coś, czego nie zrobiłem – i nigdy nie zrobię – nie sprawia, że czuję się swobodnie. Tym bardziej, że naukowcy twierdzą, że potrafią symulować „środowisko emocjonalne i wokalne” pierwszych trzech sekund mowy.

Poczujesz więc ulgę, że naukowcy odkryli ten potencjał dyskomfortu. przedstawiają: „Ponieważ VALL-E może syntetyzować mowę, która zachowuje tożsamość mówiącego, może wiązać się z potencjalnym ryzykiem nadużyć modelu, takich jak fałszowanie rozpoznawania głosu lub podszywanie się pod konkretnego mówcę”.

rozwiązanie? Zbuduj system wykrywania, mówią naukowcy.

Co może sprawić, że jedna lub dwie osoby będą się zastanawiać: „Więc dlaczego w ogóle to zrobiłem?”

Często w technologii odpowiedź brzmi: „Ponieważ możemy”.

Vasya Lebedev

„Nieuleczalny myśliciel. Miłośnik jedzenia. Subtelnie czarujący badacz alkoholu. Zwolennik popkultury”.

READ Wyciek z Assassin's Creed Valhalla Cup wskazuje na kolejny nowy dodatek • Eurogamer.net

Microsoft po cichu ujawnia nowy rodzaj sztucznej inteligencji (może cię po cichu wysadzić)

Bardziej technicznie niepoprawny

Naukowcy odkryli, że zastosowanie olefin w produkcji cementu może prowadzić do powstania betonu o ujemnej emisji dwutlenku węgla

Hutchinson twierdzi, że nowa Caracal Race to „najszybsza opona szutrowa na rynku”

Hutchinson twierdzi, że nowa Caracal Race to „najszybsza opona szutrowa na rynku”

Do Muzeum Polski trafia paczka od tajemniczego nadawcy – z brakującymi artefaktami w środku

NHS England ogłasza programy pilotażowe dotyczące „nowych sposobów pracy w praktyce ogólnej”

Lawrence Fox staje w obliczu śledztwa policyjnego po tym, jak udostępnił zdjęcie prezentera Narindera Kaura pod spódnicą

Składy drużyn Super Rugby Pacific: Blues, Chiefs, Crusaders, Highlanders, Hurricanes i Moana Pasifika wymienione w składach Rundy XI

Bardziej technicznie niepoprawny

Dodaj komentarz Anuluj pisanie odpowiedzi

More Stories

Naukowcy odkryli, że zastosowanie olefin w produkcji cementu może prowadzić do powstania betonu o ujemnej emisji dwutlenku węgla

Hutchinson twierdzi, że nowa Caracal Race to „najszybsza opona szutrowa na rynku”

Hutchinson twierdzi, że nowa Caracal Race to „najszybsza opona szutrowa na rynku”

You may have missed

Do Muzeum Polski trafia paczka od tajemniczego nadawcy – z brakującymi artefaktami w środku

NHS England ogłasza programy pilotażowe dotyczące „nowych sposobów pracy w praktyce ogólnej”

Lawrence Fox staje w obliczu śledztwa policyjnego po tym, jak udostępnił zdjęcie prezentera Narindera Kaura pod spódnicą

Składy drużyn Super Rugby Pacific: Blues, Chiefs, Crusaders, Highlanders, Hurricanes i Moana Pasifika wymienione w składach Rundy XI