Ten obraz został wygenerowany przez aplikację OpenAI DALL-E 2 ze słów „nieskończona radość”.
Przez ostatnie kilka dni bawiłem się DALL-E 2, aplikacją opracowaną przez firmę OpenAI z San Francisco, która zamienia opisy tekstowe w hiperrealistyczne obrazy.
OpenAI zaprosiło mnie do przetestowania wersji beta DALL-E 2 (nazwa jest grą słowną łączącą WALL-E Pixara i artystę Salvadora Dalí) i szybko wpadłem w obsesję. Spędziłem godziny wymyślając dziwne, zabawne i abstrakcyjne podpowiedzi, aby nakarmić sztuczną inteligencję - „rendering 3D podmiejskiego domu w kształcie rogalika”, „dagerotypowy portret Kermita Żaby z 1850 roku”, „szkic węglem drzewnym dwóch pingwinów pijących wino w paryskim bistro”. W ciągu kilku sekund DALL-E 2 wypluwał garść obrazów przedstawiających moją prośbę - często z oszałamiającym realizmem.
Oto na przykład obraz wykonany przez DALL-E 2, gdy wpisałem "czarno-białą fotografię gangstera z 1920 roku robiącego selfie". I jak poradziła sobie z moją prośbą o wysokiej jakości zdjęcie "żaglówki wykonanej z niebieskiej przędzy".
„Czarno-biała fotografia gangstera z 1920 roku robiącego selfie.”
Wygenerowane przez OpenAI DALL-E 2
„Żaglówka zrobiona na drutach z niebieskiej przędzy.”
Wygenerowane przez OpenAI DALL-E 2
DALL-E 2 może być również bardziej abstrakcyjny. Na przykład ilustracja na górze tego artykułu jest tym, co wygenerował, gdy poprosiłem o oddanie „nieskończonej radości”. (Spodobał mi się on tak bardzo, że zamierzam go wydrukować i powiesić na ścianie.)
W DALL-E 2 wrażenie robią nie tylko obrazy, ale także sposób, w jaki je generuje. Nie są to kompozyty wykonane z istniejących obrazów internetowych - są to całkowicie nowe kreacje wykonane w złożonym procesie sztucznej inteligencji zwanym „dyfuzją”,gdzie sztuczna inteligencja zaczyna od losowej serii pikseli, a następnie udoskonala ją wielokrotnie, aż dopasuje je do danego opisu tekstowego. I szybko robi się w tym lepsza - obrazy DALL-E 2 są cztery razy bardziej szczegółowe w porównaniu do obrazów generowanych przez oryginalny DALL-E, który został wprowadzony dopiero w zeszłym roku.
DALL-E 2, gdy został ogłoszony w tym roku, zyskał wiele uwagi, i słusznie. To imponująca technologia mogąca mieć duży wpływ na każdego, kto zarabia na życie pracując z obrazami - ilustratorów, grafików, fotografów i tak dalej. Rodzi to również ważne pytania o to, do czego zostanie wykorzystana cała ta sztuka generowana przez sztuczną inteligencję i czy musimy się martwić o wzrost syntetycznej propagandy, hiperrealistycznych deepfake'ów, a nawet pornografii bez zgody pokazywanych osób.
Ale obrazy nie są jedynym obszarem, w którym sztuczna inteligencja robi duże postępy.
W ciągu ostatnich 10 lat – okresu, który niektórzy badacze sztucznej inteligencji zaczęli nazywać "złotą dekadą" – nastąpiła fala postępu w wielu dziedzinach badań nad sztuczną inteligencją, napędzana przez rozwój technik, takich jak głębokie uczenie oraz pojawienie się specjalistycznego sprzętu do uruchamiania ogromnych, intensywnych obliczeniowo modeli sztucznej inteligencji.
Niektóre z tych postępów były powolne i stabilne - chociaż inne większe modele z większą ilością danych i mocy obliczeniowej przyniosły nieco lepsze wyniki.
Ale innym razem wydawało się to bardziej jak przesunięcie przełącznika - niemożliwe akty magii nagle stawały się możliwe.
Na przykład zaledwie pięć lat temu najbardziej znaną historią w świecie sztucznej inteligencji był AlphaGo, model głębokiego uczenia zbudowany przez Google DeepMind, który mógł pokonać najlepszych ludzi na świecie w grze planszowej Go. Trenowanie sztucznej inteligencji, aby wygrywać turnieje Go, było zabawną sztuczką imprezową, ale nie był to dokładnie ten rodzaj postępu, na którym zależy większości ludzi.
DeepMind ogłosił, że jego system sztucznej inteligencji AlphaFold przewidział prawie wszystkie z 200 milionów białek, o których wiadomo, że istnieją.
Tego lata DeepMind ogłosił, że AlphaFold przewidział prawie wszystkie z 200 milionów białek, o których wiadomo, że istnieją - tworząc skarbnicę danych, które pomogą badaczom medycznym opracować nowe leki i szczepionki na nadchodzące lata. W ubiegłym roku czasopismo Science uznało znaczenie AlphaFold, nazywając go największym przełomem naukowym roku.
Teraz może pochylmy się na tym, co dzieje się w dziedzinie tekstu generowanego przez sztuczną inteligencję.
Jeszcze kilka lat temu chatboty SI miały trudności nawet z prymitywnymi rozmowami – nie mówiąc już o trudniejszych zadaniach językowych.
Ale teraz duże modele językowe, takie jak GPT-3 OpenAI, są używane do pisania scenariuszy, komponowania e-maili marketingowych i tworzenia gier wideo. (Użyłem nawet GPT-3 do napisania recenzji książki do tego artykułu w zeszłym roku - i gdybym wcześniej nie wskazał moim redaktorom, wątpię, czy podejrzewaliby cokolwiek.)
SI również pisze kod - ponad milion osób zarejestrowało się, aby korzystać z Copilot GitHub, narzędzia wydanego w zeszłym roku, które pomaga programistom pracować szybciej, automatycznie kończąc fragmenty kodu.
Jest też LaMDA Google'a, model sztucznej inteligencji, który trafił na pierwsze strony gazet kilka miesięcy temu, kiedy Blake Lemoine, starszy inżynier Google, został zwolniony po tym, jak twierdził, że stał się świadomy.
Google zakwestionował twierdzenia pana Lemoine'a, a wielu badaczy SI spierało się z jego wnioskami. Ale pomijając część dotyczącą samoświadomości, oraz słabszą wersja jego argumentu – że LaMDA i inne najnowocześniejsze modele językowe stają się niesamowicie dobre w prowadzeniu ludzkich rozmów tekstowych – nie wzbudziłaby tylu reakcji.
W rzeczywistości wielu ekspertów powie ci, że w dzisiejszych czasach sztuczna inteligencja jest coraz lepsza w wielu dziedzinach - nawet w obszarach, takich jak język i rozumowanie, gdzie kiedyś wydawało się, że ludzie mają przewagę.
„Wydaje się, że przechodzimy od wiosny do lata” - powiedział Jack Clark, współprzewodniczący corocznego raportu SI Index Na Uniwersytecie Stanforda. „Wiosną masz te niejasne sugestie postępu i wszędzie małe zielone pędy. Teraz wszystko kwitnie”.
W przeszłości postęp sztucznej inteligencji był w większości oczywisty tylko dla wtajemniczonych, którzy nadążali za najnowszymi artykułami badawczymi i prezentacjami konferencyjnymi. Ale ostatnio, według pana Clarka, nawet laicy mogą wyczuć różnicę.
„Kiedyś patrzyłeś na język generowany przez sztuczną inteligencję i mówiłeś: «Wow, to w pewnym sensie napisało zdanie»” mówi pan Clark „A teraz patrzysz na rzeczy, które są generowane przez sztuczną inteligencję i mówisz: «To jest naprawdę zabawne, lubię to czytać» lub «Nie miałem nawet pojęcia, że to zostało wygenerowane przez SI.»”
„Główna siedziba Google w Mountain View w Kalifornii Duże firmy technologiczne muszą lepiej wyjaśniać, nad czym pracują, bez PR” Laura Morton dla The New York Times
Wciąż istnieje wiele kiepskich, zepsutych SI, od rasistowskich chatbotów po samojezdne Tesle, które wjeżdżają w drzewa. A nawet gdy sztuczna inteligencja szybko się poprawia, często zajmuje trochę czasu, aby przefiltrować produkty i usługi, z których ludzie faktycznie korzystają. Przełom w SI w Google lub OpenAI dzisiaj nie oznacza, że twój Roomba jutro będzie mógł pisać powieści.
Ale najlepsze systemy sztucznej inteligencji są teraz tak zdolne – i poprawiają się w tak szybkim tempie – że dyskusja w Dolinie Krzemowej zaczyna się zmieniać. Mniej ekspertów z przekonaniem przewiduje, że mamy lata, a nawet dekady, aby przygotować się na falę zmieniającej świat sztucznej inteligencji; wielu wierzy teraz, że poważne zmiany są tuż za rogiem, na dobre i na złe.
Ajeya Cotra, starszy analityk z Open Philanthropy, który bada ryzyko SI, oszacowała dwa lata temu, że istnieje 15 procent szans na „transformacyjną sztuczną inteligencję” – którą ona i inni zdefiniowali jako sztuczną inteligencję, która jest wystarczająco dobra, aby zapoczątkować zmiany gospodarcze i społeczne na dużą skalę, takie jak wyeliminowanie większości miejsc pracy związanych z wiedzą umysłową – pojawiające się do 2036 r.
Ale w niedawnym poście pani Cotra podniosła to do 35 procent szans, powołując się na szybką poprawę systemów takich jak GPT-3.
„Systemy sztucznej inteligencji mogą przejść od uroczych i bezużytecznych zabawek do bardzo wydajnych produktów w zaskakująco krótkim czasie” - powiedziała mi pani Cotra. „Ludzie powinni traktować poważniej, że sztuczna inteligencja może wkrótce coś zmienić, a to może być naprawdę przerażające.”
Jest wielu sceptyków, którzy mówią, że twierdzenia o postępie SI są przesadzone. Powiedzą ci, że sztuczna inteligencja wciąż nie jest bliska stania się czującą lub zastąpienia ludzi w wielu różnych zawodach. Powiedzą, że modele takie jak GPT-3 i LaMDA są tylko gloryfikowanymi papugami, ślepo zwracającymi swoje dane treningowe, i że wciąż jesteśmy dziesięciolecia od stworzenia prawdziwej A.G.I. – ogólnej sztucznej inteligencji – która jest w stanie „myśleć” za siebie.
Są też optymiści technologiczni, którzy wierzą, że postęp SI przyspiesza i którzy chcą, aby jeszcze przyspieszyła. Uważają, że przyspieszenie tempa poprawy SI da nam nowe narzędzia do leczenia chorób, kolonizacji przestrzeni kosmicznej i zapobiegania katastrofom ekologicznym.
Nie proszę o opowiedzenie się po którejś ze stron w tej debacie. Wszystko, co mówię, to: powinieneś zwracać większą uwagę na rzeczywiste, namacalne wydarzenia, które je napędzają.
W końcu sztuczna inteligencja, która działa, nie pozostaje w laboratorium. Jest wbudowany w aplikacje społecznościowe, z których korzystamy na co dzień, w postaci algorytmów rankingowych na Facebooku, rekomendacji YouTube i stron TikTok "For You". Trafia do broni używanej przez wojsko i oprogramowania używanego przez dzieci w ich klasach. Banki wykorzystują sztuczną inteligencję do określania, kto kwalifikuje się do pożyczek, a departamenty policji wykorzystują ją do badania przestępstw.
Nawet jeśli sceptycy mają rację, a sztuczna inteligencja nie osiągnie samoświadomości na poziomie ludzkim przez wiele lat, łatwo jest dostrzec, jak systemy takie jak GPT-3, LaMDA i DALL-E 2 mogą stać się potężną siłą w społeczeństwie. W ciągu kilku lat zdecydowana większość zdjęć, filmów i tekstów, które napotykamy w Internecie, mogłaby być generowana przez sztuczną inteligencję. Nasze interakcje online mogą stać się dziwniejsze i bardziej napięte, ponieważ będziemy mieli problem rozróżnić, którzy z naszych partnerów konwersacyjnych są ludźmi, a którzy przekonującymi botami. A doświadczeni technologicznie propagandyści będą mogli wykorzystać tę technologię do rozpowszechniania ukierunkowanej dezinformacji na ogromną skalę, zniekształcając proces polityczny w sposób, którego się nie spodziewamy.
W świecie sztucznej inteligencji banałem jest mówienie rzeczy takich jak „musimy zacząć prowadzić społeczną rozmowę na temat ryzyka związanego z SI”. Było już wiele paneli w Davos, rozmów TED, think tanków i komisji etycznych SI, szkicujących plany awaryjne na dystopijną przyszłość.
To, czego brakuje, to wspólny, neutralny pod względem wartości sposób mówienia o tym, co dzisiejsze systemy sztucznej inteligencji są w stanie zrobić, oraz jakie konkretne zagrożenia i możliwości stwarzają.
Myślę, że trzy rzeczy mogą tu pomóc.
Po pierwsze, organy regulacyjne i politycy muszą nabrać tempa.
Ze względu na to, jak nowe jest wiele z tych systemów sztucznej inteligencji, niewielu urzędników publicznych ma jakiekolwiek bezpośrednie doświadczenie z narzędziami takimi jak GPT-3 lub DALL-E 2, ani nie rozumieją, jak szybko postępuje rozwój SI.
Widzieliśmy kilka prób wypełnienia luki - na przykład Stanfordzki Instytut Sztucznej Inteligencji zorganizował niedawno trzydniowy „obóz szkoleniowy SI” dla członków personelu Kongresu - ale potrzebujemy aby więcej polityków i organów regulacyjnych, zainteresowało się technologią. (I nie chodzi mi o to, że muszą zacząć podsycać strach przed apokalipsą SI, w stylu Andrew Yanga. Nawet przeczytanie książki takiej jak „The Alignment Problem” Briana Christiana lub zrozumienie kilku podstawowych szczegółów na temat działania modelu takiego jak GPT-3 stanowiłoby ogromny postęp.)
W przeciwnym razie moglibyśmy skończyć z powtórką tego, co stało się z firmami mediów społecznościowych po wyborach w 2016 r. – zderzeniem władzy Doliny Krzemowej i ignorancji Waszyngtonu, co doprowadziło tylko do impasu i przesłuchań.
Po drugie, duże firmy technologiczne inwestujące miliardy w rozwój sztucznej inteligencji – Google, Metas i OpenAI na całym świecie – muszą lepiej wyjaśniać, nad czym pracują, bez owijania w bawełnę i umniejszania ryzyka. Obecnie wiele z największych modeli sztucznej inteligencji jest opracowywanych za zamkniętymi drzwiami, przy użyciu prywatnych zestawów danych i testowanych tylko przez wewnętrzne zespoły. Kiedy informacje o nich są upubliczniane, często są albo rozwadniane przez korporacyjny PR, albo zakopane w tajemniczych pracach naukowych.
Bagatelizowanie ryzyka związanego z sztuczną inteligencją w celu uniknięcia reakcji może być sprytną strategią krótkoterminową, ale firmy technologiczne nie przetrwają długoterminowo, jeśli będą postrzegane jako mające ukryty program sztucznej inteligencji, który jest sprzeczny z interesem publicznym. A jeśli te firmy nie otworzą się dobrowolnie, inżynierowie SI powinni obejść swoich szefów i porozmawiać bezpośrednio z decydentami i dziennikarzami.
Po trzecie, media informacyjne muszą lepiej wyjaśniać postęp sztucznej inteligencji osobom niebędącym ekspertami. Zbyt często dziennikarze – i przyznaję, że byłem tu winny – polegają na przestarzałym stenogramie science-fiction, aby przetłumaczyć to, co dzieje się w SI, na ogólną publiczność. Czasami porównujemy duże modele językowe do Skynet i HAL 9000 i spłaszczamy obiecujące przełomy w uczeniu maszynowym do panicznych nagłówków "Roboty nadchodzą!", które naszym zdaniem będą rezonować z czytelnikami. Od czasu do czasu zdradzamy naszą ignorancję, ilustrując artykuły o modelach sztucznej inteligencji opartych na oprogramowaniu zdjęciami robotów fabrycznych opartych na sprzęcie – błąd, który jest tak niewytłumaczalny, jak wrzucenie zdjęcia BMW w historię o rowerach.
W szerokim aspekcie większość ludzi myśli o SI wąsko, ponieważ odnosi ją do siebie - Czy zajmie mi pracę? Czy jest lepsza czy gorsza ode mnie w umiejętności X lub zadaniu Y? – zamiast próbować zrozumieć wszystkie sposoby, w jakie sztuczna inteligencja ewoluuje i co to może oznaczać dla naszej przyszłości.
Zrobię to, co do mnie należy, pisząc o SI w całej jej złożoności i dziwności, bez uciekania się do hiperboli lub hollywoodzkich tropów. Ale wszyscy musimy zacząć dostosowywać nasze modele mentalne, aby zrobić miejsce dla nowych, niesamowitych maszyn pośród nas.