Czy sztuczna inteligencja jest gotowa, by rozumieć ludzkie emocje?

Reklama

śr., 05/05/2021 - 18:42 -- MagdalenaL

Zdjęcie: Czy marszczenie brwi jest koniecznie oznaką gniewu? Christopher Campbell / Unsplash, CC BY-SA

Sztuczna inteligencja (AI) łączy wszystkie złożone techniki komputerowe zdolne do naśladowania pewnych cech ludzkiej inteligencji (wykonywanie obliczeń, rozumowanie, rozpoznanie obiektów...). W ciągu ostatnich lat naukowcy pracujący nad sztuczną inteligencją zajmują się jedną kluczową i niezwykle złożoną umiejętnością: inteligencją emocjonalną, zdolnością rozumienia emocji. I nie bez powodu – jej pole zastosowań jest bardzo szerokie: bezpieczeństwo, marketing, edukacja, aż po zdrowie, a nawet towarzyszące nam w przyszłości roboty.

Lecz nadanie maszynom zdolności do rozpoznawania emocji stanowi duże wyzwanie dla nauki. Naukowcy wielu dyscyplin (sztuczna inteligencja, robotyka, psychologia, nauki kognitywne, neurologia, itp.) skupiają się wokół tego wyzwania i wciąż napotykają wiele problemów teoretycznych i technicznych.

AI udaje się dekodować pewne emocje w konkretnych warunkach

Dzięki pojawieniu się technik głębokiego uczenia (algorytmów utworzonych z wielu warstw sztucznych neuronów połączonych w sieci, zdolnych do wyboru stosownych informacji, a tym samym uczenia się w sposób stosunkowo automatyczny), obecne programy dają doskonałe wyniki w dekodowaniu wyrazów twarzy i emocji (z ponad 90% dokładnością), gdy są ćwiczone i zatwierdzane na zdjęciach zrobionych w idealnych warunkach.

W rzeczywistości większość baz danych obecnie używanych w sztucznej inteligencji składa się z „odegranych” wyrazów twarzy, w neutralnym otoczeniu i reprezentujących ograniczony zakres kategorii emocji.

Jednak w obliczu bardziej naturalnych danych z życia codziennego wydajność programów gwałtownie spada. Jak wyjaśnić te trudności?

Inspirowany Darwinem i uniwersalizmem, wciąż dominującym w psychologii emocji i głęboko zakorzeniony w kulturze popularnej (na myśl nasuwa się serial Lie to me lub Vice Versa Disney'a), modele leżące u podstaw algorytmów wykrywania emocji sugerują bezpośredni i unikalny związek między mimiką a niektórymi podstawowymi emocjami: radością, strachem, gniewem, smutkiem, zaskoczeniem, obrzydzeniem lub pogardą.

AI stara się zrozumieć subtelną i złożoną alchemię emocji

Jednak w życiu codziennym, ludzie bardzo rzadko mają typową i przejaskrawioną mimikę, którą możemy znaleźć w bazach danych. Ich wyrażenia emocji są bardziej zróżnicowane, subtelne i często niejednoznaczne. W rzeczywistości wszystkie obserwacje w sytuacjach naturalnych wskazują, że mimika jest bardzo różnorodna i zależna od wielu czynników.

Przede wszystkim kilka rodzajów mimiki może odzwierciedlać tę samą emocję. Rzeczywiście, stosownie do licznych czynników takich jak osobowość, poprzednie doświadczenia, kultura, role społeczne, które odgrywają, ale także w zależności od sytuacji, ludzie nie żyją i wyrażają emocji w ten sam sposób lub z taką samą intensywnością.

Ten sam wyraz twarzy może mieć wiele znaczeń. Na przykład, w zależności od sytuacji, zmarszczenie brwi może oznaczać gniew, obrzydzenie, smutek, lecz także bardziej złożone stany psychiczne, takie jak zdezorientowanie lub intensywną refleksję.

Ludzie dość instynktownie używają ogromnego zestawu informacji do wyrażania lub dekodowania emocji. W rzeczywistości, parafrazując Lisę Feldman Barrett, profesor psychologii na Northeastern University, wyraz twarzy nigdy nie jest odizolowany od reszty jak u Czarnoksiężnika z Krainy Oz – mimika zawsze pojawia się, by służyć konkretnemu celowi w danym kontekście, i to właśnie ten kontekst określa prawidłową interpretację wyrazu twarzy.

Kontekst może być definiowany jako zbiór okoliczności, w których pojawia się zdarzenie lub komunikat i które wpływają na jego znaczenie.

Jest to więc złożona i szeroka koncepcja, która może obejmować wiele informacji:

  • kontekst związany z samym przekazem, czyli ze wszystkimi modalnościami, w których może być wyrażony: słowami, gestami, pozami, kierunkiem spojrzenia, intonacją głosu itp.,

  • kontekst związany ze środowiskiem: miejscem, w którym się znajdujemy, czasem, pogodą, rodzajem sytuacji i tym, co się stało itp.,

  • kontekst społeczny: kultura i osobowość, obecne osoby i ich zachowania, itp.

To właśnie podstawowy problem dla sztucznej inteligencji. Na przestrzeni ostatnich pięciu lat przeprowadzono tylko osiem badań mających na celu zbadanie kontekstu, w którym pojawia się mimika, z których większość skupia się na analizie elementów środowiska fizycznego (lokalizacji, temperatury otoczenia itp.), które są łatwiejsze do sformalizowania.

Czy (prawdziwie) emocjonalna sztuczna inteligencja pozostaje w strefie marzeń?

Emocjonalna sztuczna inteligencja to stale rozwijająca się dziedzina – w ostatnich latach naukowcy opracowali coraz bardziej złożone systemy o coraz większej mocy. Jednak większość z nich została przetestowana w warunkach bardzo odległych od codziennego życia i można powiedzieć, że sztuczna inteligencja wciąż jest daleka od ludzkiej zdolności rozumienia emocji.

Jednym z głównych problemów jest to, że algorytmy są zaprojektowane do korzystania z danych i uzyskiwania z nich określonych wniosków, przez co nie są w stanie uwzględnić nowych i wyjątkowych sytuacji. Tak więc emocja jest zjawiskiem subtelnym i zmiennym, a jej zmiany zależą od wielu czynników, które nie są jeszcze w pełni określone przez teorię.

Jednak brak jasnej i ogólnej definicji pojęcia emocji nie powinien zniechęcać badaczy do badania tego zjawiska. Konieczne są dalsze badania, aby umożliwić sztucznej inteligencji zrozumienie subtelnych sposobów, w jakie dana osoba odczuwa, wyraża oraz wymienia się emocjami na co dzień.

Autor: 
Audrey Masson / tłum. Zuzanna Duda
Zagłosowałeś na opcję 'w górę'.

Reklama