Szef Microsoftu dość zaskakująco stwierdził ostatnio, że asystenci głosowi, czyli Alexa, Siri oraz Cortana są "głupi jak but". Niegdyś ważne elementy domowych urządzeń są dziś wyśmiewane. Dlaczego tak się stało? O tym w internetowym Radiu RMF24 opowiadał w rozmowie z Marcinem Jędrychem Norbert Cała, dziennikarz technologiczny portalu techlove.pl.

REKLAMA

Marcin Jędrych, Radio RMF24: "Asystenci głosowi są głupi jak but". Słyszał pan to oświadczenie? Czy pan się z tym zgadza?

Twoja przeglądarka nie obsługuje standardu HTML5 dla audio

Jak wygląda obecnie sytuacja na rynku technologicznym?

Norbert Cała: Prawdopodobnie, gdyby pan mnie zapytał o to pół roku temu, to bym zaprzeczył i powiedział, że wcale tak nie myślę. Powiedziałbym, że to są bardzo użyteczne narzędzia. Ale gdy rozmawiamy teraz, na początku 2023 r., to może nie ująłbym tego w ten sposób, ale jest tutaj bardzo dużo racji. Faktycznie po tym, co się wydarzyło w końcówce tamtego roku i na początku tego - czyli wybuchu sztucznej inteligencji, która na początku zaczęła rysować sama obrazy, a teraz za pomocą ChatGPT można rozmawiać o wszystkim i radzić się na temat wszystkiego - wychodzi na to, że asystenci głosowi: właśnie Siri, Cortana czy Alexa są po prostu mocno niedoinformowani. Są troszkę w tyle.

To jest chyba najbardziej zaskakujące, że wszystkie te wymienione systemy są produktami potężnych i bardzo bogatych firm. Przecież Siri to flagowy produkt Apple, którym się od dawna szczycili. Patrząc na to, co Siri potrafiło na początku i co potrafi dzisiaj - sam też jestem użytkownikiem tego systemu - to właściwie mam wrażenie, że tu nie ma żadnej przełomowej zmiany. Czy oni przespali w takim razie ten moment? Nie traktowali poważnie sztucznej inteligencji, chociażby ChatGPT, czy też innych systemów i teraz są po prostu daleko w tyle?

Troszeczkę tak jest. Myślę, że najbliżej jest Google ze swoim asystentem, ponieważ Google ma konkurencję dla ChatGPT, czyli Barda. Gdy pojawił się ChatGPT i Microsoft zapowiedział, że wprowadzi go do przeglądarki Bing - co już zrobił - to Google przekazało, że za chwilę wprowadzi do swojej wyszukiwarki jeszcze mądrzejszego Barda. Bard znajdzie się pewnie też w Asystencie Google. Na to trzeba będzie jednak jeszcze troszeczkę poczekać. Wizja połączenia takiej sztucznej inteligencji, jaką znamy właśnie w postaci ChatGPT, na przykład z Siri - którego pan i ja używamy w domach - jest niesamowita. Z tym narzędziem da się rozmawiać praktycznie tak, jakbyśmy rozmawiali z żywą osobą. Można zapytać się go o jakąś rzecz, można także się dopytać o coś w kontekście tego, o czym była wcześniejsza rozmowa. Przełożenie tego na język mówiony z języka pisanego, to nie jest żadne osiągnięcie technologiczne, które nie jest teraz możliwe do realizacji. To jest powiązanie tego, co znamy, czyli rozpoznawania głosu, syntezy głosy z odpowiedziami, które też już mamy. Tak naprawdę ten, kto pierwszy z tych dużych asystentów głosowych to połączy, wygra.

Ten wyścig ma właściwie trzech zawodników: Google, Microsoft i Apple.

Nie zapominajmy o Amazonie. Jest bardzo popularny, może nie w Polsce, ale w Stanach Zjednoczonych.

W takim razie jest czterech graczy. Chyba oni wszyscy stoją jeszcze w jednej linii i ten, kto uzyska przewagę, potem będzie miał sukces finansowy na kilka ładnych dekad.

Zgadza się. Nie wątpię w to, że jeszcze w tym półroczu zobaczymy asystenta głosowego, który będzie potrafił komunikować się z nami, czerpiąc z wiedzy jednego z dużych agregatorów treści, jakimi są systemy sztucznej inteligencji. One mają bardzo dużo wiedzy i potrafią tę wiedzę w bardzo szybkim czasie przełożyć na odpowiedzi na pytania, które zadaliśmy.

Czytałem niedawno taki artykuł o rozwoju sztucznej inteligencji, o której dzisiaj tu rozmawiamy. Jeden z dyskutantów w tej rozmowie zastanawiał się nad tym, kiedy ktoś wpadnie na pomysł, żeby to jeszcze dodatkowo skomercjalizować, czyli żeby emitować reklamy. Może nie nachalnie, a może nachalnie, bo oczywiście różne są opcje. Przecież za darmo nikt tego nam nie da, każda z tych firm będzie chciała w jakiś sposób to wykorzystać. Pytanie, czy to w takim wydaniu w ogóle jest możliwe i czy ktoś się na to odważy?

Mam nadzieję, że te reklamy będą bardzo subtelne. To znaczy, że będą to reklamy na zasadzie znanej już z wyszukiwarek, np. Google. Zadajemy pytanie np. jaki komputer będzie najlepszy do gier i dostajemy odpowiedź, że do gier najlepszy będzie taki, a taki komputer. Pod tą odpowiedzią dostajemy reklamę kontekstową, że ten komputer można kupić tutaj, tutaj i tutaj. To będzie taka reklama delikatna. Raczej nie będzie tak, że zapytamy się o coś i zamiast dostać odpowiedź prawidłową i tę najlepszą, dostaniemy odpowiedź z sugerowaną reklamą. Mam nadzieję, że do takiej sytuacji nie dojdzie.

Na ten moment w ogóle sobie nie wyobrażam reklamy w asystentach głosowych. Może w ogóle powód, dla którego asystenci głosowi się nie rozwijają za dobrze, to fakt, że są trudni do komercjalizacji. Jeżeli komuś zależy na tym, żeby sprzedawać więcej produktów, które są zintegrowane z danym asystentem głosowym, to będzie w niego inwestował. Tak naprawdę chyba na razie nie ma takiego gracza na rynku, który byłby tym mocno zainteresowany.

Czy np. za dwa lata, wiosną 2025 roku będzie jeden wiodący system sztucznej inteligencji, który będzie "zarządzał" naszym życiem, czy też ciągle będzie konkurencja?

Dobrze, że pan zapytał tylko o perspektywę dwóch lat, bo już się bałem o 5 lat. Wtedy musiałbym powiedzieć, że nie mam pojęcia, jak to będzie. Tak szybko się wszystko pozmieniało przez ostatnie pół roku. Za dwa lata myślę, że ten system się podzieli trochę tak, jak jest podzielony teraz. Będziemy mieli jednego wiodącego gracza, tak jak mamy teraz wyszukiwarkę Google, a inni będą próbowali za nim nadążyć. Myślę, że ta konkurencja będzie cały czas trwała. Aczkolwiek, ostatnio mówiłem w swoim podcaście, że zostało zburzone status quo internetu. Do tej pory Google był synonimem wyszukiwania, mówimy, że możemy coś wyguglować, zamiast wyszukać. Myślę, że Google tutaj poczuje troszeczkę oddech na plecach i zyskamy może duopol - będą dwa różne systemy dostępne na rynku. Uważam, że w tym kierunku będzie to szło. Może systemów nie będzie jakoś bardzo dużo, ale przynajmniej ze dwa systemy sztucznej inteligencji dostępne dla komercyjnego użycia będziemy mieli właśnie za te dwa lata.

Opracowanie: Wiktoria Urban