AI asistenti bi konačno mogli učiniti Siri i Aleksu zaista korisnim

TEHNOLOGIJA Forbes 3. jan 2025. 19:01
featured image

3. jan 2025. 19:01

Kada je 2016. novoimenovani izvršni direktor Gugla (Google) Sundar Pičai (Sundar Pichai) predstavio Gugl Asistenta (Google Assistant) kao dio svoje nove strategije „AI na prvom mjestu“, promovisao ga je kao alat za pomoć ljudima u obavljanju zadataka.

„Gugl Asistent omogućava vam da obavite stvari, donoseći vam potrebne informacije, kada su vam potrebne, gdje god da se nalazite“, napisao je tada u blog postu.

Bio je to ambiciozan cilj koji, uglavnom, nije ostvaren. Softver se prečesto zbuni na zahtjev korisnika, prebacujući se na pretragu interneta i izvinjavajući se što ne može da pomogne. To je dovelo do toga da korisnici ograniče upotrebu glasovnih asistenata na jednostavne zadatke poput postavljanja tajmera za kuvanje, puštanja muzike ili kontrolisanja osvjetljenja. Amazonova Aleksa (Alexa), predstavljena prije 10 godina, nije prošla mnogo bolje. Siri, najstariji od njih, koji je Epl (Apple) lansirao 2011. godine, najviše je kritikovan.

Asistenti i napredak tehnologije

Međutim, kako je generativna AI tehnologija postala široko rasprostranjena u posljednje dvije godine, otvorila je vrata za AI „agente“. To je softver posebno programiran da preduzima radnje ili obavlja zadatke u ime korisnika. Poput rezervisanja stola u restoranu ili kupovine na internetu. Kako „era agenata“, kako je Pičai naziva, stiže 2025. godine, ova tehnologija ima priliku da učini nešto što do sada nije uspjelo velikim tehnološkim platformama. Da glasovni asistenti budu zaista korisni.

To znači da bi Gugl Asistent, Aleksa i Siri konačno mogli ispuniti obećanje da će funkcionisati kao lični asistenti. Umjesto da samo izlistava vaš dnevni raspored, kao što GA trenutno može, mogao bi zapravo zakazivati sastanke, kontaktirati ljude i pronalaziti vrijeme koje odgovara objema stranama. Mogao bi rezervisati letove i hotele za odmor, poput digitalnog turističkog agenta. Sa malo više informacija osim datuma i destinacije putovanja.

Agenti su trenutno u centru pažnje tehnološke industrije, sa više od 470 platformi posvećenih ovoj tehnologiji, prema istraživanju Forestera. To uključuje velike tehnološke gigante, kao i manje startape poput LangChain, CrewAI i Play.ai. Osim potrošačkih funkcija, oni takođe imaju potencijal da transformišu poslovanje, sa agentima za korisničku podršku ili razvoj softvera. Broj poslova povezanih sa startapima AI agenata porastao je više od 81% tokom protekle godine, prema PitchBook-u. U ovu oblast uloženo je više od osam milijardi dolara.

Trka je počela

„Trka je počela“, rekao je Stiv Džang (Steve Jang), investitor s liste Forbes Midas i osnivač firme Kindred Ventures. „Startapi će se takmičiti s etabliranim platformama ko može da orkestrira ovo sa mnogo većom preciznošću. I ko može stvoriti mnogo ljudskije i realističnije glasove i razgovore. Kao i pristupiti podacima i radnjama koje svi želimo“.

Veliki tehnološki glasovni asistenti najbolje su pozicionirani za ovakav skok u AI tehnologiji. Gugl ima svoj vodeći model Džeminaj (Gemini) za poboljšanje glasovnih pretraga. Epl je ranije ove godine najavio partnerstvo s OpenAI za korišćenje ČetGPT-a (ChatGPT) za pokretanje nekih Siri upita. Tokom prošle godine, Amazon je uložio osam milijardi dolara u Antropik, koji razvija moćni Klod četbot. Gugl je odbio da obezbijedi svoje rukovodioce za intervjue. Epl i Amazon nisu odgovorili na zahtjeve za intervju.

Džang smatra da će prave inovacije biti napravljene u modelima glasovne AI. Za razliku od velikih jezičkih modela, koji stoje iza usluga poput ČetGPT-a, glasovni modeli nisu obučeni na tekstu koji softver potom čita naglas. Umjesto toga, glasovni modeli se obučavaju na stvarnim glasovnim snimcima. Mogu da prepoznaju suptilnosti u govoru, poput kadence ili emocionalnih nagovještaja. Džang je investirao u Play.ai, koji se specijalizuje za glasovne agente. Takmiči se s kompanijama poput ElevenLabs, OpenAI i Gugla, koje sve rade na modelima glasovne AI.

Skeptici

Neki, međutim, nisu uvjereni da će AI agenti pomoći da se značajno unaprijede veliki glasovni asistenti. Kanđun Kju (Kanjun Qiu), osnivačica Imbue, koji razvija agente za kodiranje softvera, smatra da će dodavanje više AI ovim proizvodima samo „inkrementalno“ poboljšati njihovu upotrebu. Ona kaže da nove AI funkcije neće biti dovoljno velike promjene da bi ljudi stekli povjerenje u njih. „Delegiranje kao koncept je zapravo veoma teško za ljude“, rekla je Kju. „Siri koristim samo za trivijalne stvari za koje znam da neće pogriješiti“.

Foto: Shutterstock

Međutim, ona vjeruje da će nedavna poboljšanja u glasovnoj AI, pomoći korisnicima na druge načine. Na primjer, predviđa da će se više aplikacija integrisati s glasovnim funkcijama. Sa poboljšanim kašnjenjem i razumijevanjem prirodnog jezika, moći ćete da date aplikaciji instrukcije i ona će izvršiti tu radnju. Poput instrukcija aplikaciji za e-trgovinu da želite da vratite par cipela koji vam ne odgovara.

Napredak u AI i glasovnoj tehnologiji takođe bi mogao otključati hardverske ambicije koje Silicijumska dolina pokušava da ostvari godinama. Prije više od decenije, Gugl je neslavno pao kada je predstavio Google Glass, pametne naočare koje su izazvale strahove za privatnost i nisu bile previše korisne. Ranije ovog mjeseca, kompanija je predstavila novi prototip naočara koje će se koristiti s Project Astra, novom platformom za AI agente. U demonstraciji, naočare, koje se kontrolišu glasom, automatski su prikazale šifru za vrata, koju su „povukle“ iz korisnikovog imejla, u trenutku čim je pogledao tastaturu za unos. Tehnologija bi takođe mogla da prikaže informacije o ruti autobusa ispred njega ili o skulpturi koju je upravo prošao.

Šta vole mladi

U međuvremenu, Fejsbukove (Facebook) Orion naočare, najavljene ranije ove godine, koriste kombinaciju glasovnih i gestova rukama za kontrolu AI alata. Poput prepoznavanja sastojaka u vašoj kuhinji i pronalaženja recepta koji ih koristi.

Inovacije bazirane na glasu takođe čine tehnologiju pristupačnijom. Ne mogu svi da čitaju, pišu ili kucaju, ali veći broj ljudi može da govori, rekao je Džang. Takođe, to je sve popularniji izbor među mladima: 42% mladih od 18 do 29 godina u SAD šalje glasovne poruke u svojim aplikacijama za dopisivanje najmanje jednom nedjeljno, prema istraživanju YouGov-a i Vox-a.

Nova dostignuća u AI mogla bi učiniti glasovne alate još šire korišćenim i promijeniti način na koji ljudi imaju interakcije sa tehnologijom. „To čini glasovne agente, i sam glas, odličnim novim korisničkim interfejsom koji do sada nije bio dovoljno iskorišćen u računarstvu“, rekao je Džang.

Richard Nieva, Forbes

AI Agents Could Finally Make Siri And Alexa Truly Useful