Ny AI-agent fra OpenAI vil kunne bestille billetter, bestille mat og utføre andre oppgaver på nettsteder i stedet for brukerne
OpenAI presenterte en ny AI-agent, Operator, som kan utføre oppgaver på Internett for brukerne.
Dette er hva vi vet
Agenten bruker sin egen nettleser til å surfe på nettet, klikke på knapper, skrive inn tekst og bla gjennom innhold. Dette gjør at den kan utføre oppgaver på Internett på samme måte som en person som klikker på knapper, blar gjennom sider og skriver inn tekst på nettsteder. I første omgang vil det nye produktet kun være tilgjengelig for ChatGPT Pro-abonnenter i USA.
Operatøren kjører på en spesiell modell som kombinerer funksjonene til GPT-4o med grundig opplæring. Dette gjør at den ikke bare kan "se" sider gjennom skjermbilder, men også samhandle med grensesnitt slik vi er vant til å gjøre med mus og tastatur.
Det mest interessante er at agenten ikke bare utfører oppgaver, men også kan korrigere seg selv. Hvis noe går galt, gir den deg kontroll over prosessen. Den vil også be om tillatelse hvis nettstedet krever sensitiv informasjon (for eksempel passord) eller be om ditt samtykke før du sender en e-post.
OpenAI har inngått samarbeid med populære selskaper som Uber, DoorDash, Instacart og andre for å sikre at agenten utfører oppgaver i den virkelige verden samtidig som den overholder sikkerhets- og etiske standarder. Alt fungerer imidlertid ikke perfekt - komplekse grensesnitt, som å lage en lysbildefremvisning, er fortsatt vanskelig for den.
I nær fremtid vil Operator være tilgjengelig for brukere av Plus-, Team- og Enterprise-abonnementene, og OpenAI planlegger å integrere denne teknologien direkte i ChatGPT.
Kilde: OpenAI OpenAI