Nya AI-system förbättrar automatisk webbnavigering med upp till sju gånger bättre resultat
Nya AI-system navigerar webben sju gånger bättre än tidigare versioner.
AI-agenter tar steget in i den verkliga webben
AI-utvecklingen tar ett avgörande kliv framåt när forskare presenterar system som gör AI-agenter kapabla att hantera komplexa uppgifter på internet. Istället för att bara svara på frågor börjar dessa system agera som digitala assistenter som kan navigera webben, samla information och lösa problem självständigt.
Ett av de mest imponerande genombrotten kommer från Web2BigTable, enligt ny forskning från arXiv. Systemet använder en flernivåarkitektur där en överordnad koordinator delar upp komplexa uppgifter medan specialiserade arbetarenheter löser dem parallellt. Resultaten är slående – systemet uppnår 38,50 procent framgång i webbsökning, över sju gånger högre än tidigare metoder som bara når 5,10 procent.
Nyckeln ligger i koordination mellan olika AI-agenter genom en delad arbetsyta, där systemet undviker överflödig sökning och löser motstridiga bevis medan det kontinuerligt förbättrar sina metoder.
Lära sig navigera som människor gör
Parallellt utvecklar forskare AutoSurfer, ett system som tränar AI-agenter att navigera webbsidor genom att efterlikna mänskligt beteende. Istället för att förlita sig på isolerade handlingar använder metoden systematisk utforskning – precis som när vi människor lär oss nya webbplatser genom att metodiskt kartlägga sidor och funktioner.
Systemet visar tydliga förbättringar med 24,23 procent framgång i uppgiftsutförande jämfört med tidigare 19,59 procent, samtidigt som det skapar mer mångfaldiga träningsuppgifter som förbättrar AI-agenternas allmänna webbhantering.
Från digital assistans till materialdesign
Men AI-agenter begränsar sig inte till webben. MetaSymbO revolutionerar materialvetenskap genom att låta forskare beskriva önskade materialegenskaper i vanlig text istället för exakta numeriska mål. Systemets tre AI-agenter – Designer, Generator och Supervisor – samarbetar för att tolka intentioner, skapa kandidatstrukturer och ge återkoppling.
Resultaten är anmärkningsvärda: upp till 34 procent förbättring i strukturell giltighet för symmetri och nästan 98 procent för periodicitet, samtidigt som systemet uppnår 6-7 procent högre språkvägledningspoäng.
Utmaningar kvarstår
Trots framstegen avslöjar ny forskning betydande brister. InteractWeb-Bench, den första interaktiva testmiljön för webbskapande, visar att även avancerade AI-modeller fastnar i "blind körning" när de möter vaga instruktioner från vanliga användare. Problemet uppstår när otydliga instruktioner från icke-experter skapar semantisk bristande överensstämmelse med AI-modellernas förståelse.
För att hantera kostnaderna utvecklar forskare smarta lösningar som växlar mellan mindre och större modeller beroende på situationen. Genom "fastnad-övervakare" som upptäcker loopar och "milstolpe-övervakare" som identifierar kritiska beslutspunkter kan systemet drastiskt minska beräkningskostnader samtidigt som prestandan bibehålls.
Modulär design för framtiden
Det som gör dessa genombrott särskilt intressanta är deras modulära natur. Många av systemen kan läggas ovanpå befintliga AI-agenter utan att kräva omträning, vilket gör dem praktiskt användbara redan idag.
Vår analys
Vi bevittnar en fundamental förändring där AI-agenter utvecklas från reaktiva chatbotar till proaktiva digitala assistenter. Den koordinerade ansatsen med flera specialiserade agenter som samarbetar genom delade arbetsytor pekar mot framtiden för AI-system.
Särskilt intressant är hur forskarna tacklar verkliga utmaningar som kostnadsoptimering och hantering av otydliga instruktioner. Detta visar en mognad i fältet där fokus flyttas från rena prestandaförbättringar till praktisk användbarhet.
Den modulära designen är avgörande för adoption – företag kan integrera dessa förbättringar utan att ersätta befintliga system. Inom 2-3 år kommer vi troligen se dessa tekniker i kommersiella produkter, först inom specialiserade områden som materialdesign och datautvinning, sedan som allmänna webbassistenter. Utmaningen blir att balansera autonomi med kontroll när AI-agenter blir mer kapabla.