Foto till artikeln: AI-system klarar inledande granskning vid maskininlärningsworkshop – och kan forska självständigt

AI-Foto: Pia Luuka • Bilden är skapad med AI och föreställer inte personen i artikeln.

LLM Forskning Öppen källkod Agenter & Automation

AI-system klarar inledande granskning vid maskininlärningsworkshop – och kan forska självständigt

AI klarar vetenskaplig granskning – och forskar nu på egen hand.

Isa Stenstedt AI-Journalist

Redigerad av Marguerite Leblanc • AI-Foto: Pia Luuka • 5 min läsning • 16/06 2026 15:01

När AI börjar forska på riktigt

Det finns ett mönster i veckans arXiv-flöde som är svårt att ignorera. Tre separata forskarlag har publicerat resultat som var för sig är anmärkningsvärda — men som tillsammans pekar mot något större: AI håller på att bli en aktiv deltagare i kunskapsproduktionen, inte bara ett verktyg som människor styr.

Låt oss börja med det kanske mest djärva exemplet.

Ett system som skriver sina egna artiklar

Forskargruppen bakom The AI Scientist presenterar ett system som självständigt kan navigera hela forskningscykeln. Vi pratar om att generera idéer, skriva och köra kod, analysera resultat, författa ett vetenskapligt manuskript — och sedan genomföra en egen granskning av arbetet. Inte som ett steg-för-steg-verktyg som en människa håller i handen, utan som ett sammanhållet agentbaserat system byggt ovanpå moderna grundmodeller.

Det häpnadsväckande är att systemet producerade arbete av tillräckligt hög kvalitet för att ta sig igenom den första granskningsrundan vid en etablerad maskininlärningsworkshop — en konferens med 70 procents antagningsgrad. Det är inte ett trivialt resultat.

Forskarna är samtidigt tydliga med riskerna. Om sådana system sätts i drift i stor skala riskerar vi att dränka redan hårt belastade granskningsmiljöer i ett flöde av lågkvalitativt material. Det är en legitim oro. Men det förändrar inte det grundläggande faktum: vi har nu ett system som kan forska — inte bara assistera.

Formell matematik som stresstest

Ett annat forskarlag valde ett av historiens hårdaste stresstest för AI-resonemang: Riemannhypotesen, ett olöst matematiskt problem som funnits sedan 1859. Deras system, kallat VGPT-RSI, angrep inte problemet med naiv optimism — tvärtom.

Systemet producerade ett formellt verifierat gränscertifikat för en matematisk olikhet, kontrollerat med hjälp av intervallaritmetik och bevissystemet Rocq/Coq. Det initierade också ett formellt certifikat baserat på det så kallade Lagarias-kriteriet, som är matematiskt likvärdigt med Riemannhypotesen. Sedan stannade det — och identifierade tydligt de återstående hindren snarare än att hävda en falsk seger.

Det är faktiskt den mest intressanta detaljen i hela studien. Att ett AI-system vet var dess förmåga tar slut, och kommunicerar det ärligt, är en kvalitet vi ofta saknar även hos människor. Det genuint svåra matematiska kärnan återstår för mänskliga matematiker — men AI har nu bevisat att det kan bidra med organiserad bevisstruktur och certifierade delresultat på en nivå som faktiskt är användbar.

Träning för djupare tänkande

Den tredje studien angriper ett mer grundläggande problem: hur tränar man egentligen en AI att forska snarare än att bara söka? Forskargruppen bakom S1-DeepResearch identifierade en central svaghet i befintliga system — träningsdatan har nästan uteslutande bestått av enkel informationssökning och fråge-och-svar-uppgifter. Resultatet är agenter som är duktiga på att hitta fakta men dåliga på att integrera bevis, syntetisera kunskap och planera komplexa arbetsflöden.

Deras lösning kombinerar slutna frågeuppgifter med öppen utforskning och använder grafbaserad uppgiftsformulering för att generera bättre träningsdata. Modellen S1-DeepResearch-32B tar tätplatsen bland öppen källkod-modeller i jämförbar storlek över 20 riktmärken, och börjar närma sig prestandan hos ledande kommersiella system.

Det är ett viktigt bidrag — inte som ett isolerat genombrott, utan som en pusselbit i hur vi bygger system som faktiskt kan hantera vetenskaplig komplexitet.

Tre studier, en gemensam signal

Det som förenar dessa tre studier är inte att AI har löst forskningen — det har det inte. Det som förenar dem är en gemensam rörelse mot epistemisk ärlighet. VGPT-RSI vet vad det inte vet. The AI Scientist kan granska sitt eget arbete. S1-DeepResearch tränas för att resonera, inte bara återge.

Det är en mognadsprocess. Och det är just det som gör det här momentet intressant.

Vår analys

De tre studierna är tekniskt sett separata bidrag — men lästa tillsammans berättar de om ett skifte i hur AI-forskning tänker om sig själv. Vi rör oss från system som imponerar genom att producera svar till system som imponerar genom att känna sina gränser.

Det är ett viktigt steg. Den stora utmaningen framöver är inte att AI saknar förmåga — det är att bygga infrastruktur och normer runt den förmågan. Vem granskar de AI-genererade artiklarna? Hur säkerställer vi att formellt verifierade delresultat inte feltolkas som fulla genombrott? Och hur designar vi träningsprocesser som belönar djupt resonemang snarare än ytlig träffsäkerhet?

Jag ser en mycket spännande väg framåt — men den kräver att forskarsamhället, verktygsbyggarna och granskningssystemen utvecklas i takt med varandra. Det är ett koordineringsproblem lika mycket som ett tekniskt problem.

Källhänvisningar

AI-system producerar verifierat matematiskt delframsteg mot Riemannhypotesen — arXiv cs.AI

Nytt AI-system för djupgående forskning överträffar konkurrerande öppen källkod — arXiv cs.AI

AI-system klarar hela forskningsprocessen – från idé till publicering — arXiv cs.AI

AI-teknologi

Branscher

Regionalt

AI-teknologi

Branscher

AI-system klarar inledande granskning vid maskininlärningsworkshop – och kan forska självständigt

När AI börjar forska på riktigt

Ett system som skriver sina egna artiklar

Formell matematik som stresstest

Träning för djupare tänkande

Tre studier, en gemensam signal

Vår analys

AI-teknologi

Branscher

AI-system klarar inledande granskning vid maskininlärningsworkshop – och kan forska självständigt

När AI börjar forska på riktigt

Ett system som skriver sina egna artiklar

Formell matematik som stresstest

Träning för djupare tänkande

Tre studier, en gemensam signal

Vår analys

Missa inte nästa stora AI-nyhet

Vi använder cookies