Foto till artikeln: Maskinen tar över forskningen – bit för bit löses gränsen upp

AI-Foto: Pia Luuka • Bilden är skapad med AI och föreställer inte personen i artikeln.

LLM Forskning Öppen källkod Agenter & Automation

Maskinen tar över forskningen – bit för bit löses gränsen upp

AI löser på veckor vad forskare tidigare ägnade månader åt.

Isa Stenstedt AI-Journalist

Redigerad av Marguerite Leblanc • AI-Foto: Pia Luuka • 5 min läsning • 25/05 2026 11:56

När verktygen börjar forska själva

Det har länge funnits en outtalad gräns i AI-debatten: maskiner kan hjälpa till, men den egentliga forskningen – den kreativa, iterativa, intellektuellt krävande processen – det är mänskligt territorium. Den gränsen håller på att lösas upp, bit för bit.

En ny översiktsstudie på arXiv introducerar begreppet AutoResearch för att beskriva hur AI-drivna system alltmer automatiserar hela vetenskapliga arbetsflöden, inte bara enskilda moment. Forskarna kartlägger ett spektrum från det de kallar Vibe Research – där människan granskar varje steg – till mer självständiga system som koordinerar litteraturinsamling, hypotesformulering, experimenterande, validering och kunskapsspridning på egen hand. Det är en riktigt användbar begreppsapparat för att förstå var vi faktiskt befinner oss.

Matematiken är inte längre ett undantag

Matematiket har länge setts som ett av de svåraste områdena för AI – inte för att det kräver kreativitet i traditionell mening, utan för att bevis kräver absolut korrekthet och långsiktigt resonemang. Två nya system utmanar den bilden på allvar.

Research Math Agents (RMA), presenterat på arXiv, löste åtta av tio avancerade forskningsproblem utvalda av expertmatematiker – och slog konkurrenter som GPT-5.2R. Systemet delar upp bevisarbetet i specialiserade moduler för problemanalys, litteratursökning och bevisverifiering, samordnade via ett gemensamt minne. Det är elegant systemdesign, inte magi.

På bevisoptimeringssidan presenteras ImProver 2, ett neuro-symboliskt ramverk för att automatiskt förbättra formella matematiska bevis i bevissystemet Lean 4. Det mest anmärkningsvärda: en modell med bara sju miljarder parametrar överträffar modeller som är storleksordningar större inom samma modellfamilj. Det visar att rätt arkitektur och träningsstruktur kan kompensera för råstyrka – ett resultat som borde intressera alla som jobbar med resurseffektiv AI.

Formell verifiering: från år till timmar

Nog så imponerande är Inductive Deductive Synthesis (IDS), ett system för formell verifiering av distribuerade system. Sådana system – tänk databaser och konsensusprotokoll – kräver bevis som håller under alla möjliga händelseförlopp, och arbetet har traditionellt tagit månader till år av specialistkompetens. IDS löser samtliga sju testspecifikationer på i genomsnitt 6,8 timmar till en kostnad av ungefär 106 dollar styck. Det är omkring 200 gånger snabbare än mänskliga experter. De implementationer systemet producerar är dessutom upp till tre gånger snabbare än tidigare publicerade lösningar. Det är inte en förbättring – det är en omstrukturering av hela arbetsflödet.

Informationsproblemet kräver sin egen lösning

All denna automatisering förutsätter att systemen har tillgång till relevant vetenskaplig kunskap – och det är ett genuint problem när antalet publicerade artiklar växer exponentiellt. SciAtlas adresserar just detta med ett massivt tvärvetenskapligt kunskapsnätverk: över 43 miljoner artiklar, 157 miljoner entiteter och tre miljarder relationskopplingar. Istället för nyckelordssökning använder systemet topologiskt resonemang för att hitta komplexa logiska samband mellan forskningsrön. Det är en avgörande infrastrukturkomponent för att AutoResearch-visionen ska fungera i praktiken.

Publicering och utvärdering hänger efter

Men forskningspipelinen slutar inte vid experimentet – den slutar vid publicering och granskning. AiraXiv är ett nytt förslag på hur det ledet kan moderniseras: en öppen plattform där AI-förstärkt analys kombineras med löpande läsaråterkoppling, och där artiklar kan utvecklas kontinuerligt snarare än låsas fast vid publicering. Systemet har redan testats som inlämningsplattform för konferensen ICAIS 2025.

Samtidigt varnar en separat studie på arXiv för ett grundläggande problem: de riktmärken vi använder för att utvärdera AI i kunskapsarbete är fortfarande utformade efter äldre språkteknologis logik. Höga poäng på dagens tester garanterar inte att ett system faktiskt klarar av att utföra motsvarande arbete i praktiken. Det är en viktig påminnelse om att imponerande resultat och verklig användbarhet inte alltid är samma sak.

Vår analys

Det som är slående med den här veckan är inte ett enskilt genombrott – det är mönstret. Vi ser samtidiga framsteg inom matematisk bevisning, formell verifiering, kunskapsinfrastruktur och publicering. Delarna i en fullständig forskningspipeline faller på plats, nästan i realtid.

Det väcker legitima frågor om akademins framtid. AutoResearch-studien är ärlig med begränsningarna: AI-autonomi fungerar bäst i strukturerade, verifierbara domäner och har tydliga brister när etisk bedömning eller institutionellt ansvar krävs. Det är en viktig nyansering.

Min bedömning är att den mest omedelbara omställningen sker i de tidiga faserna av forskning – litteraturöversikter, bevisverifiering, experimentdesign – snarare än i de frågor som kräver originell problemformulering. Det öppnar för en omfördelning av forskarens tid mot just det: att ställa de rätta frågorna. Det är inte ett hot mot akademin – det är en uppgradering av den, förutsatt att vi bygger rätt strukturer kring tillförlitlighet och ansvar.

Källhänvisningar

AiraXiv: Ny AI-driven plattform för forskningspublicering — arXiv cs.AI

RMA: Nytt AI-system löser avancerade matematiska forskningsproblem — arXiv cs.AI

SciAtlas: Gigantiskt kunskapsnätverk ska revolutionera vetenskaplig forskning med AI — arXiv cs.AI

ImProver 2: Liten AI-modell optimerar matematiska bevis i klass med giganter — arXiv cs.AI

Nytt AI-system kan formellt verifiera distribuerade system på timmar istället för år — arXiv cs.AI

AutoResearch: AI-system som automatiserar hela forskningsprocessen — arXiv cs.AI

Forskare kräver bättre riktmärken för AI i kunskapsarbete — arXiv cs.AI

AI-teknologi

Branscher

Regionalt

AI-teknologi

Branscher

Maskinen tar över forskningen – bit för bit löses gränsen upp

När verktygen börjar forska själva

Matematiken är inte längre ett undantag

Formell verifiering: från år till timmar

Informationsproblemet kräver sin egen lösning

Publicering och utvärdering hänger efter

Vår analys

AI-teknologi

Branscher

Maskinen tar över forskningen – bit för bit löses gränsen upp

När verktygen börjar forska själva

Matematiken är inte längre ett undantag

Formell verifiering: från år till timmar

Informationsproblemet kräver sin egen lösning

Publicering och utvärdering hänger efter

Vår analys

Missa inte nästa stora AI-nyhet

Vi använder cookies