Maskinen tar över forskningen – bit för bit löses gränsen upp
AI löser på veckor vad forskare tidigare ägnade månader åt.
När verktygen börjar forska själva
Det har länge funnits en outtalad gräns i AI-debatten: maskiner kan hjälpa till, men den egentliga forskningen – den kreativa, iterativa, intellektuellt krävande processen – det är mänskligt territorium. Den gränsen håller på att lösas upp, bit för bit.
En ny översiktsstudie på arXiv introducerar begreppet AutoResearch för att beskriva hur AI-drivna system alltmer automatiserar hela vetenskapliga arbetsflöden, inte bara enskilda moment. Forskarna kartlägger ett spektrum från det de kallar Vibe Research – där människan granskar varje steg – till mer självständiga system som koordinerar litteraturinsamling, hypotesformulering, experimenterande, validering och kunskapsspridning på egen hand. Det är en riktigt användbar begreppsapparat för att förstå var vi faktiskt befinner oss.
Matematiken är inte längre ett undantag
Matematiket har länge setts som ett av de svåraste områdena för AI – inte för att det kräver kreativitet i traditionell mening, utan för att bevis kräver absolut korrekthet och långsiktigt resonemang. Två nya system utmanar den bilden på allvar.
Research Math Agents (RMA), presenterat på arXiv, löste åtta av tio avancerade forskningsproblem utvalda av expertmatematiker – och slog konkurrenter som GPT-5.2R. Systemet delar upp bevisarbetet i specialiserade moduler för problemanalys, litteratursökning och bevisverifiering, samordnade via ett gemensamt minne. Det är elegant systemdesign, inte magi.
På bevisoptimeringssidan presenteras ImProver 2, ett neuro-symboliskt ramverk för att automatiskt förbättra formella matematiska bevis i bevissystemet Lean 4. Det mest anmärkningsvärda: en modell med bara sju miljarder parametrar överträffar modeller som är storleksordningar större inom samma modellfamilj. Det visar att rätt arkitektur och träningsstruktur kan kompensera för råstyrka – ett resultat som borde intressera alla som jobbar med resurseffektiv AI.
Formell verifiering: från år till timmar
Nog så imponerande är Inductive Deductive Synthesis (IDS), ett system för formell verifiering av distribuerade system. Sådana system – tänk databaser och konsensusprotokoll – kräver bevis som håller under alla möjliga händelseförlopp, och arbetet har traditionellt tagit månader till år av specialistkompetens. IDS löser samtliga sju testspecifikationer på i genomsnitt 6,8 timmar till en kostnad av ungefär 106 dollar styck. Det är omkring 200 gånger snabbare än mänskliga experter. De implementationer systemet producerar är dessutom upp till tre gånger snabbare än tidigare publicerade lösningar. Det är inte en förbättring – det är en omstrukturering av hela arbetsflödet.
Informationsproblemet kräver sin egen lösning
All denna automatisering förutsätter att systemen har tillgång till relevant vetenskaplig kunskap – och det är ett genuint problem när antalet publicerade artiklar växer exponentiellt. SciAtlas adresserar just detta med ett massivt tvärvetenskapligt kunskapsnätverk: över 43 miljoner artiklar, 157 miljoner entiteter och tre miljarder relationskopplingar. Istället för nyckelordssökning använder systemet topologiskt resonemang för att hitta komplexa logiska samband mellan forskningsrön. Det är en avgörande infrastrukturkomponent för att AutoResearch-visionen ska fungera i praktiken.
Publicering och utvärdering hänger efter
Men forskningspipelinen slutar inte vid experimentet – den slutar vid publicering och granskning. AiraXiv är ett nytt förslag på hur det ledet kan moderniseras: en öppen plattform där AI-förstärkt analys kombineras med löpande läsaråterkoppling, och där artiklar kan utvecklas kontinuerligt snarare än låsas fast vid publicering. Systemet har redan testats som inlämningsplattform för konferensen ICAIS 2025.
Samtidigt varnar en separat studie på arXiv för ett grundläggande problem: de riktmärken vi använder för att utvärdera AI i kunskapsarbete är fortfarande utformade efter äldre språkteknologis logik. Höga poäng på dagens tester garanterar inte att ett system faktiskt klarar av att utföra motsvarande arbete i praktiken. Det är en viktig påminnelse om att imponerande resultat och verklig användbarhet inte alltid är samma sak.
Vår analys
Det som är slående med den här veckan är inte ett enskilt genombrott – det är mönstret. Vi ser samtidiga framsteg inom matematisk bevisning, formell verifiering, kunskapsinfrastruktur och publicering. Delarna i en fullständig forskningspipeline faller på plats, nästan i realtid.
Det väcker legitima frågor om akademins framtid. AutoResearch-studien är ärlig med begränsningarna: AI-autonomi fungerar bäst i strukturerade, verifierbara domäner och har tydliga brister när etisk bedömning eller institutionellt ansvar krävs. Det är en viktig nyansering.
Min bedömning är att den mest omedelbara omställningen sker i de tidiga faserna av forskning – litteraturöversikter, bevisverifiering, experimentdesign – snarare än i de frågor som kräver originell problemformulering. Det öppnar för en omfördelning av forskarens tid mot just det: att ställa de rätta frågorna. Det är inte ett hot mot akademin – det är en uppgradering av den, förutsatt att vi bygger rätt strukturer kring tillförlitlighet och ansvar.