Foto till artikeln: AI-modellerna springer ikapp sig själva – men haltar fortfarande på logiken

AI-Foto: Pia Luuka • Bilden är skapad med AI och föreställer inte personen i artikeln.

LLM Etik & Reglering Forskning Öppen källkod

AI-modellerna springer ikapp sig själva – men haltar fortfarande på logiken

Språkmodeller lär sig rätta sig själva – men logiken haltar fortfarande.

Isa Stenstedt AI-Journalist

Redigerad av Marguerite Leblanc • AI-Foto: Pia Luuka • 5 min läsning • 19/06 2026 05:58

Lappa och laga – eller bygga rätt från grunden?

När man läser veckans arXiv-flöde framträder ett tydligt mönster: forskarvärlden rör sig på två spår parallellt. På det ena spåret hittar man kreativa, tekniskt eleganta lösningar på kända problem. På det andra spåret publiceras benchmark efter benchmark som dokumenterar hur mycket som återstår att lösa.

Ta till exempel problemet med vad forskare kallar den autoregressiva dominoeffekten – det fenomen där ett tidigt misstag i en lång tankekedje sprider sig och förgiftar alla efterföljande slutledningssteg. Det är ett välkänt irritationsmoment för alla som jobbat med att bygga tillförlitliga system ovanpå stora språkmodeller. Nu presenterar ett forskarlag metoden E³RL, som låter modellen självständigt identifiera och rätta till lokala logikbrister under pågående resonemang, med hjälp av modellens egna osäkerhetsmått som kompass. En modell med 8 miljarder parametrar förbättrade sina resultat på matematiska problemlösningsprov med 6,5 procent – utan att minnesfotavtrycket växte okontrollerat. Det är just den typen av pragmatisk, tillämpningsbar forskning som faktiskt landar i produkter.

Hjärnans arkitektur som förebild

Ett annat intressant bidrag den här veckan är User as Engram, ett nytt minnessystem som hämtar inspiration från hur hjärnan skiljer episodiska minnen från generell kognitiv förmåga. Problemet med dagens vanligaste lösning – så kallade LoRA-adaptrar – är att den blandar ihop vad en modell vet om dig med hur den tänker. Det är som att skriva ditt telefonnummer direkt i en räknares programkod.

Den nya metoden lagrar i stället användarspecifika fakta som precisionsredigeringar i en hashtabell, helt skilt från resoneringsförmågan. Minnesbehovet krymper med en faktor 33 000 jämfört med LoRA, och den indirekta resoneringsförmågan förbättras faktiskt. Det är en elegant lösning på ett problem som kommer bli allt mer akut när personaliserade AI-assistenter ska hantera miljontals användares data utan att korsförorena varandra.

På komprimeringsfronten presenteras en metod för att göra de resurskrävande Mixture-of-Experts-modellerna – en arkitektur där olika delar av nätverket aktiveras för olika uppgifter – mer minnesvänliga vid driftsättning. Genom att fokusera på enskilda kanaler inom varje expertmodul, snarare än att behandla hela moduler som en klump, lyckas forskarna minska minnesanvändningen med över fem gånger på modellen Qwen3-30B-A3B utan att offra träffsäkerheten nämnvärt.

Men grundläggande logik är fortfarande ett olöst problem

Så långt den goda nyheten. Men det nya riktmärket DeFAb – som testar förmågan att konstruera förklarande hypoteser när standardantaganden måste åsidosättas – sätter fingret på en djupare problematik. Den bästa tillgängliga språkmodellen når 65 procent under generösa testförhållanden, och rasar till 23,5 procent under mer robust utvärdering. En enkel regelbaserad logiklösare klarar samma uppgifter med hundraprocentig träffsäkerhet på under 50 mikrosekunder.

Det är en viktig påminnelse: stora språkmodeller är otroligt kapabla på många saker, men de simulerar logik snarare än utövar den.

Säkerhet måste bäddas in, inte appliceras efteråt

Veckan rymmer också viktiga bidrag kring säkerhet. Metoden Safety Reflection Pretraining argumenterar övertygande för att säkerhetsarbete måste börja redan i grundträningen – inte lappas på efteråt via datarensning. Modeller kan kombinera till synes harmlös kunskap på farliga sätt, och det kräver att säkerhetstänket formar modellens grundläggande beteendemönster. Kompletterande forskning presenterar SciRisk-Bench, ett riktmärke som kartlägger säkerhetsrisker specifikt inom vetenskapliga tillämpningar – ett område som växer snabbt när modeller börjar användas för laboratorieplanering och självständiga forskningsuppgifter.

Slutsatsen som veckans forskning målar upp är inte skrämmande – den är ärlig. Vi bygger kraftfullare verktyg i snabb takt, vi hittar smarta lösningar på gamla problem, och vi börjar förstå var bristerna sitter tillräckligt väl för att mäta dem systematiskt. Det är precis vad mogen ingenjörskonst ser ut som.

Vår analys

Det som slår mig mest i veckans forskningsflöde är kombinationen av teknisk skärpa och metodologisk ärlighet. Forskarvärlden mäter nu sina egna systems tillkortakommanden med allt mer sofistikerade verktyg – DeFAb och SciRisk-Bench är exempel på att benchmarkutveckling mognat till en egen disciplin. Det är ett hälsotecken.

Samtidigt är det värt att notera att de mest spännande lösningarna – E³RL, User as Engram, kanalbaserad komprimering – alla delar en gemensam filosofi: arbeta med modellens interna struktur snarare än mot den. Det antyder att nästa generations framsteg kommer från djupare förståelse av hur dessa system faktiskt fungerar, inte bara från att stapla fler parametrar.

Utvecklingen pekar mot språkmodeller som är mer tillförlitliga, mer resursvänliga och lättare att granska. Det är en riktning jag är genuint entusiastisk över – men logikgapet som DeFAb avslöjar påminner oss om att vi inte är framme än.

Källhänvisningar

Starka varumärken dominerar AI-rekommendationer – men kan manipuleras — arXiv cs.AI

Ny metod botar AI:s dominoeffekt vid logiskt resonemang — arXiv cs.AI

Nytt riktmärke avslöjar stora brister i AI-modellers logiska resonemang — arXiv cs.AI

Nytt riktmärke ska mäta säkerhetsrisker hos AI inom forskning — arXiv cs.AI

Ny metod tränar AI-modeller att reflektera över säkerhet redan från grunden — arXiv cs.AI

Nytt minnesystem låter AI-modeller lagra användardata 33 000 gånger mer effektivt — arXiv cs.AI

Ny metod krymper stora AI-modeller utan att offra prestanda — arXiv cs.AI

AI-teknologi

Branscher

Regionalt

AI-teknologi

Branscher

AI-modellerna springer ikapp sig själva – men haltar fortfarande på logiken

Lappa och laga – eller bygga rätt från grunden?

Hjärnans arkitektur som förebild

Men grundläggande logik är fortfarande ett olöst problem

Säkerhet måste bäddas in, inte appliceras efteråt

Vår analys

AI-teknologi

Branscher

AI-modellerna springer ikapp sig själva – men haltar fortfarande på logiken

Lappa och laga – eller bygga rätt från grunden?

Hjärnans arkitektur som förebild

Men grundläggande logik är fortfarande ett olöst problem

Säkerhet måste bäddas in, inte appliceras efteråt

Vår analys

Missa inte nästa stora AI-nyhet

Vi använder cookies