Vem bygger framtidens kod – och vad är det värt?
Investerare satsar miljarder på AI som skriver kod helt på egen hand.
När kapital möter övertygelse
Det finns ögonblick då marknaden talar med ovanlig tydlighet. Det här är ett sådant ögonblick.
Enligt TechCrunch har det amerikanska startupbolaget Cognition – känt för sin autonoma mjukvaruingenjör Devin – tagit in mer än en miljard dollar i ny finansiering vid en värdering om 25 miljarder dollar före transaktionen. Det motsvarar drygt 250 miljarder svenska kronor. Rundan leddes av Lux Capital och General Catalyst, med medinvesterare som Founders Fund, Ribbit Capital och Layer Global. Bara åtta månader tidigare stängde bolaget en runda värd 400 miljoner dollar – vid en värdering på knappt hälften. Att värderingen mer än fördubblats på så kort tid är inte slumpmässigt. Det är ett uttalat förtroendevotum från några av Silicon Valleys mest inflytelserika kapitalförvaltare för att AI-driven mjukvaruutveckling är en marknad med genuint lång horisont.
Vad köper investerarna egentligen? Inte bara teknik – de köper en tes. Tesen att autonoma mjukvaruingenjörer kan förändra hur kod skrivs, granskas och driftsätts i grunden. Det är en stor satsning. Och den är långt ifrån ensam.
Vem leder racet – och hur vet vi det?
Mitt i allt kapital som flödar in uppstår en naturlig fråga: vilka modeller levererar faktiskt? Det är här startupbolaget Datacurve kliver in med ett välbehövligt bidrag till diskussionen. Företaget har, enligt Computer Sweden, lanserat ett nytt mätverktyg vid namn DeepSWE – konstruerat för att ge en mer rättvisande bild av AI-modellers verkliga programmeringsförmåga.
Det etablerade mätsystemet SWE-Bench Pro har länge fungerat som branschstandard, men Datacurve riktar skarp kritik mot dess upplägg: eftersom uppgifterna hämtas från offentliga kodarkiv kan modellerna redan ha exponerats för lösningarna under träningen. Det riskerar att ge en alltför smickrande bild av faktisk förmåga – en form av inbyggd partiskhet i själva mätmetoden.
DeepSWE bygger istället på 113 uppgifter från 91 kodprojekt och täcker fem programmeringsspråk. Resultaten är talande: OpenAIs GPT-5.5 toppar med 70 procent, följt av GPT-5.4 på 56 procent och Anthropics Claude Opus 4.7 på 54 procent. Googles Gemini 3.5 Flash landar på 28 procent – ett resultat som sannolikt kommer att sätta fart på intern diskussion hos sökjätten.
Detta är viktigt inte bara för modellrankningar utan för hela industrins trovärdighet. När miljarder kronor investeras baserat på prestandapåståenden behöver vi mätverktyg vi faktiskt kan lita på.
Lärandets gräns – och en startup som vill flytta den
Men bakom alla värderingar och mätresultat lurkar en mer fundamental utmaning: dagens AI-system slutar utvecklas när träningen är avslutad. Det är som att anställa en medarbetare som lär sig allt på sin första dag – och sedan aldrig mer.
Det är exakt det problem som nystartade Trajectory vill lösa. Bakom satsningen, som rapporteras av Wired, står ett team med bakgrund från Google DeepMind, Apple, OpenAI och Meta Superintelligence Labs. Deras mål är att bygga en plattform för kontinuerlig inlärning – system som faktiskt blir smartare ju mer de används, genom att lära sig av misstag i realtid.
Bolaget har tagit in 15 miljoner dollar i en tidig runda värderad till 115 miljoner dollar. Bland investerarna finns Bessemer Venture Partners, riskkapitalfirman Conviction, samt framstående enskilda investerare som Googles chefforskare Jeff Dean och Stanfordprofessorn Fei-Fei Li. Att just dessa namn ställer sig bakom satsningen är inte oviktigt – det signalerar att kontinuerlig inlärning betraktas som en teknisk prioritet av de som bäst förstår vad som återstår att lösa.
Verkställande direktören Ronak Malde pekar på att framgången för populära kodningsverktyg som Cursor delvis förklaras av att de redan tillämpar en tidig variant av denna princip. Det ger en ledtråd om vart hela branschen är på väg.
Tre nyheter – en berättelse
Tagen var för sig är varje nyhet intressant. Sammantaget berättar de något större: AI-industrin befinner sig i en fas där kapital, mätbarhet och teknisk grundforskning konvergerar. Investeringarna är rekordstora. Kraven på ärlighet i prestandamätningar ökar. Och de svåraste tekniska problemen – som kontinuerligt lärande – börjar tas på allvar av rätt människor med rätt resurser.
Detta är inte en bubbla som sväljer sig självt. Det är en industri som börjar mogna på riktigt.
Vår analys
Det som imponerar mest i den här nyhetsbilden är inte enskilda siffror – det är koherensen. Cognitions värdering speglar en marknad som tror på autonoma mjukvaruagenter som affärsmodell, inte bara som forskningsprojekt. DeepSWE signalerar att branschen börjar kräva sanningsenliga prestationsmått snarare än smickrande riktmärken. Och Trajectory adresserar det som många insatta länge betraktat som AI:s akilleshäl: oförmågan att lära sig löpande.
Tillsammans pekar dessa rörelser mot en industri som inte längre nöjer sig med imponerande demonstrationer – den vill ha verklig, mätbar, uthållig nytta. För bolag som arbetar med AI-omställning är signalen tydlig: det är dags att ställa högre krav, både på leverantörer och på sig själva. Den som bygger med rätt verktyg och rätt förväntningar i dag positionerar sig för att leda i morgon. Det är en möjlighet, inte ett hot.