Japanska Sakana AI utmanar de amerikanska jättarna – men håller siffrorna vad de lovar?
Japanska Sakana AI utmanar de amerikanska jättarna – men håller deras siffror vad de lovar?
En utmanare från öst
När vi pratar om de stora AI-aktörerna hamnar blicken nästan reflexmässigt på USA: OpenAI, Anthropic, Google DeepMind. Men nu knackar det på dörren från ett oväntat håll. Enligt Ny Teknik lanserar japanska Sakana AI tjänsten Fugu – ett system som inte bygger på en enda gigantisk modell, utan i stället samordnar flera specialiserade AI-modeller via ett gemensamt gränssnitt.
Det är en arkitekturmässigt intressant ansats. Istället för att träna fram ett enda allomfattande system låter man olika modeller samarbeta och komplettera varandra beroende på uppgiften. Det påminner om hur ett välsammansatt team fungerar bättre än en ensam generalist – varje del bidrar med sin styrka.
Siffrorna ser lovande ut – med ett förbehåll
Sakana AI gör inga blygsamma anspråk. Bolaget hävdar att Fugu, och den mer avancerade varianten Fugu Ultra, matchar Anthropics modeller Fable 5 och Mythos Preview inom programmering, teknik, vetenskapliga uppgifter och logiskt resonemang.
I det välkända programmeringstestet LiveCodeBench uppnår Fugu Ultra resultatet 93,2 – jämfört med Fable 5:s 89,8. På det vetenskapliga resonemangstestet GPQA-D når både Fugu och Fugu Ultra 95,5, något över Mythos Previews 94,6.
Det är imponerande siffror på pappret. Men här måste man vara ärlig mot sig själv som teknikjournalist: bolag väljer nästan alltid ut de mätningar där de egna produkterna ser bäst ut. Det är inte nödvändigtvis oärligt – det är marknadsföring – men det gör oberoende granskningar helt nödvändiga innan man drar slutsatser. Prestandamätningar inom AI är dessutom ett område där det är lätt att optimera specifikt för testerna utan att det generaliserbart beteendet förbättras i samma utsträckning.
Med det sagt: om även hälften av påståendena håller vid granskning är det ändå anmärkningsvärt.
Grundarna ger trovärdighet
Sakana AI är inte ett bolag som kommit ur ingenstans. Det grundades 2023 av David Ha och Llion Jones, båda tidigare forskare på Google. Jones är dessutom en av de åtta originalförfattarna bakom den banbrytande artikeln Attention Is All You Need från 2017 – den forskning som lade grunden för i princip all modern storskalig språkmodellering. Det är meritlistan man sällan ser utanför de absolut mest etablerade aktörerna.
Investerarbasen är minst lika talande. Japanska finansjätten Mitsubishi UFJ Financial Group är en av finansiärerna, och vid den senaste finansieringsrundan i november värderades Sakana AI till ungefär 2,6 miljarder dollar. Det är pengar och förtroende på en nivå som signalerar att detta inte är ett hobbyprojekt.
Varför det här är intressant bortom rubrikerna
Jag tycker det mest intressanta med Sakana AI inte är om Fugu faktiskt slår Anthropic på just dessa mätningar. Det intressanta är vad deras framväxt säger om AI-landskapets geografiska spridning.
Under lång tid har berättelsen om avancerad AI-utveckling i praktiken varit synonymt med en handfull bolag i San Francisco-området, kompletterat av Google och Microsoft. Nu ser vi en tydlig rörelse: Kina har egna starka aktörer, Europa börjar vakna, och Japan – med sin långa tradition av teknisk precision och industriell tillämpning – kliver in med seriösa resurser.
Flersystemsarkitekturen som Fugu bygger på är dessutom en spännande riktning i sig. Den speglar en bredare trend inom branschen där man börjar ifrågasätta om den enda vägen framåt verkligen är att bygga allt större monolitiska modeller, eller om smarta kombinationer av specialiserade system kan ge bättre resultat till lägre kostnad.
Det är en fråga som inte har ett givet svar ännu – men det är precis de frågorna som driver utvecklingen framåt.
Vår analys
Sakana AIs lansering av Fugu är ett påminnelseskott om att AI-kapplöpningen håller på att bli genuint global. Med grundare från Googles forskartopp, japanskt industrikapital i ryggen och en arkitektur som utmanar de etablerade monolitiska modellerna är detta ett bolag värt att följa noga.
Den tekniska ansatsen – att samordna flera specialiserade modeller snarare än att bygga ett enda gigantiskt system – kan visa sig vara en av de viktigare designvägarna de kommande åren. Det är resursmässigt mer hanterbart och potentiellt mer anpassningsbart för specifika domäner.
Det som nu krävs är oberoende utvärderingar. Självrapporterade prestandamätningar är alltid ett första steg, aldrig ett sista. Men om Fugu håller vad det lovar vid granskning, är det ett tydligt bevis på att teknikledarskapet inom AI inte är givet någon – och att konkurrens från oväntade håll kan vara en av de starkaste drivkrafterna för framsteg.