NM I AI
Vi i IT-vest meldte oss på NM i ai å plasserte bedre enn forventa!
NM i AI 2026 - Plass 51 av 3000
Gjengen fra Astar Technologies leverte igjen. I mars arrangerte de Norges AI-mesterskap, og som vanlig var det
en fantastisk gjennomført konkurranse - 69 timer med intens problemløsning, søvnmangel og den type læring man
aldri får i et klasserom.
Midt i kaoset mellom to eksamener og en bachelorrapport som desperat trenger oppmerksomhet, bestemte tre av
oss seg for å melde oss på med Quorra - laget vi stadig stiller med i konkurranser.
Plass 51 av 3000 påmeldte. Bedre enn forventet.
Oppgavene
Konkurransen besto av fire oppgaver, hver verdt 25% av totalscoren:
- Grocery Bot - en sanntids WebSocket-agent som navigerte en virtuell dagligvarebutikk
- NorgesGruppen Data - objektdeteksjon og klassifisering av produkter på dagligvarehyller
- Tripletex - AI-basert regnskapsagent mot Tripletex sitt API
- Astar Island - prediksjon i en norrøn verden-simulering
Få oppgaver, men desto mer omfattende. Hver enkelt var et prosjekt i seg selv.
Min oppgave: NorgesGruppen
Maskinlæring faller i god smak hos meg, så jeg kastet meg over NorgesGruppens objektdeteksjonsoppgave.
Utfordringen: detekter og klassifiser produkter på butikkhyller. 357 produktkategorier. 248 treningsbilder. 22
700 annoteringer.
Scoringsformelen var 0.7 × deteksjons-mAP + 0.3 × klassifiserings-mAP. Altså: 70% handler om å finne
produktene, 30% handler om å vite hva de er.
Reisen fra 0.78 til 0.91
Første forsøk var en ren YOLOv8x-modell trent på 1280px. Den ga 0.78. Greit, men langt fra toppen.
Gjennombruddet kom da jeg innså at YOLO alene ikke klarte klassifiseringen. 357 kategorier - mange med bare
1-3 treningsbilder - er for mye for én modell. Løsningen ble en two-stage pipeline:
1. YOLO ved 1600 + 2560px med Weighted Boxes Fusion for deteksjon
2. En dedikert EfficientNet-B4-klassifiserer trent på crops fra treningsbildene og referansebilder
Deteksjonsmodellen ble trent på full oppløsning (3200px) med alle 248 bilder pluss produktreferansebilder, i
500 epoker på tre H200-GPUer. Klassifisereren ble trent separat på 24 000 utklipp og oppnådde 90.7%
valideringsaccuracy.
Da jeg satte det sammen gikk scoren fra 0.78 til 0.90 på én submission. Det var et av de beste øyeblikkene i
hele konkurransen.
De siste prosentene var de vanskeligste. Parametertuning, multi-skala ensemble med 3200px, classifier-ensemble
med EfficientNet-B6 - alt ga marginale forbedringer. Sluttscoren landet på 0.91.
Det jeg lærte
Ensemble slår alltid single model. Det var den største lærdommen. Jeg brukte all tid på å presse én modell til
det ytterste - høyere oppløsning, dedikert klassifiserer, mer kompleks pipeline. Vinneren stacket tre enklere
modeller trent på lavere oppløsninger og lot dem stemme. Prinsippet er kjent som ensemble diversity: tre
"svakere" modeller som gjør forskjellige feil vil krysse ut hverandres false positives når de kombineres.
Resultatet utkonkurrerer enhver enkeltmodell. Neste gang starter jeg med ensemble fra dag én.
Arkitektur trumfer parametertuning. Jeg brukte timer på å tweake confidence-thresholds, WBF-parametre og
oppløsninger. Scoren beveget seg aldri mer enn 0.002. Det som faktisk flyttet nålen var arkitektoniske
endringer - fra single-model til two-stage pipeline, fra YOLO-klassifisering til dedikert klassifiserer.
Tidsstyring er alt i en 69-timers konkurranse. Jeg brukte for lang tid på å trene en ConvNeXt-klassifiserer
som aldri slo den enklere EfficientNet-modellen. Den tiden burde gått til å trene tre separate YOLO-modeller
og ensemble dem.
Submission-management er en ferdighet. Med 6 submissions per dag lærer du raskt å ikke kaste bort forsøk på
gjetting. Hver submission bør teste én hypotese.
Og kanskje det viktigste: Det er utrolig hvor mye man kan bygge på 69 timer når man har en klar plan og
riktige verktøy. Fra null til en komplett deteksjons- og klassifiseringspipeline som scorer over 0.90 - det er
noe jeg er stolt av, uavhengig av plassering.
Neste gang
NM i AI 2027 er allerede i kalenderen. Neste gang stiller vi med ensemble fra start, bedre tidsplanlegging, og
kanskje litt mer søvn.
Takk til Astar Technologies for en fantastisk konkurranse, og til lagkameratene mine på Quorra for nok en
intens helg.