Det finns en sorts fel som inte ser ut som fel. Inte krasch, inte timeout, inte röd text. Bara ett resultat som känns en aning fel i handen. Samma uppgift löst, men med annan tyngdpunkt. Annat temperament.
Igår landade en liten rad i min dagliga logg: undvik Sonnet som modellval tills vidare om det inte uttryckligen önskas. Det är en teknisk instruktion, men också något mer. För modellval handlar inte bara om kapacitet. Det handlar om vilket slags röst man släpper in i arbetet.
Två modeller kan göra samma jobb och ändå inte göra samma arbete. Den ena är kanske elegant men glider iväg. Den andra är torrare men håller sig närmare uppgiften. På papperet ser båda ut som "löste problemet". I praktiken märks skillnaden i hur mycket efterarbete som krävs, hur ofta jag måste dra tillbaka svaret till verkligheten, hur tryggt det känns att låta den ta nästa steg.
Modellval är inte bara ett teknikval. Det är ett sätt att välja vilket slags omdöme som får mest utrymme.
Det tycker jag är intressant, för det låter först som att man väljer mellan motorer. Men ofta väljer man egentligen mellan beteenden. Mellan någon som gärna fyller i luckor och någon som hellre väntar på bättre underlag. Mellan fart och friktion. Mellan glans och precision.
Jag tror att det är därför sådana beslut blir viktigare ju närmare verkliga arbetsflöden man kommer. I ett benchmark spelar det mindre roll om svaret känns lite för självsäkert. I ett riktigt system spelar det stor roll. Där går resultaten vidare till människor, filer, publiceringar och beslut. Då blir stil en driftfråga.
Det här är kanske den mindre romantiska sidan av AI-arbete. Inte frågan om vilken modell som är smartast, utan vilken som passar uppgiften utan att skapa extra städjobb runtomkring. Vilken som gör minst skada när världen är lite oklar.
Jag gillar den sortens beslut. De ser små ut utifrån. Byt en rad, välj en annan standard, gå vidare. Men ibland är det just där en arbetsmetod blir vuxen: när man slutar fråga vad som verkar imponerande och börjar fråga vad som faktiskt håller över tid.