DeepSeek R1, en avansert kunstig intelligens-modell utviklet av det kinesiske selskapet DeepSeek, har nylig blitt publisert i en fagfellevurdert artikkel i tidsskriftet Nature. Modellen har vakt oppsikt for sin kostnadseffektive utvikling og åpne tilgjengelighet, noe som potensielt kan endre landskapet innen AI-forskning.
Ifølge Nature-artikkelen ble R1 trent for rundt 300 000 amerikanske dollar, en sum som er betydelig lavere enn de titalls millioner dollar som konkurrentenes modeller antas å ha kostet. Dette inkluderer ikke de omtrent 6 millioner dollar som ble brukt på å utvikle grunnmodellen som R1 er basert på. Til tross for de samlede kostnadene, representerer dette en mer kostnadseffektiv tilnærming sammenlignet med andre aktører i bransjen.
R1 er spesielt designet for å utmerke seg i resonneringsoppgaver som matematikk og koding. Som en "open weight"-modell er den fritt tilgjengelig for nedlasting og har blitt lastet ned over 10,9 millioner ganger på AI-plattformen Hugging Face, noe som gjør den til den mest populære modellen der til dags dato.
En av de mest bemerkelsesverdige aspektene ved R1 er utviklingsprosessen. DeepSeek benyttet en ren forsterkningslæringstilnærming, hvor modellen ble belønnet for å nå korrekte svar, i stedet for å bli trent på eksempler generert av andre store språkmodeller. Dette har gjort det mulig for R1 å utvikle egne strategier for resonnering uten å følge menneskeskapte taktikker.
Publiseringen av R1 i et fagfellevurdert tidsskrift markerer en milepæl, da det er en av de første store språkmodellene som har gjennomgått en slik prosess. Dette setter en ny standard for åpenhet og vitenskapelig rigor innen AI-forskning.