DeepSeek-Math-V2: Nytt AI-gjennombrudd i selvverifiserende matematisk resonnering

Hovedpunkter:

  • DeepSeek-Math-V2 er en ny AI-modell utviklet for å løse og selvverifisere matematiske teoremer.
  • Modellen kombinerer en verifikator som sjekker bevis steg for steg, og en teoremgenerator som kan rette egne feil.
  • Den har oppnådd gullmedaljenivå i International Mathematical Olympiad (IMO) 2025 og CREST Mathematics Olympiad (CMO) 2024.
  • DeepSeek-Math-V2 scoret 118 av 120 poeng i Putnam 2024-konkurransen.
  • Modellen er tilgjengelig under Apache 2.0 open-source lisens på plattformer som Hugging Face og GitHub.

Det kinesiske AI-selskapet DeepSeek har nylig lansert DeepSeek-Math-V2, en avansert språkmodell spesialisert på å løse og selvverifisere komplekse matematiske teoremer. Modellen er bygget på DeepSeek-V3.2-Exp-Base og er designet for å forbedre nøyaktigheten og påliteligheten i matematisk resonnering.

DeepSeek-Math-V2 består av to hovedkomponenter: en verifikator som evaluerer bevis steg for steg, og en teoremgenerator som kan identifisere og korrigere egne feil. Denne selvverifiseringsmekanismen sikrer at modellen ikke bare produserer korrekte svar, men også følger en streng og logisk bevisførsel.

I tester har DeepSeek-Math-V2 oppnådd imponerende resultater. Den har nådd gullmedaljenivå i International Mathematical Olympiad (IMO) 2025 og CREST Mathematics Olympiad (CMO) 2024, samt en nesten perfekt score på 118 av 120 poeng i Putnam 2024-konkurransen. Disse prestasjonene plasserer modellen på nivå med eller overgår tidligere toppmodeller fra selskaper som OpenAI og Google DeepMind.

DeepSeek-Math-V2 er tilgjengelig under Apache 2.0 open-source lisens og kan lastes ned fra plattformer som Hugging Face og GitHub. Dette gir forskere og utviklere muligheten til å utforske og videreutvikle modellen for ulike anvendelser innen matematisk resonnering og teorembevis.

Lanseringen av DeepSeek-Math-V2 markerer et betydelig skritt fremover i utviklingen av AI-systemer med evnen til selvverifiserende matematisk resonnering, og åpner nye muligheter for forskning og anvendelse innen feltet.