DeepSeek lanserer en forbedret versjon av V3 AI tre måneder etter den første utgivelsen
Kinesiske DeepSeek har lansert en oppdatert versjon av sin storskala språklige kunstige intelligens, DeepSeek-V3-0324, bare tre måneder etter lanseringen av den første V3-versjonen i desember 2024.
Dette er hva vi vet
Den nye modellen har forbedret ytelse og funksjoner, inkludert oppretting av estetisk tiltalende nettsider og rapporter av høy kvalitet på kinesisk.
DeepSeek-V3-0324 har fått oppmerksomhet for sine reduserte maskinvarekrav for opplæring, raskere opplæringstid og lavere API-kostnader med høy ytelse sammenlignet med konkurrenter som OpenAIs GPT.
DeepSeek-ytelse. Illustrasjon: DeepSeek
Den oppdaterte modellen involverer ikke tenkning, noe som gjør at den kan gi svar raskt, uten å dvele ved komplekse oppgaver, i motsetning til DeepSeek R1-modellen. Den nye versjonen har en parameterstørrelse på 685 milliarder, noe som gjør den til en av de største offentlig tilgjengelige språkmodellene.
DeepSeek-V3-0324 scoret fra 5,3 % til 19,8 % høyere på AI-tester sammenlignet med den forrige versjonen. Når det gjelder ytelse, ligger den i nærheten av ledende modeller som GPT-4.5 og Claude Sonnet 3.7.
I tillegg har den oppdaterte versjonen vist seg å være bedre til å lage nettsider og til å søke, skrive og oversette tekster på kinesisk.
For å teste fullversjonen av modellen trenger brukerne minst 700 GB ledig diskplass og flere Nvidia A100/H100 GPU-er. Det finnes imidlertid også forenklede versjoner av modellen som kan kjøres på én enkelt GPU, for eksempel Nvidia 3090.
Kilde: DeepSeek DeepSeek