Alibaba avduker Qwen3-Coder med støtte for AI-agenter som er i stand til å ta uavhengige beslutninger

Qwen-teamet har offisielt presentert Qwen3-Coder, sin kraftigste kodegenerator til dags dato, som støtter "agent"-tilnærmingen. Hovedstjernen i serien er Qwen3-Coder-480B-A35B-Instruct. Dette er en hybrid Mixture-of-Experts-modell med 480 milliarder parametre (35 milliarder aktive samtidig) som kan jobbe med konteksten av opptil 256 000 tokens naturlig og opptil 1 million tokens med ekstrapolering. I tester viser den rekordresultater blant åpne kildekode-modeller i Agentic Coding, Agentic Browser-Use og Agentic Tool-Use oppgaver - på Claude Sonnet 4-nivå.
Hva er agentisk koding?
Qwen3-Coder ble laget ikke bare for å generere kode, men også for å fungere som en "agent" som kan planlegge, bruke verktøy, motta tilbakemeldinger og ta beslutninger. I virkelige oppgaver (f.eks. SWE-Bench) samhandler den med miljøet i flere trinn, noe som krever kompleks Long-Horizon RL-læring. For dette har Qwen-teamet utviklet et skalerbart system med 20 000 parallelle miljøer basert på Alibaba Cloud.
Qwen3-Coder-funksjoner
- Trent på 7,5 trillioner tokens, hvorav 70 % er kode
- Støtter gigantisk kontekst for opptil 1 million tokens (med YaRN)
- Bruker forsterkende læring (Code RL) på virkelige oppgaver for å forbedre kodeutførelsen
- Integrasjon med utviklerverktøy som Qwen Code (CLI), Claude Code og til og med OpenAI SDK
- Evne til å fungere både gjennom API og i det lokale miljøet
Verktøy og API-er
Qwen Code CLI-verktøyet basert på Gemini Code er tilgjengelig med modellen. Det lar deg enkelt bruke Qwen3-Coder i dine egne prosjekter, med støtte for tilpassede forespørsler og funksjoner. Det gir også arbeid gjennom Claude Code og direkte API-tilgang gjennom Alibaba Cloud Model Studio.
Hva er det for?
Qwen3-Coder er posisjonert som en universell kodeagent - fra nettstedsgenerering til komplekse flerstegs utviklingsoppgaver. Qwen-teamet planlegger å slippe flere modellstørrelser for å redusere distribusjonskostnader og utforsker muligheter for agentens selvforbedring.
Om Qwen
Qwen er en serie storskala språkmodeller og agentløsninger fra Alibabas Qwen-team, designet for å generere tekst, kode, dataanalyse og flerstegs scener ved hjelp av verktøy. Den nyeste versjonen, Qwen3-Coder, er bygget på en Mixture-of-Experts-arkitektur med 480 milliarder parametre (35 milliarder aktive), støtter opptil 256 000 konteksttokens naturlig og opptil 1 million med ekstrapolering, og viser resultater på lukket modellnivå som Claude Sonnet 4 i SWE-Bench, Agentic Coding, Browser-Use og Tool-Use oppgaver. Modellen integreres med OpenAI SDK, CLI-verktøy (Qwen Code, Claude Code), Alibaba Cloud API og støtter GitHub- og Hugging Face-økosystemene, ved å bruke forsterkende læring på virkelige kodeoppgaver for å forbedre nøyaktighet og effektivitet.