
Image by TechCrunch, from Flickr
AI som tenker før den snakker? Claude 3.7 Sonnet lanserer hybrid resonnering
Anthropic har lansert Claude 3.7 Sonnet, en ny versjon av sin AI-modell som innfører en valgfri «utvidet tenkemodus», som gir brukerne mer kontroll over hvordan modellen behandler komplekse oppgaver.
I en fart? Her er de kjappe faktaene!
- Modellen forbedrer resonnering og problemløsning ved å tillate selvrefleksjon før besvarelse.
- Utvidet tenkemodus er kun tilgjengelig på betalte planer.
- Claude Code, en kodningsassistent, er i begrenset forhåndsvisning for utviklere
Anthropic har lansert Claude 3.7 Sonnet, en oppdatert AI-modell som introduserer hybrid resonnering. Dette gir brukerne muligheten til å velge mellom raske svar og utvidet tenkning.
Denne nye tilnærmingen sikter mot å forbedre problemløsning ved å muliggjøre for modellen å ta ekstra tid til å vurdere og forbedre sine svar når det er nødvendig.
I standardmodus fungerer Claude 3.7 Sonnet som en iterativ forbedring over sin forgjenger, Claude 3.5 Sonnet. I utvidet tenkemodus engasjerer imidlertid modellen seg i selvrefleksjon før den produserer et svar.
Michael Gerstenhaber, Anthropic sin produktsjef for AI, beskrev funksjonen som en måte for brukerne å balansere responstid og resonnementdybde. «[user] har mye kontroll over atferden – hvor lenge den tenker, og kan bytte ut resonnement og intelligens med tid og budsjett», sa han, som rapportert av WIRED.
Denne prosessen er ment å forbedre nøyaktigheten i områder som krever flertrinns resonnement, som matematikk, fysikk, koding og følging av instruksjoner. Brukere som samhandler med modellen via API, kan angi en grense for hvor mange tegn det bruker til å «tenke», noe som gir kontroll over responshastighet og kostnad.
WIRED bemerker at oppdateringen også inkluderer en «notatblokk»-funksjon, som gjør modellens resonnementstrinn synlige når den behandler en forespørsel. Denne tilnærmingen er lik teknikker som brukes i andre AI-modeller, som DeepSeek’s.
Anthropic uttaler at Claude 3.7 Sonnet har blitt optimalisert for praktiske anvendelser snarere enn konkurransestil benchmarks. Tidlig testing antyder at den utvidede resonnementmodusen forbedrer ytelsen på oppgaver som involverer komplekse kodebaser, avansert verktøybruk, og full-stack programvareutvikling.
Modellen har blitt evaluert på SWE-bench Verified og TAU-bench, hvor det rapporteres at den overgår tidligere versjoner, som rapportert av Anthropic.
CNN bemerker at Anthropic har holdt prisene for Claude 3.7 de samme som tidligere modeller, og posisjonerer den under OpenAI’s siste tilbud. Den koster $3 per million input tokens og $15 per million output tokens, sammenlignet med OpenAI’s $15 og $60 for tilsvarende nivåer.
Legg igjen en kommentar
Avbryt