
Image by Matheus Bertelli, from Pexels
DeepSeek’s AI lærer å tenke for seg selv
Kinesiske oppstartsbedriften DeepSeek, i samarbeid med Tsinghua University, sier de har utviklet en smartere måte å hjelpe kunstige intelligensmodeller til å tenke bedre og raskere, uten behov for store datamaskiner eller dyre ressurser.
I en hast? Her er de raske faktaene:
- DeepSeek skapte en selvforbedrende AI ved hjelp av Self-Principled Critique Tuning (SPCT).
- SPCT lærer AI å vurdere sitt eget arbeid ved hjelp av selvgenererte regler.
- Metoden forbedrer ytelsen uten behov for massiv databehandlingskraft.
Gjennombruddet kommer fra en ny teknikk kalt Self-Principled Critique Tuning (SPCT). SPCT er annerledes enn å bare gjøre AI-modeller større for å forbedre ytelsen – SPCT krever ikke mye energi og databehandlingskraft for å lære AI-en å bedømme sitt eget arbeid ved hjelp av et sett med selvlagde regler.
Måten det fungerer på er via en innebygd «dommer» som bekrefter at AI-responsen både overholder sine interne resoneringsregler, og virker passende for menneskelig output. Når AI gir et solid svar, mottar den positiv tilbakemelding, noe som hjelper den med å forbedre evnen til å svare på lignende spørsmål i fremtidige tilfeller.
DeepSeek implementerer denne metoden som en del av sitt DeepSeek-GRM system som står for Generative Reward Modeling. GRM fungerer annerledes enn tradisjonelle metoder fordi det utfører parallelle sjekker for å forbedre både nøyaktighet og konsistens.
«Vi foreslår Self-Principled Critique Tuning (SPCT) for å fremme skalérbare belønningsgenererende atferd,» skrev forskerne i sin artikkel. “SPCT gjør at [modellen] kan tilpasse prinsipper og kritikker basert på inndataforespørselen og responsene, noe som fører til bedre resultatbelønninger.”
Med dette systemet hevder DeepSeek at deres AI nå kan utføre bedre enn konkurrenter som Googles Gemini, Meta’s Llama, og OpenAI’s GPT-4o, spesielt når det kommer til komplekse oppgaver som resonnement eller beslutningstaking, som bemerket av Euronews.
Viktig å merke seg er at DeepSeek sier at de planlegger å lansere disse nye verktøyene som open-source programvare, selv om ingen utgivelsesdato er delt.
Legg igjen en kommentar
Avbryt