DeepSeek’s AI lærer å tenke for seg selv

Image by Matheus Bertelli, from Pexels

DeepSeek’s AI lærer å tenke for seg selv

Lesetid: 2 min.

Kinesiske oppstartsbedriften DeepSeek, i samarbeid med Tsinghua University, sier de har utviklet en smartere måte å hjelpe kunstige intelligensmodeller til å tenke bedre og raskere, uten behov for store datamaskiner eller dyre ressurser.

I en hast? Her er de raske faktaene:

  • DeepSeek skapte en selvforbedrende AI ved hjelp av Self-Principled Critique Tuning (SPCT).
  • SPCT lærer AI å vurdere sitt eget arbeid ved hjelp av selvgenererte regler.
  • Metoden forbedrer ytelsen uten behov for massiv databehandlingskraft.

Gjennombruddet kommer fra en ny teknikk kalt Self-Principled Critique Tuning (SPCT). SPCT er annerledes enn å bare gjøre AI-modeller større for å forbedre ytelsen – SPCT krever ikke mye energi og databehandlingskraft for å lære AI-en å bedømme sitt eget arbeid ved hjelp av et sett med selvlagde regler.

Måten det fungerer på er via en innebygd «dommer» som bekrefter at AI-responsen både overholder sine interne resoneringsregler, og virker passende for menneskelig output. Når AI gir et solid svar, mottar den positiv tilbakemelding, noe som hjelper den med å forbedre evnen til å svare på lignende spørsmål i fremtidige tilfeller.

DeepSeek implementerer denne metoden som en del av sitt DeepSeek-GRM system som står for Generative Reward Modeling. GRM fungerer annerledes enn tradisjonelle metoder fordi det utfører parallelle sjekker for å forbedre både nøyaktighet og konsistens.

«Vi foreslår Self-Principled Critique Tuning (SPCT) for å fremme skalérbare belønningsgenererende atferd,» skrev forskerne i sin artikkel. “SPCT gjør at [modellen] kan tilpasse prinsipper og kritikker basert på inndataforespørselen og responsene, noe som fører til bedre resultatbelønninger.”

Med dette systemet hevder DeepSeek at deres AI nå kan utføre bedre enn konkurrenter som Googles Gemini, Meta’s Llama, og OpenAI’s GPT-4o, spesielt når det kommer til komplekse oppgaver som resonnement eller beslutningstaking, som bemerket av Euronews.

Viktig å merke seg er at DeepSeek sier at de planlegger å lansere disse nye verktøyene som open-source programvare, selv om ingen utgivelsesdato er delt.

Likte du denne artikkelen? Like den!
Jeg misikte den sterkt Jeg likte den ikke Den var helt grei Den var bra! Den var kjempebra! Elsket den!

Vi er veldig gade for at du satte pris på arbeidet vårt!

Som en leser vi verdsetter høyt, har du mulighet til å gi oss en anmeldelse på Trustpilot? Det tar bare et øyeblikk og betyr utrolig mye. Tusen hjertelig takk!

Gi oss en vurdering på Trustpilot
0 Stem på av 0
Tittel
Kommentar
Tusen takk for tilbakemeldingen
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Legg igjen en kommentar

Loader
Loader Vis mer...