Photo by John Schnobrich on Unsplash

Alibaba Lanserer Ny Qwen AI-Modell Og Hevder Den Overgår DeepSeek-V3

Lesetid: 2 min.

Sist Oppdatert: Jan 31, 2025

Skrevet av Andrea Miliani Teknologi-nyhetsekspert
Oversatt av Lokaliserings- og oversettelsesteamet lokaliserings- og oversettelsestjenester

Den kinesiske giganten Alibaba lanserte den nyeste versjonen av sitt flaggskips AI-modell, Qwen, denne onsdagen. Selskapet hevder at den kan prestere bedre enn den populære DeepSeek-V3.

Har det travelt? Her er de Raske Faktaene!

Alibaba lanserte sin nyeste resonneringsmodell Qwen 2.5-Max denne onsdagen.
Den kinesiske giganten hevder at den utkonkurrerer populære modeller som DeepSeek-V3, GPT-4o, og Llama-3.1-405B.
Selskapet lanserte også Qwen2.5-VL denne uken, en AI-modell som er i stand til å behandle bilder og fungere som en AI-agent ved å bruke datamaskiner og mobiler til å utføre oppgaver.

Ifølge Reuters, lanserte Alibaba den nye Qwen 2.5-Max, som de har døpt den nye resonnementmodellen, midt under feiringen av det kinesiske nyttåret, for å bli med på de enorme AI-utviklingene de siste dagene og tilføre innenlandsk konkurranse.

På mandag, nådde DeepSeek førsteplass på Apples App Store i USA, og overgikk ChatGPT. Dette bekymrer andre selskaper i AI-industrien og setter investorene i alarmberedskap—Nvidias aksjer falt med 17% på bare én dag.

Nå har Alibaba annonsert de nyeste versjonene av sin Qwen-modell—den lanserte 100 åpen-kildekode AI-modeller for Qwen-pakken i september i fjor—og lover bedre resultater enn populære grensemodeller.

«Qwen 2.5-Max overgår (…) nesten på alle områder GPT-4o, DeepSeek-V3 og Llama-3.1-405B,» skrev selskapet på sin offisielle WeChat-konto.

Den nye resonnement-modellen Qwen 2.5-Maxs API er tilgjengelig via Alibabas sky, og brukere kan også teste modellen på dens chat-side.

“Vi utvikler Qwen2.5-Max, en stor MoE-modell som har blitt forhåndstrent på over 20 billioner tokens og videre ettertrent med kurerte Supervised Fine-Tuning (SFT) og Reinforcement Learning from Human Feedback (RLHF) metoder,” skrev Qwen Team på Github.

Den kinesiske giganten lanserte også Qwen2.5-VL på mandag, en serie multimodale AI-modeller som også kan behandle bilder og få tilgang til mobiltelefoner og datamaskiner for å utføre oppgaver. OpenAI kunngjorde en lignende funksjon, Operator, som lar ChatGPT utføre oppgaver autonomt ved å ta kontroll over brukerens datamaskin.

Ifølge Alibabas team, overgår alle Qwen-modellene lignende versjoner fra OpenAI, Microsoft, Google, Meta og DeepSeek.

Alibaba Lanserer Ny Qwen AI-Modell Og Hevder Den Overgår DeepSeek-V3

Vi er veldig gade for at du satte pris på arbeidet vårt!

Legg igjen en kommentar