
Photo by John Schnobrich on Unsplash
Alibaba Lanserer Ny Qwen AI-Modell Og Hevder Den Overgår DeepSeek-V3
Den kinesiske giganten Alibaba lanserte den nyeste versjonen av sitt flaggskips AI-modell, Qwen, denne onsdagen. Selskapet hevder at den kan prestere bedre enn den populære DeepSeek-V3.
Har det travelt? Her er de Raske Faktaene!
- Alibaba lanserte sin nyeste resonneringsmodell Qwen 2.5-Max denne onsdagen.
- Den kinesiske giganten hevder at den utkonkurrerer populære modeller som DeepSeek-V3, GPT-4o, og Llama-3.1-405B.
- Selskapet lanserte også Qwen2.5-VL denne uken, en AI-modell som er i stand til å behandle bilder og fungere som en AI-agent ved å bruke datamaskiner og mobiler til å utføre oppgaver.
Ifølge Reuters, lanserte Alibaba den nye Qwen 2.5-Max, som de har døpt den nye resonnementmodellen, midt under feiringen av det kinesiske nyttåret, for å bli med på de enorme AI-utviklingene de siste dagene og tilføre innenlandsk konkurranse.
På mandag, nådde DeepSeek førsteplass på Apples App Store i USA, og overgikk ChatGPT. Dette bekymrer andre selskaper i AI-industrien og setter investorene i alarmberedskap—Nvidias aksjer falt med 17% på bare én dag.
Nå har Alibaba annonsert de nyeste versjonene av sin Qwen-modell—den lanserte 100 åpen-kildekode AI-modeller for Qwen-pakken i september i fjor—og lover bedre resultater enn populære grensemodeller.
«Qwen 2.5-Max overgår (…) nesten på alle områder GPT-4o, DeepSeek-V3 og Llama-3.1-405B,» skrev selskapet på sin offisielle WeChat-konto.
Den nye resonnement-modellen Qwen 2.5-Maxs API er tilgjengelig via Alibabas sky, og brukere kan også teste modellen på dens chat-side.
“Vi utvikler Qwen2.5-Max, en stor MoE-modell som har blitt forhåndstrent på over 20 billioner tokens og videre ettertrent med kurerte Supervised Fine-Tuning (SFT) og Reinforcement Learning from Human Feedback (RLHF) metoder,” skrev Qwen Team på Github.
Den kinesiske giganten lanserte også Qwen2.5-VL på mandag, en serie multimodale AI-modeller som også kan behandle bilder og få tilgang til mobiltelefoner og datamaskiner for å utføre oppgaver. OpenAI kunngjorde en lignende funksjon, Operator, som lar ChatGPT utføre oppgaver autonomt ved å ta kontroll over brukerens datamaskin.
Ifølge Alibabas team, overgår alle Qwen-modellene lignende versjoner fra OpenAI, Microsoft, Google, Meta og DeepSeek.
Legg igjen en kommentar
Avbryt