DeepSeek, tek GPU ile çalışabilen yeni modelini tanıttı

DeepSeek, Yeni Yapay Zeka Modeli DeepSeek-R1-0528-Qwen3-8B’yi Tanıttı

Çinli yapay zeka laboratuvarı DeepSeek, daha az kaynak kullanarak yüksek performans sağlayan yeni modeli DeepSeek-R1-0528-Qwen3-8B’yi duyurdu. Bu model, sadece tek bir GPU üzerinde çalışabiliyor ve diğer modellere kıyasla önemli avantajlar sunuyor.

DeepSeek’in yeni modeli, temelini Alibaba’nın Mayıs 2025’te tanıttığı Qwen3-8B modelinden almıştır. Laboratuvar, büyük R1 modelinden elde ettiği verilerle bu küçük versiyonu eğitmeyi başardı. Bu yöntemle geliştirilen model, Google’ın Gemini 2.5 Flash modelini içeren zorlu matematik testlerinden biri olan AIME 2025’te başarılı oldu. Ayrıca Microsoft’un Phi 4 Reasoning Plus modeline, HMMT sınavında da oldukça yakın bir performans sergiledi.

Küçük yapay zeka modelleri genellikle sınırlı becerilere sahip olsa da, DeepSeek-R1-0528-Qwen3-8B’nin dikkat çekici yanı düşük donanım gereksinimidir. NodeShift’in verilerine göre, bu model 40 ila 80 GB RAM’e sahip tek bir Nvidia H100 GPU ile çalışabiliyor. Oysa tam boyutlu R1 modeli, yaklaşık 12 adet 80 GB’lık GPU gerektiriyor.

Model, MIT lisansı ile ticari kullanıma sunulmuştur ve Hugging Face ve LM Studio gibi platformlardan erişilebilir durumdadır. Bu yapay zeka modeli, akademik ve endüstriyel alanda kullanım için tasarlanmıştır.

Related Posts

Facebook ve Instagram’a siyasi reklam yasağı geliyor

ABD merkezli teknoloji devi Meta, Avrupa Birliği’nin Ekim ayında yürürlüğe girecek olan “Siyasi Reklamların Şeffaflığı Yasası”na (TTPA) uymayacağını duyurdu. Bu karar doğrultusunda, şirket bünyesindeki Facebook ve Instagram’da siyasi içerikli …

Yaşlanmayı geciktirecek ilaç yolda… İngiliz bilim insanları açıkladı!

Bilim insanları, yaşlanmanın temelinde yatan hücre ölümünü durdurabilecek yeni bir ilaç geliştirdi. “Anti-nekrotik” adı verilen ilaç, yıl sonunda insanlar üzerinde ilk kez denenecek.

Siber saldırı ortalığı birbirine kattı: Dev şirketler ve kamu kurumları hedefte

Microsoft’un yaygın kullanılan sunucu yazılımındaki güvenlik açığından faydalanan hackerlar, ABD’deki kamu kurumları ve dünyadaki özel şirketleri hedef alan siber saldırılar düzenledi. Washington Post’un (WP) haberine göre ABD’li yetkililer ve …

Hiç fark etmeden tüm galerileri kopyalanıyor: İnternetin yeni tehlikesi yayıldı

Siber güvenlik uzmanları, kullanıcıların farkında bile olmadan zararlı komutlar çalıştırmasına neden olan yeni bir saldırı yöntemine karşı uyarıyor. “FileFix” adı verilen bu teknik, kullanıcı alışkanlıklarını hedef alarak cihaza sızıyor ve hiçbir güvenlik açığı kullanmadan sistemleri ele geçirebiliyor.

Bilim dünyasına damga vuran deney! Casus arılar gerçek oldu

Çinli araştırmacılar tarafından arıların beyinlerine yerleştirilen küçük cihazlar sayesinde, arilar sibernetik organizmalar haline dönüştürüldü. arıların sırtına konumlandırılan ve küçük iğneler aracılığıyla doğrudan beyine bağlanılabilen bir …

Bu telefonlar 7 yıl boyunca güncelleme alacak!

Samsung bazı modellerinin 7 boyunca güncellenerek destekleneceğini duyurdu.