DeepSeek, tek GPU ile çalışabilen yeni modelini tanıttı

DeepSeek, Yeni Yapay Zeka Modeli DeepSeek-R1-0528-Qwen3-8B’yi Tanıttı

Çinli yapay zeka laboratuvarı DeepSeek, daha az kaynak kullanarak yüksek performans sağlayan yeni modeli DeepSeek-R1-0528-Qwen3-8B’yi duyurdu. Bu model, sadece tek bir GPU üzerinde çalışabiliyor ve diğer modellere kıyasla önemli avantajlar sunuyor.

DeepSeek’in yeni modeli, temelini Alibaba’nın Mayıs 2025’te tanıttığı Qwen3-8B modelinden almıştır. Laboratuvar, büyük R1 modelinden elde ettiği verilerle bu küçük versiyonu eğitmeyi başardı. Bu yöntemle geliştirilen model, Google’ın Gemini 2.5 Flash modelini içeren zorlu matematik testlerinden biri olan AIME 2025’te başarılı oldu. Ayrıca Microsoft’un Phi 4 Reasoning Plus modeline, HMMT sınavında da oldukça yakın bir performans sergiledi.

Küçük yapay zeka modelleri genellikle sınırlı becerilere sahip olsa da, DeepSeek-R1-0528-Qwen3-8B’nin dikkat çekici yanı düşük donanım gereksinimidir. NodeShift’in verilerine göre, bu model 40 ila 80 GB RAM’e sahip tek bir Nvidia H100 GPU ile çalışabiliyor. Oysa tam boyutlu R1 modeli, yaklaşık 12 adet 80 GB’lık GPU gerektiriyor.

Model, MIT lisansı ile ticari kullanıma sunulmuştur ve Hugging Face ve LM Studio gibi platformlardan erişilebilir durumdadır. Bu yapay zeka modeli, akademik ve endüstriyel alanda kullanım için tasarlanmıştır.

Related Posts

Bir molekülün kas yaşlanmasını yavaşlattığı bulundu

Bilim insanları, tek doz tedavinin kas fonksiyonunu geri kazanmak için yeterli olabileceğini söylüyor.

Renault CEO’su istifa etti

Renault CEO’su Luca de Meo, Fransız otomotiv şirketindeki görevinden istifa etti. Meo’nun Gucci’nin de sahibi olan Fransız lüks tüketim şirketi Kering’in başına geçeceği öğrenildi.

Sutopunda Avrupa Şampiyonası biletini aldık

Sutopu Erkek Milli Takımı, 2026 Avrupa Şampiyonası’na katılma hakkı elde etti.

Elektrikli otomobilde tercih edilen modeller belli oldu! Kapış Kapış Satılıyor

Otomotiv Distribütörleri ve Mobilite Derneği’nin (ODMD) yayımladığı son veriler, yerli üretim TOGG’un elektrikli otomobil yarışında liderliğini perçinlediğini gözler önüne serdi. ODMD’nin satış istatistiklerine göre, Mayıs ayında Türkiye genelinde en …

Çinli yapay zeka geliştiricisi DeepSeek’in son modeli Google Gemini verileriyle mi eğitildi?

Uzmanlar ve geliştiriciler, modelin eğitim verilerinin bir kısmının Google’ın Gemini yapay zeka ailesinden geldiğine dair işaretler bulunduğunu öne sürüyor. DeepSeek daha önce de rakip modellerin verilerini kullanmakla suçlanmıştı. Geçtiğimiz hafta …

Google Fotoğraflar 10. yıl dönümü için yeni Yapay Zeka özellikleri kazanıyor

Daha önce Pixel modellerine özel olan iki önemli düzenleme aracı önümüzdeki ay Android’e geliyor.