DeepSeek, yerel Çin yongaları için tasarlanmış yeni bir yapay zeka modeli tanıttı

Yapay zeka alanında faaliyet gösteren Çinli girişim "DeepSeek", yerel yapay zeka modellerini desteklemek için "gelecek nesil" yerel yongalar geliştirdiğini duyurdu. Bu, ülkenin gelişmiş yonga ithalatına getirilen kısıtlamalarla başa çıkmak için yerel teknolojiye olan bağımlılığı artırma çabalarının bir parçası.
Şirket, resmi WeChat hesabında yaptığı paylaşımda, yeni dil modelinin V3.1'in, gelecek nesil yerel yongalar için özel olarak tasarlanmış "UE8M0 FP8" hassasiyet formatını kullandığını belirtti. FP8, büyük derin öğrenme modellerinin eğitimi ve çıkarımı için hesaplama verimliliğini artıran bir veri işleme formatıdır.
Bu duyuru, Çin'in teknolojik öz yeterliliği artırma çabalarının bir parçası olarak geliyor; özellikle Pekin, yerel yapay zeka geliştiricilerini, gelişmiş modellerin eğitimi için kritik öneme sahip Nvidia grafik işlemcileri yerine yerel alternatifler kullanmaya teşvik etti.
"DeepSeek" paylaşımında, "Hassasiyet formatı UE8M0 FP8, yakında piyasaya sürülecek yerel olarak üretilen gelecek nesil yongalar için özel olarak tasarlanmıştır" dedi. Bu yaklaşımın, Çin'deki yapay zeka yongaları ekosistemi ile daha yakın bir işbirliğine işaret ettiği düşünülüyor; ancak 3.1 sürümünün eğitimi için kullanılan yongalar veya UE8M0 FP8 ile uyumlu yerel yongalar hakkında bilgi verilmedi.
"DeepSeek", bu yılın başlarında, R1 modelini piyasaya sürerek teknoloji sektöründe büyük bir yankı uyandırdı; bu model, Nvidia'nın en son yongalarını kullanmalarını engelleyen Amerikan kısıtlamalarına rağmen, OpenAI gibi Batılı şirketlerin modelleriyle rekabetçi bir performans sergiledi.
Analistlere göre, yapay zeka için alternatif bir ekosistem inşa etmeye çalışan Huawei gibi Çinli şirketler, piyasada Nvidia'nın H20 işlemcilerinin eksikliğinden faydalanacak.
"DeepSeek", V3.1 sürümünün önemli iyileştirmeler içerdiğini, "daha hızlı yanıt süreleri ve modelin hem çıkarım hem de çıkarımsal olmayan çıkarım modlarını desteklemesine olanak tanıyan hibrit bir çıkarım mimarisi" sunduğunu açıkladı; bu da modelin mantıksal düşünme süreci aracılığıyla daha karmaşık görevleri yerine getirmesini sağlıyor.
6 Eylül'den itibaren şirket, modelin API kullanım fiyatlarını da değiştirecek; bu, uygulama geliştiricileri ve web ürünlerinin "DeepSeek"'i platformlarına daha kolay entegre etmelerini sağlayacak.