DeepSeek, DeepSeek-V3.2-Exp Deneysel Modelini Büyük Verimlilik İyileştirmeleri ile Piyasaya Sürdü

Çin merkezli yapay zeka geliştirme şirketi DeepSeek, Hangzhou'da yer alan yeni deneysel modeli DeepSeek-V3.2-Exp'yi tanıttı ve bunu "eğitimde daha verimli ve uzun metin işleme konusunda daha iyi" olarak tanımladı.
Şirket, geliştirici forumu "Hugging Face" üzerindeki bir gönderide, bu sürümün "bir sonraki nesil mimariye geçiş adımı" olduğunu belirtti ve bu, önümüzdeki projelerine işaret ediyor. Bu projenin, V3 ve R1 modellerinin piyasaya sürülmesinden bu yana en önemli lansmanlardan biri olması bekleniyor.
Açıklamaya göre, model, şirketin "hesaplama maliyetlerini azaltan ve bazı uygulamalarda modelin performansını artıran" yeni bir mekanizma olan DeepSeek Sparse Attention'ı kullanıyor. Ayrıca, DeepSeek, "X" platformundaki hesabından, API (Uygulama Programlama Arayüzü) fiyatlarını %50'den fazla düşürdüğünü duyurdu.
Yeni mimarinin, önceki sürümlerde olduğu gibi pazarlarda büyük bir etki yaratmayabileceği yönündeki tahminlere rağmen, başarısının, yerel rakipler olan Qwen gibi "Alibaba"'ya bağlı şirketler ve OpenAI gibi Amerikan şirketleri üzerinde artan baskılar oluşturabileceği düşünülüyor. Özellikle DeepSeek, rakiplerine kıyasla "çok daha düşük maliyetle yüksek yetenekler" sunabilirse.