شرکت دیپسیک مدل آزمایشی DeepSeek-V3.2-Exp را با بهبودهای چشمگیر در کارایی معرفی کرد

شرکت چینی دیپسیک که در زمینه توسعه هوش مصنوعی فعالیت میکند و مقر آن در هانگژو است، از راهاندازی مدل آزمایشی جدید DeepSeek-V3.2-Exp خبر داد که آن را "بیشترین کارایی در آموزش و بهترین در پردازش متون طولانی" نسبت به نسخههای قبلی مدلهای زبانی خود توصیف کرده است.
این شرکت در یک پست در انجمن توسعهدهندگان "Hugging Face" توضیح داد که این نسخه "گامی انتقالی به سوی معماری نسل بعدی" است، اشاره به پروژه آینده خود که انتظار میرود یکی از مهمترین راهاندازیها از زمان ظهور مدلهای V3 وR1 باشد که در اوایل سال جاری در میان سیلیکونولی و سرمایهگذاران جهانی بازخورد گستردهای دریافت کردهاند.
بر اساس اعلام، این مدل از مکانیزم جدیدی به نام DeepSeek Sparse Attention استفاده میکند که شرکت اعلام کرده است "هزینههای محاسباتی را کاهش میدهد و عملکرد مدل را در برخی از برنامهها تقویت میکند". همچنین دیپسیک روز دوشنبه از طریق حساب خود در پلتفرم "اکس" از کاهش قیمت رابطهای برنامهنویسی کاربردی (API) به میزان بیش از 50% خبر داد.
اگرچه پیشبینیها نشان میدهد که معماری جدید ممکن است تأثیر زیادی در بازارها نداشته باشد همانطور که با نسخههای قبلی اتفاق افتاد، اما موفقیت آن میتواند شرکتهای رقیب محلی مانند Qwen وابسته به "علیبابا" و شرکتهای آمریکایی مانند OpenAI را تحت فشارهای فزایندهای قرار دهد، بهویژه اگر دیپسیک بتواند "تواناییهای بالا را با هزینهای بسیار کمتر" نسبت به رقبای خود در زمینه توسعه و آموزش مدلها ارائه دهد.