Yapay Zeka

DeepSeek yeni modelini tanıttı: NVIDIA için beklenmedik bir durum!

Çin merkezli yapay zeka firması DeepSeek, NVIDIA CUDA ekosistemine olan bağımlılığı azaltmak amacıyla yeni bir adım atarak DeepSeek-V3.2-Exp modelini piyasaya sürdü. Bu model, Huawei’nin Ascend hızlandırıcıları ve şirketin CANN yazılım yığını için ilk günden itibaren optimize edilmiş olarak sunuldu. Böylece Çin merkezli teknoloji şirketlerinin, ABD kaynaklı donanım ve yazılım ekosistemlerinden bağımsızlaşma süreci hız kazandı.

DeepSeek, modeli 29 Eylül 2025’te tanıttı ve teknik raporla birlikte Hugging Face platformunda kod ve kontrol noktalarını paylaştı. Şirket, V3.2-Exp modelini “uzun bağlamlı çıkarımlarda maliyetleri düşürmeye yönelik, yeni nesil mimarimize geçişte bir ara adım” olarak tanımlıyor. Model, çıktı kalitesini korurken bellek ve işlem gücü gereksinimlerini azaltan seyrek dikkat (sparse attention) mekanizmasıyla dikkat çekiyor.

Huawei’nin Ascend ekibi ve daha geniş vLLM-Ascend topluluğu, modele hızla uyum sağladı. Ascend NPU’lar üzerinde çalıştırılabilmesi için özel operatör kurulum talimatları ve çekirdek paketleme yönergeleri yayımlandı. Ayrıca CANN ekibi, Huawei donanımında doğrudan çalıştırılabilecek çıkarım tarifini kullanıcılarla paylaştı.

DeepSeek, Çinli üreticiler tarafından destekleniyor

Huawei dışında, diğer Çinli yonga üreticileri de sürece hızlıca dahil oldu. Cambricon, kendi hızlandırıcıları için vLLM-MLU sürümünü güncelledi ve modelin seyrek dikkat yapısının uzun dizilerde maliyet avantajı sağladığını açıkladı. Hygon ise DCU hızlandırıcılarını DTK yazılım yığını aracılığıyla “sıfır gecikme” ile dağıtıma hazır hale getirdiğini duyurdu.

Ayrıca SGLang, Ascend dahil olmak üzere farklı donanımlarda V3.2-Exp desteğini onayladı. DeepSeek’in GitHub’daki notları, modelin vLLM ile eşdeğer performans sunduğunu göstermektedir. Şirket, hem TileLang hem de CUDA çekirdeklerinden bahsederek araştırmacıları TileLang’ı prototipleme için kullanmaya çağırıyor. Bu yaklaşım, aynı modelin küçük değişikliklerle hem NVIDIA GPU’larda hem de Çinli hızlandırıcılarda çalıştırılmasını sağlıyor.

Bu gelişmeler, Çin’in yapay zeka ekosisteminin, NVIDIA donanımına erişimin garanti edilemeyeceği bir geleceğe hazırlık yaptığını net bir şekilde ortaya koyuyor. CUDA hala küresel düzeyde hakimiyetini sürdürmesine rağmen, DeepSeek’in yeni modeli, ilk günden itibaren CUDA dışı platformlara optimize edilmiş büyük ölçekli Çinli girişimlerden biri olarak dikkat çekiyor.

DeepSeek sudan ucuz!

DeepSeek sudan ucuz!

DeepSeek yapay zeka sektöründeki maliyetleri alt üst etti. Sınırlı çiplerle elde edilen bu başarı, Çin’in yükselişini gözler önüne seriyor.

Huawei, Cambricon ve Hygon’un işbirliği, Pekin’in “teknolojik egemenlik” hedeflerinin şirketler tarafından ciddiyetle benimsendiğini gösteriyor. Çinli üreticiler artık yalnızca NVIDIA tabanlı sistemlere uyum sağlamakla kalmıyor; kendi donanım ve yazılım platformlarını birinci sınıf hedefler olarak konumlandırıyorlar.