Yapay zeka yarışında Çinli firma ortalığı fena karıştırdı: Herkes DeepSeek'i konuşuyor

Okuma Süresi 3 dkYayınlanma Salı, Ocak 28 2025
Çin yapay zekâ yarışına hızlı girdi. Çin merkezli DeepSeek, App Store’da ChatGPT’yi geride bıraktı. Sadece 5.6 milyon dolar gibi bir maliyetle 671 milyar parametreye sahip R1 modeli, adeta Silikon Vadisi’nin gözdesi haline geldi.

Çin merkezli yapay zekâ girişimi DeepSeek’in mobil uygulaması, ABD’de OpenAI’ın sohbet robotu ChatGPT’yi geride bırakarak App Store’da en çok indirilen uygulama oldu.

DeepSeek, Mixture of Experts (MOE) mimarisini kullanarak açık kaynaklı büyük dil modelleri geliştiriyor. Geçtiğimiz hafta 671 milyar parametreye sahip R1 modelinin açık kaynak versiyonunu yayınlayan girişim, Silikon Vadisi’nin ilgi odağı oldu. Geçen ay bir makale yayınlayan DeepSeek araştırmacıları, mobil uygulamaya da güç veren DeepSeek-V3 modelinin eğitiminde Nvidia’nın H800 çiplerini kullandıklarını ve bunun şirkete 5.6 milyon dolara mal olduğunu açıkladı.

Açık kaynak ve bedava
Yapay zekâ modellerini eğitmek için milyar dolar harcayan ABD’li şirketler, sadece 5.6 milyon dolar maliyetle 671 milyar parametreye sahip bir modelin geliştirilebilmesinin ardından teknoloji ihracat kontrollerinin verimliliğini sorgulamaya başladı. Üstelik bu denli güçlü bir araç olmasına rağmen DeepSeek-R1 büyük ölçüde açık kaynaklı olarak yayınlandı.

R1’in sırrı ne?
DeepSeek’in başarısı, Çinli yapay zekâ şirketlerinin ABD’nin son teknoloji çiplere yönelik kısıtlamaları göz önüne alındığında daha da dikkat çekici. MIT Technology Review’a konuşan DeepSeek çalışanı Zihan Wang, Çin’in yaptırımlara karşı yenilikçi yollara başvurmak zorunda kaldığını söylüyor. Buna göre DeepSeek, R1 modelini oluşturmak için eğitim sürecini yeniden düzenledi. Çünkü Nvidia’nın Çin pazarı için satmaya izinli olduğu çiplerin performansı, şirketin en iyi ürünlerinin hızının yarısı kadar ediyor. Bu yüzden Çin, Nvidia’dan satın aldığı grafik işlem birimleri (GPU) üzerindeki yükü azaltmak için eğitim sürecini düzenledi. Diğer bir deyişle, ABD ihracat kontrolleri, R1 geliştiricilerini hesaplama gücü eksikliklerini telafi etmek için daha akıllı, daha enerji verimli algoritmalar oluşturmaya zorladı.

Bu haberler de ilginizi çekebilir