Erişilebilirlik

ABD’de son zamanlarda yapay zeka dünyasının yakından izlediği Çin girişimi DeepSeek nedir?


Çin kurumsal kayıtlarına göre DeepSeek, hakim hissedarı yatırım fonu High-Flyer'ın kurucu ortağı Liang Wenfeng olan Hangzhou merkezli bir startup.
Çin kurumsal kayıtlarına göre DeepSeek, hakim hissedarı yatırım fonu High-Flyer'ın kurucu ortağı Liang Wenfeng olan Hangzhou merkezli bir startup.

Çinli startup şirketi DeepSeek'in, ABD'deki sektörün öncü modelleriyle aynı seviyede ya da daha iyi olduğunu söylediği en yeni yapay zeka modellerini maliyetinin çok altında piyasaya sürmesi, teknoloji dünyasını altüst etme tehdidi yaratıyor.

Şirket, geçtiğimiz ay bir makalede DeepSeek-V3'ün eğitiminin Nvidia H800 çiplerinden 6 milyon dolardan daha az bir işlem gücü gerektirdiğini yazdıktan sonra küresel yapay zeka çevrelerinde dikkatleri üzerine çekmişti.

DeepSeek'in DeepSeek-V3 tarafından desteklenen yapay zeka asistanı, rakibi ChatGPT'yi geride bırakarak ABD'deki Apple Uygulama Mağazası'nda bulunan en yüksek puanlı ücretsiz uygulama haline geldi.

Bu durum, bazı ABD'li teknoloji şirketlerinin milyarlarca dolarlık yapay zeka yatırımı yapma kararının gerekçeleriyle ilgili şüpheleri arttırdı ve Nvidia dahil birçok büyük teknoloji oyuncusunun hisseleri darbe aldı.

DeepSeek neden teknoloji dünyasında çalkantıya yol açıyor?

OpenAI'ın geliştirdiği ChatGPT'nin 2022'nin sonlarında piyasaya sürülmesi, kendi yapay zeka destekli sohbet robotlarını yaratmak için acele eden Çinli teknoloji firmaları arasında mücadeleye neden oldu.

Ancak arama motoru devi Baidu tarafından yapılan ilk Çin ChatGPT eşdeğerinin piyasaya sürülmesinden sonra yaygın bir hayal kırıklığı yaşandı. Bunun nedeni, Çin'de ABD ve Çin firmalarının geliştirdiği yapay zeka kapasitesi arasındaki uçurumdu.

DeepSeek'in modellerinin kalitesi ve maliyet verimliliği bu durumu tersine çevirdi. Çinli startup şirketi, Silikon Vadisi yöneticileri ve ABD'li teknoloji şirketi mühendisleri tarafından övgü yağmuruna tutulan iki modelin, DeepSeek-V3 ve DeepSeek-R1'in, OpenAI ve Meta'nın en gelişmiş modelleriyle aynı seviyede olduğunu bildirdi.

Ayrıca bu modellerin kullanımları da daha ucuz. DeepSeek'in resmi WeChat hesabındaki bir paylaşıma göre, geçen hafta piyasaya sürülen DeepSeek-R1'in kullanımı, yapılan işe bağlı olarak OpenAI o1 modelinden 20 ila 50 kat daha ucuz.

Ancak bazıları DeepSeek'in başarı öyküsü hakkındaki kuşkularını açıkça dile getiriyor.

Yapay zeka firması Scale AI CEO'su Alexandr Wang, Perşembe günü CNBC'ye verdiği bir röportaj sırasında, kanıt sunmadan, DeepSeek'in 50 bin adet Nvidia H100 çipine sahip olduğunu söyledi. Wang, bunun açıklanmayacağını çünkü Washington'un bu tür gelişmiş yapay zeka çiplerinin Çinli şirketlere satılmasını yasaklayan ihracat kontrollerini ihlal edeceğini iddia etti. DeepSeek iddiaya ilişkin yorum talebine hemen yanıt vermedi.

Yatırım araştırmaları firması Bernstein'in analistleri Pazartesi günü yayınladıkları bir araştırma notunda DeepSeek'in V3 modeli için toplam eğitim maliyetinin bilinmediğini ancak bu maliyetin girişimin bilgi işlem gücü için kullanıldığını söylediği 5,58 milyon dolardan çok daha yüksek olduğunu vurguladı. Analistler ayrıca aynı derecede beğenilen R1 modelinin eğitim maliyetlerinin de açıklanmadığını söyledi.

DeepSeek'in arkasında kim var?

Çin kurumsal kayıtlarına göre DeepSeek, hakim hissedarı yatırım fonu High-Flyer'ın kurucu ortağı Liang Wenfeng olan Hangzhou merkezli bir startup.

Liang'ın fonu, Mart 2023'te resmi WeChat hesabında, kaynakları “Yapay Genel Zeka'nın özünü keşfetmek için yeni ve bağımsız bir araştırma grubu” oluşturmaya yoğunlaştırmak için ticaretin ötesine geçtiğini duyurdu. DeepSeek, 2023 sonlarında kuruldu.

ChatGPT'yi geliştiren OpenAI, Yapay Genel Zeka'yı, ekonomik açıdan değerli işlerin çoğunda insanları aşan otonom sistemler olarak tanımlıyor.

High-Flyer'ın DeepSeek'e ne kadar yatırım yaptığı belli değil. Çin kurumsal kayıtlarına göre High-Flyer'ın DeepSeek ile aynı binada bulunan bir ofisi var ve aynı zamanda yapay zeka modellerini eğitmek için kullanılan çip kümeleriyle ilgili patentlere de sahip.

High-Flyer'ın yapay zeka birimi, Temmuz 2022'de resmi WeChat hesabında, 10 bin adet A100 çipten oluşan bir kümeye sahip olduğunu ve işlettiğini bildirdi.

Pekin DeepSeek'e nasıl bakıyor?

DeepSeek'in başarısı Çin'in üst düzey siyasi çevrelerinde şimdiden fark edildi. Devlet haber ajansı Xinhua'ya göre DeepSeek-R1'in halka açıklandığı 20 Ocak günü kurucu Liang, Çin Başbakanı Li Qiang'ın ev sahipliğinde işadamları ve uzmanlar için düzenlenen kapalı kapılar ardındaki bir sempozyuma katıldı.

Liang'ın toplantıya katılımı, DeepSeek'in başarısının Pekin'in Washington'un ihracat kontrollerini aşma ve yapay zeka gibi stratejik endüstrilerde kendi kendine yeterlilik sağlama politikası hedefi için önemli olabileceğinin bir işareti olabilir.

Geçen yıl düzenlenen benzer bir sempozyuma Baidu CEO'su Robin Li de katılmıştı.

Forum

XS
SM
MD
LG