YENİ DİL MODELİ TANITILACAK
Çin merkezli yapay zeka girişimi DeepSeek, piyasaya sürmeyi planladığı yeni büyük dil modeli (LLM) DeepSeek-R2 ile yeniden gündeme geliyor. Model, Huawei’nin Ascend 910B çip kümesiyle çalışacak ve 15-30 Ağustos tarihleri arasında tanıtılması bekleniyor. 512 PetaFLOPS işlem gücüne ulaşan sistem, önceki R1 modeline göre daha gelişmiş mantıksal düşünme, yanıt verme ve görev verimliliği sunacak. Şirket, maliyet etkinliğini, açık kaynak yapısını ve verimliliği koruma hedefinde ilerliyor.
REKABET VE HEDEFLER
DeepSeek, ocak ayında tanıttığı R1 modeliyle ABD teknoloji dünyasında büyük bir etki yaratmıştı. Apple’ın ABD uygulama mağazasında en çok indirilen ücretsiz uygulama olan DeepSeek-R1, geliştirme maliyeti olarak yalnızca 5,6 milyon dolar harcandığını belirterek OpenAI’nin milyarlarca dolarlık GPT modellerine rakip olmayı başardı. Bu durum, Nvidia hisselerinde tarihin en büyük günlük değer kaybına yol açmıştı.
GÜVENLİK ENDİŞELERİ VE REKABETZORLUKLARI
R1’in başarılı performansı, “büyüğün her zaman daha iyi olduğu” anlayışını sorgulattı ve daha küçük ancak verimli modellerin de yüksek performans sunabileceğini gösterdi. Ancak şirket, Çin’deki veri merkezleri ve Pekin yönetimiyle olan bağlantıları sebebiyle ABD’de güvenlik kaygılarıyla karşı karşıya. Uzmanlar, DeepSeek’in R2 ile küresel rekabete yeniden katılmak istemesine rağmen, yüksek performanslı çip tedarikinde yaşanan sıkıntılar ve hem ABD hem de Çin’de artan rekabetin, şirketin ilerlemesini zorlaştırabileceğini ifade ediyor.