DEEPSEEK YENİ DİL MODELİYLE GÜNDEMDE
Çin merkezli yapay zeka girişimi DeepSeek, yakında piyasaya sürmeyi planladığı yeni büyük dil modeli (LLM) DeepSeek-R2 ile dikkat çekiyor. Modelin, Huawei’nin Ascend 910B çip kümesiyle çalışacağı ve 15-30 Ağustos tarihleri arasında tanıtılması bekleniyor. 512 PetaFLOPS işlem gücüne ulaşan bu sistem, önceki R1 modeline göre daha yetkin mantıksal düşünme, daha hızlı yanıt verme ve görev verimliliği sunacak. Şirket, maliyet etkinliğini, açık kaynak yapısını ve verimliliği korumayı amaçlıyor.
R1 MODELİ ŞOK ETKİSİ YARATTI
DeepSeek, ocak ayında tanıttığı R1 modeliyle ABD teknoloji piyasasında büyük etki yarattı. Apple’ın ABD uygulama mağazasında en çok indirilen ücretsiz uygulama unvanını kazanarak, yalnızca 5,6 milyon dolar geliştirme maliyetiyle OpenAI’nin milyarlarca dolarlık GPT modellerine rakip olmayı başarmıştı. Bu gelişme, Nvidia hisselerinde tarihi bir değer kaybına neden oldu.
GÜVENLİK ENDİŞELERİ GÜNDEMDE
R1 modelinin başarısı, “büyüğün her zaman daha iyi olduğu” anlayışını sorgulatarak, daha küçük fakat verimli modellerin yüksek performans sunabileceğini gösterdi. Ancak, şirketin Çin’deki veri merkezleri ve Pekin yönetimiyle olası bağlantıları, ABD’de güvenlik endişelerine yol açtı. Uzmanlar, DeepSeek’in R2 ile küresel rekabete yeniden katılmayı hedeflese de yüksek performanslı çip tedarikinde yaşanan zorluklar ve hem ABD hem de Çin’de artan rekabetin, şirketin ilerlemesini zorlaştırabileceğini belirtiyor.