DERİN DÜŞÜNME YETENEĞİ
Çin merkezli yapay zeka girişimi DeepSeek, yakında piyasaya süreceği yeni büyük dil modeli (LLM) DeepSeek-R2 ile dikkatleri üzerine çekiyor. Modelin, Huawei’nin Ascend 910B çip kümesiyle çalışacağı ve 15-30 Ağustos tarihleri arasında tanıtılması bekleniyor. 512 PetaFLOPS işlem gücüne ulaşan bu sistem, önceki R1 modeline göre daha gelişmiş mantıksal düşünme kapasiteleri, yanıt verme yetenekleri ve görev verimliliği sağlayacak. Şirket, maliyet etkinliği ile açık kaynak yapısını korumayı hedefliyor.
NVIDIA HİSSELERİNDE ETKİSİ
DeepSeek, ocak ayında tanıtılan R1 modeli ile ABD teknoloji dünyasında çarpıcı bir etki yaratmıştı. Apple’ın ABD uygulama mağazasında en çok indirilen ücretsiz uygulama olan DeepSeek-R1, geliştirilmesi için sadece 5,6 milyon dolar harcandığını öne sürerek OpenAI’nin milyarlarca dolarlık GPT sistemlerine rakip olmayı başarmıştı. Bu durum, Nvidia hisselerinde tarihin en büyük tek günlük değer kaybına yol açmıştı.
GÜVENLİK ENDİŞELERİ VE REKABET
R1’in elde ettiği başarı, “büyüğün her zaman daha iyi olduğu” anlayışını sorgulatmış ve daha küçük ama etkili modellerin de yüksek performans sunabileceğini gösterdi. Ancak, şirketin Çin’deki veri merkezleri ve Pekin yönetimi ile olası bağlantıları nedeniyle ABD’de ciddi güvenlik endişeleriyle karşılaştığı biliniyor. Uzmanlar, DeepSeek’in R2 modeli ile küresel rekabete yeniden katılmayı hedeflese de yüksek performanslı çip tedarikinde yaşanan sıkıntılar ve hem ABD hem de Çin’deki artan rekabetin, şirketin büyümesini zorlaştıracağını bildiriyor.