Google’ın yeni amiral gemisi yapay zekâ modeli “Gemini“, GPT-4’e doğrudan rakip olacak ve GPT-4’ün 5 katı bilgi işlem gücüne sahip olacak. Google’ın TPUv5 yongaları üzerinde eğitilmiş olan bu cihaz, devasa 16.384 yongayla eş zamanlı işlem yapma kapasitesine sahip. Bu modeli eğitmek için kullanılan veri kümesi yaklaşık 65 trilyon tokendir. Üstelik hem metin hem de resim üretebiliyor. Eğitimde ayrıca YouTube’dan içerik de yer aldı ve “AlphaGo tipi” yöntemlere benzer ileri eğitim teknikleri kullanıldığı bilgisi geldi. Google, Gemini modelini Aralık 2023’te halka sunmayı planlıyor.
Gemini , GPT-4’ü AlphaGo’dan alınan takviyeli öğrenme ve ağaç arama gibi eğitim teknikleriyle birleştiren ve ChatGPT’yi gezegendeki en baskın üretken yapay zeka çözümü olarak yerinden etme potansiyeline sahip bir dizi büyük dil modelidir.
Haber, Google’ın Brain ve DeepMind AI laboratuvarlarını Google DeepMind adında yeni bir araştırma ekibi oluşturmak için birleştirmesinden birkaç ay sonra ve Bard ve yeni nesil PaLM 2 LLM’nin piyasaya sürülmesinden yalnızca birkaç ay sonra geldi.
Araştırmacılar, üretken yapay zeka pazarının 2032 yılına kadar 1,3 trilyon dolar değerinde olacağını tahmin ederken, Google’ın yapay zeka gelişiminde lider konumunu korumak için alana yatırım yapmak için elinden geleni yapacağı açık gözüküyor.
Pek çok kişi Google Gemini’nin 2023 sonbaharında piyasaya sürülmesini beklese de modelin yetenekleri hakkında pek bir şey bilinmiyor.
Mayıs ayında, Google ve Alphabet CEO’su Sundar Pichai, LLM’ye üst düzey bir bakış sunan bir blog yazısı yayınlayarak şunları açıkladı:
“Gemini, sıfırdan çok modlu, araç ve API entegrasyonlarında son derece verimli olacak şekilde oluşturuldu ve bellek ve planlama gibi gelecekteki yenilikleri mümkün kılacak şekilde inşa edildi.”
Pichai ayrıca şunları kaydetti: “Henüz erken olmasına rağmen, önceki modellerde görülmeyen etkileyici çoklu mod yeteneklerini zaten görüyoruz.
“Güvenlik açısından ince ayarlar yapıldıktan ve sıkı bir şekilde test edildikten sonra Gemini, tıpkı PaLM 2 gibi çeşitli boyut ve yeteneklerde satışa sunulacak.”
O zamandan bu yana, Google DeepMind CEO’su Demis Hassabis’in Wired ile yaptığı röportajda Gemini’nin “AlphaGo tipi sistemlerin bazı güçlü yanlarını büyük modellerin muhteşem dil yetenekleriyle birleştireceğini” belirtmesi dışında, sürüm hakkında resmi olarak pek bir şey söylenmedi.
Android Police ayrıca ürünle ilgili isimsiz bir kaynağın Gemini’nin metin ve bağlamsal görseller oluşturabileceği ve YouTube video transkriptleri gibi kaynaklar konusunda eğitim alabileceği yorumunu yaptığını iddia ettmişti.
Gemini’nin piyasaya sürülmesiyle ilgili en büyük tartışmalardan biri, gizemli dil modelinin, bu yıl aylık 100 milyondan fazla aktif kullanıcıya ulaşan ChatGPT’yi yerinden etmek için gerekenlere sahip olup olmadığıdır.
İlk bakışta Gemini’nin metin ve resim oluşturma yeteneği, üretebileceği içerik yelpazesi açısından ona GPT4’e göre ciddi bir avantaj sağlıyor.
Bununla birlikte, belki de ikisi arasındaki en tehlikeli fark, Google’ın çok çeşitli özel eğitim verileridir. Google Gemini, aralarında Google Arama, YouTube, Google Kitaplar ve Google Akademik’in de bulunduğu hizmetlerden alınan verileri işleyebilir.
Gemini modellerinin eğitiminde bu özel verilerin kullanılması, bir veri kümesinden alabileceği öngörülerin ve çıkarımların karmaşıklığında belirgin bir üstünlük sağlayabilir. Bu özellikle Gemini’nin GPT4’ün iki katı token üzerinde eğitildiğine dair ilk raporların doğru olması durumunda geçerli olacaktır.
Buna ek olarak, Google DeepMind ve Brain ekiplerinin bu yılki ortaklığı küçümsenemez; zira bu ortaklık, OpenAI’yi Google’ın kurucu ortağı Sergey Brin ve DeepMind kıdemli yapay zeka da dahil olmak üzere birinci sınıf yapay zeka araştırmacılarından oluşan bir ekiple karşı karşıya getiriyor.
Bu, DeepMind ekibinin bir Go’yu yenmek için AlphaGo’yu öğrettiği, geri bildirim toplayabilen ve zamanla problem çözmeyi geliştirebilen yapay zeka programları oluşturmak için takviyeli öğrenme ve ağaç arama gibi tekniklerin nasıl uygulanacağı konusunda derin bir anlayışa sahip deneyimli bir ekiptir.
Gemini’nin çok modlu yetenekleri, güçlendirilmiş ebeveynlik kullanımı, metin ve resim oluşturma yetenekleri ve Google’ın özel verileri, Gemini’nin GPT-4’ten daha iyi performans göstermesi için ihtiyaç duyduğu tüm bileşenler olarak gözüküyor.
Şimdi soru şu: OpenAI buna yanıt vermek için ne yapacak?
Bir yanıt yazın