Geçtiğimiz dün itibariyle, OpenAI, ChatGPT-4o’nun kendilerine göre “insan ile bilgisayar etkileşimini birkez daha bir adım daha doğal hale yaklaştıracak” ücretsiz yeni bir model sürümünün yayınlandığını bildirdi. Yeni olan bu sinir ağı metin, ses ayrıca görüntülerin de herhangi bir kombinasyonunu kabul ettiğini görüyoruz. Tüm bu formatlarda ki yanıtları üretmektedir. OpenAI’ye göre, AI ile artık yeni sürüm duyguları bile tanıyor, herhangi bir cümlenin ortasında araya girebilirken ayrıca neredeyse bir insan kadar hızlı yanıt verebiliyor.
OpenAI ChatGPT-4o ismindeki “o” harfi sadece 40’ı taklit etmek ile kalmamakla beraber aynı zamanda kapsamlılık yada tamamen her şeyi kapsama anlamına da geldiği omni’yi de temsil etmektedir. OpenAI CTO’su Mira Murati, ChatGpt-4o’nun kullanacak herkes için, hatta ücretli aboneliği olmayan kullanıcılar içinde ChatGPT-4 şeçenek düzeyinde bir yapay zeka sürümü olacağını belirtti.
ChatGPT-4o’ın sunumunda, kağıt üzerinde yazılı doğrusal olan bir denklemi çözerek ve sadece nefes seslerini dinleyerek derin nefes alma ipuçları da verdi.
Bir önceki dil modelleri olan ChatGpt-3.5 ve ChatGPT-4 de sesle iletişim kurabiliyorlardı, fakat baktığımız zaman ses önce metne çevrilmekte ve de ardından işlenmekteydi. Diğer bir deyişle, önce bir sinir ağı sesi işlmekteydi, hemen ardından da başka bir sinir ağı metni işliyordu. Şimdi ise aynı olan bu sinir ağı hem sesi hem de taşıdığı bilgiyi işleyebiliyor. Sonuç olarak bu yaklaşımla OpenAI, muhatabın duygusal durumunu mevcut malzemeden daha fazla bağlam elde etmeye çalışıyor ve Ayrıca çok da daha hızlı çalışıyor.