OpenAI, GPT-4o ile Görsel Oluşturma Alanında Yeni Bir Dönem Başlattı!
OpenAI, GPT-4o modelinin yeni görsel üretim özelliklerini tanıttı. Şirketin duyurusuna göre, GPT-4o önceki versiyonlara kıyasla daha hassas, detaylı ve gerçekçi görseller oluşturma yeteneğine sahip. Bu yenilik sayesinde kullanıcılar, basit komutlarla istedikleri görselleri oluşturabilir, düzenleyebilir ya da mevcut görseller üzerinden yeni tasarımlar geliştirebilirler.
GPT-4o ile görsel oluşturmanın yeni bir dönemi!
OpenAI, görsel oluşturma yeteneğinin dil modelleri için temel bir yetenek olması gerektiğini uzun zamandır öne sürüyor. GPT-4o, bu düşünce doğrultusunda geliştirilmiş şirketin en gelişmiş ve kullanışlı görsel oluşturma sistemi olarak öne çıkıyor. GPT-4o ile yaratılan görseller, estetik açıdan olduğu kadar bilgi aktarımı açısından da oldukça faydalı hale geliyor.
Yeni model, kullanıcıların verdiği komutları daha doğru bir şekilde anlayarak görsellere daha hassas bir şekilde uyarlıyor. Özellikle karmaşık ve çok nesneli görsellerde, GPT-4o rakiplerine göre daha üstün bir performans sergiliyor.
Örneğin, model artık tek bir görsel içerisinde 10 ila 20 farklı objeyi tutarlı bir şekilde bir araya getirebiliyor. Ayrıca, modelin görsellerdeki metin ve sembolleri doğru bir şekilde işleyebilme yeteneği sayesinde logolar, diyagramlar ve infografikler gibi bilgilendirici görseller üretmek çok daha pratik hale geliyor.
OpenAI’nin paylaştığı örnekler arasında, beyaz tahtada yapılan toplantı notları, çizgi romanlar, bilimsel deneylerin ayrıntılı infografikleri ve anlamlı metinlerle desteklenen görseller yer alıyor. Şirket, görsel oluşturmanın dekoratif amaçlı olmanın yanı sıra bilgi paylaşımı ve iletişimde de güçlü bir araç olarak kullanılması gerektiğinin altını çizdi.
Yeni GPT-4o modeli, çok adımlı görsel üretimi özelliği de sunuyor. Bu özellik sayesinde kullanıcılar, oluşturdukları görselleri bir sohbet ortamında model ile birlikte geliştirebiliyorlar. Örneğin, bir oyun karakterinin tasarımı adım adım şekillendirilebilir ve her aşamada karakterin tutarlılığı korunabilir.
GPT-4o, kullanıcının yüklediği görselleri analiz ederek bu görsellerden yeni içerikler oluşturma yeteneğine de sahiptir. Bu özellik, modeli kullanıcılar için daha sezgisel ve kişiselleştirilmiş bir araç haline getiriyor. OpenAI’ye göre, GPT-4o’da kullanılan görüntülerin çeşitliliği ve stili, modelin foto-gerçekçi görseller üretmesini ve görsel dönüşümleri ikna edici bir şekilde gerçekleştirmesini sağlıyor.
OpenAI, yeni modelin bazı kısıtlamaları olduğunu da kabul ediyor. Özellikle küçük yazılar içeren yoğun bilgi barındıran grafikler veya çok dilli görsellerde sınırlamalar mevcut. Ayrıca bazen istenmeyen görsel kırpma ve tutarsızlık gibi problemler oluşabileceği ifade edildi. Şirket, bu konularda gelecekte iyileştirmeler yapmayı planladığını belirtmiştir.
OpenAI, görsel oluşturma özelliğini güvenli hale getirmek için çeşitli önlemler aldığını da duyurdu. GPT-4o tarafından üretilen tüm görsellere, içeriğin kaynağının OpenAI olduğunu belirten C2PA meta verileri ekleniyor. Bu sayede oluşturulan içeriklerin özgünlüğü daha kolay bir şekilde doğrulanabiliyor. Ayrıca zararlı içerik taleplerinin otomatik olarak engellendiği vurgulandı.
Bugünden itibaren, GPT-4o’nun görsel oluşturma yetenekleri ChatGPT’de Plus, Pro, Team ve ücretsiz kullanıcılar için varsayılan seçenek olarak kullanılmaya başlandı. Enterprise ve Edu kullanıcıları da kısa bir süre içinde bu özellikten faydalanabilecek.
DALL·E hayranları içinse bu model hala özel bir DALL·E GPT üzerinden erişilebilir olacak. Ayrıca geliştiriciler, gelecek haftalarda API aracılığıyla GPT-4o’nun görsel oluşturma özelliğini de kullanabilecektir.