Teknoloji
OpenAI, video üreten yeni aracı Sora’yı tanıttı
OpenAI, video üreten yeni aracı Sora’yı tanıttı. İddialı bir başlangıç yapan Sora girilen metinlere çok gerçekçi videolar üretti.
OpenAI bugün, metinden video oluşturan üretken bir yapay zekâ modeli olan Sora’yı tanıttı. OpenAI, kısa veya ayrıntılı bir açıklama veya sabit bir görüntü verildiğinde Sora’nın birden fazla karakter, farklı hareket türleri ve arka plan ayrıntıları içeren 1080p film benzeri sahneler oluşturabileceğini iddia ediyor.
Sora ayrıca mevcut video klipleri “genişletebilir”; eksik ayrıntıları doldurmak için elinden geleni yapar.
OpenAI bir blog yazısında şöyle yazıyor: “Sora’nın derin bir dil anlayışı var, bu da onun istemleri doğru bir şekilde yorumlamasına ve canlı duyguları ifade eden ilgi çekici karakterler oluşturmasına olanak tanıyor.” ” Model, yalnızca kullanıcının istemde ne istediğini değil, aynı zamanda bu şeylerin fiziksel dünyada nasıl var olduğunu da anlıyor.”
Şimdi, OpenAI’nin Sora demo sayfasında pek çok ifade var; yukarıdaki ifade bir örnektir. Ancak modelin özenle seçilmiş örnekleri, en azından gördüğümüz diğer metinden videoya teknolojilerle karşılaştırıldığında oldukça etkileyici görünüyor.
Yeni başlayanlar için Sora, bir dakikaya kadar çeşitli stillerde (örneğin, fotogerçekçi, animasyonlu, siyah beyaz) videolar oluşturabilir; bu, çoğu metinden videoya modelden çok daha uzun. OpenAI – tüm üstünlüklerine rağmen – modelin mükemmel olmadığını kabul ediyor. Şöyle yazıyor:
“Sora karmaşık bir sahnenin fiziğini doğru bir şekilde simüle etmekte zorlanabilir ve belirli neden-sonuç örneklerini anlayamayabilir. Örneğin, bir kişi bir kurabiyeden bir ısırık alabilir ancak sonrasında kurabiyede herhangi bir ısırık izi kalmayabilir. Model aynı zamanda bir istemin uzamsal ayrıntılarını da karıştırabilir (örneğin, sol ve sağın karıştırılması gibi) ve belirli bir kamera yörüngesini takip etmek gibi zaman içinde meydana gelen olayların kesin açıklamalarında zorluk yaşayabilir.”
OpenAI, Sora’yı bir araştırma ön izlemesi olarak konumlandırıyor, modeli eğitmek için hangi verilerin kullanıldığı hakkında çok az bilgi veriyor (yaklaşık 10.000 saatlik “yüksek kaliteli” video) ve Sora’yı genel kullanıma sunmaktan kaçınıyor. Gerekçesi istismar potansiyelidir; OpenAI, kötü aktörlerin Sora gibi bir modeli sayısız şekilde kötüye kullanabileceğini doğru bir şekilde belirtiyor.
OpenAI, bir videonun Sora tarafından oluşturulup oluşturulmadığını tespit etmek için modeli istismarlara yönelik olarak incelemek ve araçlar oluşturmak üzere uzmanlarla birlikte çalıştığını söylüyor. Şirket ayrıca, modeli halka açık bir üründe oluşturmayı seçmesi durumunda, oluşturulan çıktılara kaynak meta verilerinin dâhil edilmesini sağlayacağını da söylüyor.
OpenAI, “Endişelerini anlamak ve bu yeni teknolojinin olumlu kullanım örneklerini belirlemek için dünyanın dört bir yanındaki politika yapıcılar, eğitimciler ve sanatçılarla etkileşime geçeceğiz” diye yazıyor. “Kapsamlı araştırma ve testlere rağmen, insanların teknolojimizi kullanacakları tüm yararlı yolları veya onu kötüye kullanacakları tüm yolları tahmin edemiyoruz. Bu nedenle, gerçek dünyadaki kullanımdan öğrenmenin, zaman içinde giderek daha güvenli hale gelen yapay zekâ sistemleri oluşturmanın ve piyasaya sürmenin kritik bir bileşeni olduğuna inanıyoruz.” Açıklaması yaptı.
teknik raporun detaylarını okuyabilirsiniz.
Kaynak: OpenAI