Connect with us

TEKNOLOJİ

OpenAI, video üreten yeni aracı Sora’yı tanıttı

OpenAI, video üreten yeni aracı Sora’yı tanıttı. İddialı bir başlangıç yapan Sora girilen metinlere çok gerçekçi videolar üretti.

Yayınlanma tarihi:

OpenAI bugün, metinden video oluşturan üretken bir yapay zekâ modeli olan Sora’yı tanıttı. OpenAI, kısa veya ayrıntılı bir açıklama veya sabit bir görüntü verildiğinde Sora’nın birden fazla karakter, farklı hareket türleri ve arka plan ayrıntıları içeren 1080p film benzeri sahneler oluşturabileceğini iddia ediyor.

Sora ayrıca mevcut video klipleri “genişletebilir”; eksik ayrıntıları doldurmak için elinden geleni yapar.

OpenAI bir blog yazısında şöyle yazıyor: “Sora’nın derin bir dil anlayışı var, bu da onun istemleri doğru bir şekilde yorumlamasına ve canlı duyguları ifade eden ilgi çekici karakterler oluşturmasına olanak tanıyor.” ” Model, yalnızca kullanıcının istemde ne istediğini değil, aynı zamanda bu şeylerin fiziksel dünyada nasıl var olduğunu da anlıyor.”

Şimdi, OpenAI’nin Sora demo sayfasında pek çok ifade var; yukarıdaki ifade bir örnektir. Ancak modelin özenle seçilmiş örnekleri, en azından gördüğümüz diğer metinden videoya teknolojilerle karşılaştırıldığında oldukça etkileyici görünüyor.

“Bir drone kamerası, Amalfi Sahili boyunca kayalık bir çıkıntının üzerine inşa edilmiş güzel bir tarihi kilisenin etrafında daireler çiziyor, manzara tarihi ve muhteşem”. yazısı ile ilgili bu videoyu sora üretti.

Yeni başlayanlar için Sora, bir dakikaya kadar çeşitli stillerde (örneğin, fotogerçekçi, animasyonlu, siyah beyaz) videolar oluşturabilir; bu, çoğu metinden videoya modelden çok daha uzun. OpenAI – tüm üstünlüklerine rağmen – modelin mükemmel olmadığını kabul ediyor. Şöyle yazıyor:

“Sora karmaşık bir sahnenin fiziğini doğru bir şekilde simüle etmekte zorlanabilir ve belirli neden-sonuç örneklerini anlayamayabilir. Örneğin, bir kişi bir kurabiyeden bir ısırık alabilir ancak sonrasında kurabiyede herhangi bir ısırık izi kalmayabilir. Model aynı zamanda bir istemin uzamsal ayrıntılarını da karıştırabilir (örneğin, sol ve sağın karıştırılması gibi) ve belirli bir kamera yörüngesini takip etmek gibi zaman içinde meydana gelen olayların kesin açıklamalarında zorluk yaşayabilir.”

OpenAI, Sora’yı bir araştırma ön izlemesi olarak konumlandırıyor, modeli eğitmek için hangi verilerin kullanıldığı hakkında çok az bilgi veriyor (yaklaşık 10.000 saatlik “yüksek kaliteli” video) ve Sora’yı genel kullanıma sunmaktan kaçınıyor. Gerekçesi istismar potansiyelidir; OpenAI, kötü aktörlerin Sora gibi bir modeli sayısız şekilde kötüye kullanabileceğini doğru bir şekilde belirtiyor.

OpenAI, bir videonun Sora tarafından oluşturulup oluşturulmadığını tespit etmek için modeli istismarlara yönelik olarak incelemek ve araçlar oluşturmak üzere uzmanlarla birlikte çalıştığını söylüyor. Şirket ayrıca, modeli halka açık bir üründe oluşturmayı seçmesi durumunda, oluşturulan çıktılara kaynak meta verilerinin dâhil edilmesini sağlayacağını da söylüyor.

“60’lı yaşlarında, gri saçlı, sakallı bir adamın aşırı yakın çekimi; Paris’te bir kafede otururken derin düşüncelere dalmış, evrenin tarihi üzerine kafa yoruyor, gözleri ekranın dışında yürüyen insanlara odaklanıyor. çoğunlukla hareketsiz oturuyor, yünlü bir takım elbise ve düğmeli bir gömlek giyiyor, kahverengi bir bere ve gözlük takıyor ve oldukça profesyonel bir görünüme sahip ve sonunda sanki bulmuş gibi hafif bir kapalı ağız gülümsemesi sunuyor. hayatın gizeminin cevabı, altın rengi ışık ve arka planda Paris sokakları ve şehri, alan derinliği, sinematik 35mm film ile çok sinematik bir film.” Yazısı ile ilgili sora bu videoyu üretti.

OpenAI, “Endişelerini anlamak ve bu yeni teknolojinin olumlu kullanım örneklerini belirlemek için dünyanın dört bir yanındaki politika yapıcılar, eğitimciler ve sanatçılarla etkileşime geçeceğiz” diye yazıyor. “Kapsamlı araştırma ve testlere rağmen, insanların teknolojimizi kullanacakları tüm yararlı yolları veya onu kötüye kullanacakları tüm yolları tahmin edemiyoruz. Bu nedenle, gerçek dünyadaki kullanımdan öğrenmenin, zaman içinde giderek daha güvenli hale gelen yapay zekâ sistemleri oluşturmanın ve piyasaya sürmenin kritik bir bileşeni olduğuna inanıyoruz.” Açıklaması yaptı.

Çok gerçekci öyle değil mi?, “Düzgünce taranmış gri saçlı bir büyükanne, ahşap yemek masasında çok sayıda mum bulunan renkli bir doğum günü pastasının arkasında duruyor.” Yazısı ile ilgili sora bu videoyu üretti.

teknik raporun detaylarını okuyabilirsiniz.

Kaynak: OpenAI

Bizi takip edin:

Google Play'den alın Google News Twitter
Continue Reading
Advertisement
Yorum yapmak için tıkla