Connect with us

TEKNOLOJİ

OpenAI, ses kopyalama aracı üzerinde çalışıyor

OpenAI, 15 saniyelik bir sesten yola çıkarak bir kopyasını oluşturan araç üzerinde çalışıyor. Ancak güvenlik kaygılarından dolayı tedbirleri de ihmal etmiyor.

Yayınlanma tarihi:

OpenAI’nin Ses Motoru, yapay zekâ ve ses teknolojilerinin sınırlarını genişleten yeni bir dönüm noktasını temsil ediyor. Bu teknoloji, kullanıcılara bir sesin 15 saniyelik bir örneğinden yola çıkarak sentetik bir kopyasını oluşturma imkânı sunuyor. Ancak, bu ileri teknolojinin sorumlu bir şekilde dağıtılmasını sağlamak amacıyla, halka açık kullanım tarihi henüz açıklanmadı. Ses Motoru, ChatGPT ve Spotify’ın podcast dublajı gibi uygulamalar için kullanılan generatif bir yapay zekâ modeli üzerine kurulu. Bu model, lisanslı ve kamuoyuna açık veriler üzerinde eğitilmiştir. OpenAI, bazı içerik sağlayıcıları ile lisans anlaşmalarına sahip olmakla birlikte, fikri mülkiyet yasalarını ihlal ettiği iddiasıyla davalara konu olmuştur. Ses Motoru, konuşmacı başına özel ayarlama yapmadan küçük ses örneklerinden gerçekçi konuşma üretebiliyor. Sağladığı rekabetçi $15/milyon karakter fiyatıyla dikkat çekiyor, ancak özelleştirme seçenekleri sınırlı.

Voice Engine’in ses işlerini bir emtia haline getirme potansiyeli, geleneksel ses aktörleri için endişe kaynağı oluşturuyor. AI ses platformlarından ElevenLabs gibi kuruluşlar, orijinal yaratıcılar için pazar yerleri ve tazminatlarla denge kurmaya çalışıyor.

Bu araç ne kadar etik olacak?

Ses kopyalama uygulamaları, aktörlere yönelik tehditler ve kötü amaçlar için kötüye kullanılma gibi nedenlerle kullanılmıştır. OpenAI, Ses Motoru’nu ‘düşük riskli’ ve ‘toplumsal yararı olan’ kullanım durumlarını önceliklendiren küçük bir geliştirici grubuna sunarak bu sorunların önüne geçmeyi hedefliyor. OpenAI, kötüye kullanımı önlemek adına, Ses Motoru’nun erişimini sorumlu sentetik medya kullanım durumlarını önceliklendiren küçük bir geliştirici grubuyla sınırlı tutuyor. Erken benimseyenler arasında edtech, hikâye anlatımı, sağlık hizmetleri ve erişilebilirlik uygulamaları yer alıyor.

OpenAI, sağlık hizmetleri, erişilebilirlik ve toplumsal yarar sağlayan uygulamaları önceliklendirerek sorumlu dağıtımı ön planda tutuyor. Ses Motoru, seslendirmeler, çeviri, sağlık araçları ve erişilebilirlik amaçları için şirketler tarafından benimsenmiş durumda.

Ses filigranı ve kırmızı ekip sayesinde üst seviye güvenlik

OpenAI, Ses Motoru ile üretilen kayıtlara duyulamayan tanımlayıcılar gömmek için bir watermarking (filigran) tekniği kullanıyor. Şirket, bu teknolojiyi kamuoyuna sunmayı düşünüyor ancak ilişkili riskler nedeniyle tedbirli davranıyor.

OpenAI, potansiyel kötüye kullanımları belirlemek için kırmızı ekip ağına Ses Motoru’na erişim sağlamayı planlıyor. Şirket, kullanıcıların rastgele üretilmiş metni okumasını gerektiren güvenlik önlemleri gibi önlemleri test ederek Ses Motoru’nun güvenli ve sorumlu kullanımını sağlamaya çalışıyor.

Bizi takip edin:

Google Play'den alın Google News Twitter
Continue Reading
Advertisement
Yorum yapmak için tıkla