Connect with us

TEKNOLOJİ

Microsoft’tan beklenmedik bir araç: deepfake

Microsoft Ignite 2023 etkinliğinde çok konuşulacak deepfake aracını tanıttı.

Yayınlanma tarihi:

Microsoft Ignite 2023 etkinliğinde piyasaya sürülecek en beklenmedik ürünlerden biri,  bir kişinin fotogerçekçi bir avatarını oluşturabilen ve bu avatarın, kişinin mutlaka söylemediği şeyleri söylemesini canlandırabilen bir araçtır.

Azure AI Konuşma metninden konuşmaya avatar olarak adlandırılan ve bugün itibarıyla genel ön izlemeye sunulan yeni özellik, kullanıcıların, avatarın benzemesini istedikleri bir kişinin resimlerini yükleyerek ve bir komut dosyası yazarak konuşan bir avatarın videoları oluşturmasına olanak tanıyor. Microsoft’un aracı, animasyonu yürütmek için bir modeli eğitirken, önceden oluşturulmuş veya kişinin sesiyle eğitilmiş ayrı bir metinden konuşmaya modeli, senaryoyu yüksek sesle “okur”.

Microsoft, bir blog yazısında şöyle yazıyor: “Kullanıcılar, metinden konuşmaya avatarla daha verimli bir şekilde video oluşturabilirler, ürün tanıtımları, müşteri referansları (ve benzeri) oluşturmak için yalnızca metin girişi yapabilirler. ” “Avatar’ı konuşma aracıları, sanal asistanlar, sohbet robotları ve daha fazlasını oluşturmak için kullanabilirsiniz.”

Avatarlar birden fazla dilde konuşabilir. Ayrıca sohbet robotu senaryolarında müşterilerden gelen senaryo dışı sorulara yanıt vermek için OpenAI’nin GPT-3,5’i gibi yapay zekâ modellerinden faydalanabilirler.

Artık böyle bir aracın kötüye kullanılmasının sayısız yolu var; Microsoft da bunun farkında. (Yapay zekâ girişimi Synthesia’nın benzer avatar oluşturma teknolojisi,  Venezuela’da propaganda yapmak ve Çin yanlısı sosyal medya hesapları tarafından desteklenen yanlış haber raporları üretmek için kötüye kullanıldı .) Azure abonelerinin çoğu, lansman sırasında yalnızca önceden oluşturulmuş avatarlara (özel değil) erişebilecek; Microsoft, özel avatarların şu anda yalnızca kayıt yoluyla ve “yalnızca belirli kullanım durumları için” kullanılabilen “sınırlı erişim” özelliği olduğunu söylüyor.

Microsoft’un, aynı zamanda Ignite’ta piyasaya sürülen ilgili bir üretken yapay zekâ aracı olan kişisel ses etrafında daha fazla korkuluğa sahip olduğu görülüyor.

Microsoft’un özel sinirsel ses hizmetindeki yeni bir yetenek olan kişisel ses, bir dakikalık konuşma örneğini sesli komut olarak sağlayarak kullanıcının sesini birkaç saniye içinde kopyalayabilir. Microsoft bunu kişiselleştirilmiş sesli asistanlar oluşturmanın, içeriği farklı dillere kopyalamanın ve hikâyeler, sesli kitaplar ve podcast’ler için özel anlatımlar oluşturmanın bir yolu olarak sunuyor.

Olası hukuki sıkıntıları ortadan kaldırmak için Microsoft, bir müşterinin kendi sesini sentezlemek için kişisel sesini kullanabilmesi için kullanıcıların kayıtlı bir beyan şeklinde “açık izin” vermesini şart koşuyor. Bu özelliğe erişim şimdilik bir kayıt formuyla sağlanıyor ve müşterilerin kişisel seslerini yalnızca “ses kullanıcı tarafından oluşturulan veya açık uçlu içeriği okumadığı” uygulamalarda kullanmayı kabul etmeleri gerekiyor.

Microsoft, bir blog yazısında “Ses modeli kullanımı bir uygulama içinde kalmalı ve çıktı, uygulamadan yayınlanamaz veya paylaşılamaz olmalıdır” diye yazıyor. “Sınırlı erişim uygunluk kriterlerini karşılayan müşteriler, yalnızca eğlence senaryoları için film, TV, video ve ses dublajı için ses modellerinin oluşturulması, bunlara erişim ve bunların kullanımı ile bunların çıktıları (ilgili olduğu durumlarda) üzerinde tek kontrole sahip olurlar.”

Kaynak: TechCrunch

Bizi takip edin:

Google Play'den alın Google News Twitter
Continue Reading
Advertisement
Yorum yapmak için tıkla