Teknoloji

Meta, sesleri kopyalayan yapay zekâ aracı Audiobox’ı tanıttı!

Meta, üzerinde uzun yıllar boyunca çalıştığı ses yapay zekâ ailesinin yeni üyesi olan Audiobox’ı tanıttı. Sesleri işleyip çeşitli kullanım durumları oluşturuyor

Yayınlanma tarihi:

12 Aralık 2023 19:55

Güncelleme:

12 Aralık 2023 19:55

Yazar:

Mertcan Tutum

Son gelişmeleri kaçırmamak için Google News sayfamızı takip edin. Butona tıkladıktan sonra açılan sayfanın sağ üst tarafında yer alan yıldızlı "Takip Et" simgesine dokunmanız yeterlidir. Takip Et

Ses kopyalama, üretken yapay zekâ sayesinde hızla ortaya çıkan alanlardan biridir. Bu terim, bir kişinin ses tarzlarının (perde, tını, ritimler, tavırlar ve benzersiz telaffuzlar) teknoloji aracılığıyla kopyalanması anlamına gelir.

Reklam yükleniyor...

Sizin için uygun reklam bulunamadı!

Audiobox, “Ses girişleri ve doğal dildeki metin istemlerinin bir birleşim kullanarak sesler ve ses efektleri üretebiliyor; bu da çok çeşitli kullanım durumları için özel ses oluşturmayı kolaylaştırıyor. “

Kopyalanmış bir sesin söylemesini istediğiniz bir cümleyi veya oluşturmak istediğiniz sesin açıklamasını yazmanız yeterlidir; gerisini Audiobox halleder. Kullanıcılar ayrıca seslerini kaydedebilir ve Audiobox tarafından kopyalanmasını sağlayabilir.

Meta bu ses yapay zekâ ailesi üzerinde çalışıyor

Reklam yükleniyor...

Sizin için uygun reklam bulunamadı!

Meta ayrıca, birinin konuşma taklidi için, diğerinin ise daha fazla ortam sesi ve köpek havlaması, siren veya oyun oynayan çocuklar gibi ses efektleri üretmek için bir “model ailesi” oluşturduğunu ve bunların hepsinin “ortak benlik üzerine inşa edildiğini” belirtti. Denetlenen model Audiobox SSL.”

Kendi kendini denetleyen öğrenme (SSL), verilerin zaten etiketlenmiş olabileceği denetimli öğrenmenin aksine, yapay zekâ algoritmalarının etiketlenmemiş veriler için kendi etiketlerini oluşturmak üzere atandığı bir makine öğrenimi (ML) derin öğrenme tekniğidir.

Reklam yükleniyor...

Sizin için uygun reklam bulunamadı!

Araştırmacılar, SSL yaklaşımını benimsemek için bazı yöntemlerini ve gerekçelerini açıklayan bilimsel bir makale yayınladılar: “Etiketlenmiş veriler her zaman mevcut veya yüksek kalitede olmadığından ve veri ölçeklendirmesi genellemenin anahtarı olduğundan, stratejimiz bu temel modeli eğitmektir.” Daha büyük miktarlarda bulunabilen transkriptler, altyazılar veya özellik etiketleri gibi seslerin herhangi bir denetim olmadan kullanılması.”

Uygulama şimdilik ABD’de sınırlı şekilde kullanılmak üzere tanıtıldı. İlerleyen zamanlarda çeşitli ülkelerin hukuki çerçevelerine göre kullanıma sunulması bekleniyor.

Reklam yükleniyor...

Sizin için uygun reklam bulunamadı!

Kaynak: Venturebeat

Fotoğraf: computerworld

Reklam yükleniyor...

Sizin için uygun reklam bulunamadı!

Reklam yükleniyor...

Sizin için uygun reklam bulunamadı!

Son gelişmelerden ilk siz haberdar olmak için bizi takip edin.

Reklam yükleniyor...

Sizin için uygun reklam bulunamadı!