Dikkat sesiniz kopyalanabilir!

Lyrebird adlı bir şirket tarafından geliştirilen ve herkes için açılacak olan teknoloji, sadece 1 dakikalık sesten bir kişinin sesinin kopyalanmasını sağlayabiliyor.

Dikkat sesiniz kopyalanabilir!
Dikkat sesiniz kopyalanabilir!
Geliştiriciler için konuşma sentez Teknolojileri geliştirmekte olan Montreal merkezli Lyrebird'ün yen, servisi, sadece 1 dakikalık sesten herhangi birinin sesini kopyalayabiliyor.

LYREBİRD'ÜN TEKNOLOJİSİ TARTIŞMA YARATACAK!

1 dakikalık ses kaydı sonrasında kişinin ses DNA'sını eşsiz bir anahtar halinde sıkıştıran API, bu anahtarı kullanarak ilgili sesten herhangi bir konuşma oluşturulabilmesini sağlıyor. Şirket, konuşmacının oluşturacağı ses için kullanacağı kelimeleri söyletmesine veya farklı tonlamalar yapmaya ihtiyaç duymayacağını ifade ediyor. Oluşturulan seste kızgınlık, sempati, stres gibi duyguların kontrol edilmesi olanağı da sunuluyor.

Adobe geçtiğimiz Kasım ayında Project VoCo adıyla benzer bir teknolojiye dair tanıtım yapmıştı. Öte yandan bu proje 20 dakikalık sese ve konuşma sentezi için sistem kaynaklarına ihtiyaç duyuyor. Lyrebird API'si ise bulut tabanlı olmasıyla da fark yaratıyor. Şirketin GPU kümesi, 1000 cümleyi yarım saniyeden daha az sürede oluşturabiliyor.

Lyrebird tarafından geliştirilen servis haliyle tartışmaları da beraberinde getirecek cinsten ve şirket de bunun farkında. Öte yandan şirket bu teknolojiyi herkese açarak, insanların bu tarz teknolojilerin varlığından haberdar olacağını ve buna göre her ses kaydına inanmayacağı görüşünde. Yani istenilen bu durumu, insanların her fotoğrafın gerçek olduğuna inanmayıp "Photoshop'tur!" demesine benzetebiliriz. Öte yandan tabii ki yine de teknolojinin birçok riski mevcut.