ChatGPT isimli yapay zeka sohbet botunu geliştiren ABD merkezli OpenAI şirketi, bir kişinin sesinden yazılı bir metne dayanarak ‘doğal bir konuşma’ yaratmak için 15 saniyelik bir ses dosyasının yeterli olduğu bir teknoloji geliştirdi. OpenAI’ın ‘Voice Engine’ (Ses Motoru) isimli teknolojisi, ilk olarak 2022 yılının sonlarında geliştirilmişti. Yapılan son geliştirmelerle, üretilen sesler ‘daha da insana benzer’ bir hale getirildi.
Euronews haber sitesinin aktardığına göre, OpenAI, bu teknolojisinin olası kötüye kullanımı konusunda ‘ihtiyatla’ söz konusu ‘Ses Motoru’nu kamuoyunun kullanımına açmayacaklarını bildirdi. Teknoloji halihazırda sadece onu ilk test eden kişilere açık.
‘ÖZELLİKLE SEÇİM SENESİNDE CİDDİ RİSKLERİ OLDUĞUNUN FARKINDAYIZ’
OpenAI şirketinden yapılan açıklamada, kasım ayında yapılacak ABD Başkanlık Seçimlerine atıfla, “İnsanların seslerine benzeyen konuşma üretmenin, özellikle seçim senesinde akıllarda olan ciddi riskleri olduğunun farkındayız” ifadeleri kullanıldı.
Ses klonlayan yapay zeka teknolojisi yeni bir durum değil. Ocak ayında Demokrat Parti bünyesinde yapılacak bir ön seçim öncesinde, binlerce kullanıcıya, mevcut Başkan ve Demokrat Parti’nin ön seçim sürecini ilk sırada tamamlayan aday adayı Joe Biden’ı taklit eden sahte video mesajlar göndermiş, mesajlarda kullanıcılardan evlerinde kalmaları ve oy vermemeleri istenmişti. Ardından, geçen ay, ABD Federal İletişim Komisyonu (FCC) yapay zeka ile oluşturulmuş ‘otomatik çağrıları’ (robocall) yasaklamıştı.
KONUŞMA BOZUKLUĞU YAŞAYANLARA YARDIMCI OLABİLİR
Yapay zeka ile üretilen sahte sesli mesaj ve benzeri içeriklerin yalnızca siyaset alanında değil, dolandırıcılık gibi başka alanlarda ve suç teşkil eden amaçlarla kullanılmasından da endişe ediliyor. Öte yandan, bu teknolojinin ani ya da dejeneretif konuşma bozukluklarından mustarip olan kişilere yardım edebileceği de öngörülüyor.
Bu teknolojinin konuşamayan ya da konuşmakta güçlük çeken kişilere ‘kulağa robot gibi gelmeyen bir ses verebileceğini’ savunan OpenAI’ın ‘Ses Motoru’ halihazırda aralarında Age of Learning, HeyGen ve Lifespan gibi şirketlerin olduğu bir dizi OpenAI partnerinin kullanımına açık. OpenAI’a göre, bu partnerler kişinin ya da kurumun rızası olmadan başka bir kişiyi ‘taklit etmeme’ konusundaki şirket politikasını kabul etmiş durumda.
OpenAI’ın açıklamasına göre, diğer iki güvenlik önlemi ise ‘Ses Motoru’ tarafından üretilen herhangi bir ses dosyasını izlemek için bir çeşit damgalama ya da filigran kullanılması ve partnerlerin ‘orijinal konuşmacının açık ve bilgilendirilmiş rızasını’ alması.
(DIŞ HABERLER SERVİSİ)