Οι περισσότεροι έχουμε ακούσει τις φωνές ψηφιακών βοηθών όπως η Siri ή η Alexa – με το επίπεδο, μηχανικό τους ύφος που τις κάνει εύκολα αναγνωρίσιμες ως «τεχνητές». Ωστόσο οι επιστήμονες τώρα υποστηρίζουν ότι ο μέσος ακροατής δεν μπορεί πλέον να διακρίνει τη διαφορά μεταξύ πραγματικών ανθρώπων και φωνών deepfake, που δημιουργήθηκαν από τεχνητή νοημοσύνη.
Οι ερευνητές διαπίστωσαν ότι ενώ οι ΑΙ φωνές που δημιουργούνται από το μηδέν δεν θεωρήθηκαν ρεαλιστικές, οι φωνές-κλώνοι που βασίστηκαν πάνω στις φωνές αληθινών ανθρώπων – τεχνολογία που αποκαλείται deepfake audio – θεωρήθηκαν εξίσου αληθοφανείς με τις αυθεντικές, αναφέρει το LiveScience.
Εύκολο, γρήγορο και με τεράστιες συνέπειες
Οι συνέπειες είναι τεράστιες για την ηθική, τα πνευματικά δικαιώματα και την ασφάλεια. Εάν οι εγκληματίες χρησιμοποιήσουν την τεχνητή νοημοσύνη για να κλωνοποιήσουν τη φωνή μας, θα είναι πολύ πιο εύκολο να παρακάμψουν τα πρωτόκολλα φωνητικής πιστοποίησης στην τράπεζα ή να εξαπατήσουν τους αγαπημένους μας και να τους αποσπάσουν χρήματα.
Οι ρεαλιστικές φωνές τεχνητής νοημοσύνης μπορούν επίσης να χρησιμοποιηθούν για την «κατασκευή» δηλώσεων και συνεντεύξεων πολιτικών ή διασημοτήτων. Τα ψεύτικα ηχητικά αρχεία μπορούν να χρησιμοποιηθούν για να δυσφημίσουν άτομα ή να υποκινήσουν κοινωνικές αναταραχές.
Το ανησυχητικό είναι ότι οι κλώνοι φωνής που χρησιμοποίησαν στη μελέτη δεν ήταν ιδιαίτερα εξελιγμένοι. Οι ερευνητές τους δημιούργησαν με εμπορικά διαθέσιμο λογισμικό και τους εκπαίδευσαν με μόλις τέσσερα λεπτά ηχογραφήσεων ανθρώπινης ομιλίας. «Η διαδικασία απαιτούσε ελάχιστη εξειδίκευση, μόνο λίγα λεπτά ηχογραφήσεων φωνής και σχεδόν καθόλου χρήματα», δήλωσε η Lavan. «Αυτό δείχνει πόσο προσιτή και εξελιγμένη έχει γίνει η τεχνολογία ΑΙ φωνής».
Πηγή: cnn.gr



