A legfontosabb elvitelek
- A kutatók kidolgoztak egy módszert a beszélgetések összezavarására, hogy megakadályozzák a beszélgetéseink rögzítését a szélhámos mikrofonokat.
- A módszer jelentős, mivel valós időben működik streaming hangon és minimális képzéssel.
- A szakértők üdvözlik a kutatást, de úgy gondolják, hogy az átlagos okostelefon-felhasználó számára nem sok haszna van.
Mikrofonos okoseszközök vesznek körül minket, de mi van akkor, ha feltörték őket, hogy lehallgathassanak minket?
A beszélgetéseink megóvása érdekében a Columbia Egyetem kutatói kifejlesztettek egy Neural Voice Camouflage módszert, amely valós időben megzavarja az automatikus beszédfelismerő rendszereket anélkül, hogy az embereket kényelmetlenné tenné.
"Az [intelligens hangvezérlésű eszközök] behatolásával az életünkbe, a magánélet gondolata kezd elpárologni, mivel ezek a lehallgató eszközök mindig be vannak kapcsolva, és figyelik, hogy mit mondanak." Charles Everette, a kibernevezési érdekképviselet igazgatója Deep Instinct mondta a Lifewire-nek e-mailben. "Ez a kutatás közvetlen válasz arra az igényre, hogy az egyén hangját és beszélgetéseit el kell rejteni vagy el kell rejteni ezektől az elektronikus lehallgatóktól, amelyek egy adott területen ismertek vagy ismeretlenek."
Túlbeszélés
A kutatók egy olyan rendszert fejlesztettek ki, amely suttogó, halk hangokat generál, amelyeket bármely helyiségben lejátszhat, hogy megakadályozza, hogy a szélhámos mikrofonok kémkedjenek a beszélgetései után.
Az, ahogy ez a fajta technológia kiküszöböli a lehallgatást, Everette-et a zajszűrős fejhallgatókra emlékezteti. Ahelyett, hogy suttogó csendes hangokat generálnának a háttérzaj kioltására, a kutatók olyan háttérhangokat sugároznak, amelyek megzavarják a hanghullámokat érthető hanggá értelmező mesterséges intelligencia (AI) algoritmusokat.
Az emberek hangjának álcázására szolgáló ilyen mechanizmusok nem egyediek, de a Neural Voice Camouflage-t az különbözteti meg a többi módszertől, hogy valós időben működik a streaming hangon.
"Az élő beszéddel való működéshez megközelítésünknek meg kell jósolnia [a helyes kódolású hangot] a jövőbe, hogy valós időben lehessen játszani" - jegyzik meg a kutatók közleményükben. Jelenleg ez a módszer az angol nyelv többségénél működik.
Hans Hansen, a Brand3D vezérigazgatója a Lifewire-nek elmondta, hogy a kutatás nagyon jelentős, mivel a mai mesterséges intelligencia-rendszerek egyik fő gyenge pontját támadja meg.
E-mailben Hansen kifejtette, hogy a jelenlegi mély tanulási mesterséges intelligencia rendszerek általában és különösen a természetes beszédfelismerés működnek a több ezer beszélőtől gyűjtött beszédadat-rekordok millióinak feldolgozása után. Ezzel szemben a Neural Voice Camouflage működik, miután mindössze két másodperces beszédre kondicionálja magát.
Személy szerint, ha aggódom amiatt, hogy az eszközök hallgatnak, nem az lenne a megoldás, ha hozzáadnék egy másik háttérzajt generáló lehallgató eszközt.
Rossz fa?
Brian Chappell, a BeyondTrust vezető biztonsági stratégája úgy véli, hogy a kutatás előnyösebb azoknak az üzleti felhasználóknak, akik attól tartanak, hogy olyan kompromittált eszközök közepette lehetnek, amelyek olyan kulcsszavakra figyelnek, amelyek arra utalnak, hogy értékes információk hangzanak el.
"Ahol ez a technológia potenciálisan érdekesebb lenne, az egy tekintélyelvűbb felügyeleti állapotban van, ahol mesterséges intelligencia video- és hangnyomtatás-elemzést alkalmaznak a polgárok ellen" - mondta James Maude, a BeyondTrust vezető kiberbiztonsági kutatója a Lifewire-nek e-mailben.
Maude azt javasolta, hogy jobb alternatíva lenne az adatvédelmi szabályozás bevezetése arra vonatkozóan, hogy ezek az eszközök hogyan rögzítik, tárolják és használják fel az adatokat. Ezenkívül Chappell úgy véli, hogy a kutató módszerének hasznossága korlátozott, mivel nem arra készült, hogy megakadályozza az emberi lehallgatást.
"Otthon, ne feledje, hogy legalább elméletileg egy ilyen eszköz használata azt eredményezi, hogy a Siri, az Alexa, a Google Home és minden más rendszer, amelyet kimondott indítószóval aktiválnak, figyelmen kívül hagyja Önt" - mondta. Chappell.
A szakértők azonban úgy vélik, hogy az AI/ML-specifikus technológiának az okoseszközeinkbe való növekvő beépítésével teljesen lehetséges, hogy ez a technológia a közeljövőben a telefonjainkba kerül.
Maude aggódik, mivel az AI-technológiák gyorsan megtanulják megkülönböztetni a zajt a valódi hangtól. Úgy gondolja, hogy bár a rendszer kezdetben sikeres lehet, gyorsan macska-egér játékká változhat, ahogy a lehallgató eszköz megtanulja kiszűrni a zavaró zajokat.
Aggasztóbb, hogy Maude rámutatott, hogy bárki, aki ezt használja, valójában felhívhatja magára a figyelmet, mivel a hangfelismerés megzavarása szokatlannak tűnik, és azt jelezheti, hogy valamit el akar rejteni.
"Személy szerint, ha aggódom amiatt, hogy az eszközök hallgatnak, akkor nem az lenne a megoldás, ha hozzáadnék egy másik lehallgató eszközt, amely háttérzajt generál" - osztotta meg Maude. "Különösen azért, mert ez csak növeli annak a kockázatát, hogy egy eszközt vagy alkalmazást feltörnek, és képes lesz hallgatni rám."