Kulcs elvitelek
- Egyre több program képes megérteni a beszédet.
- Az új technológia egyéni hangzajt generál a háttérben, miközben Ön beszél, hogy összezavarja a hallgatni képes szoftvert.
-
Az új technika valós idejű teljesítményt ér el a jel vagy szó jövője elleni támadás előrejelzésével.
Sok program képes megérteni az Ön beszédét telefon- vagy videohívások közben, és a szakértők szerint veszélyeztethetik a magánéletet.
A Columbia Egyetem kutatói által kifejlesztett új technológia, az úgynevezett Neural Voice Camouflage védelmet nyújthat. Beszéd közben egyéni hangzajt generál a háttérben, megzavarva a mesterséges intelligenciát (AI), amely meghallgatja és átírja a hangokat.
"A mesterséges intelligencia átírásának jelenléte bizalmi kérdéseket vet fel" Michael Huth, a Xayn, a magánélet védelmét szolgáló keresőmotor társalapítója és a londoni Imperial College számítástechnikai tanszékének vezetője, aki nem vett részt a kutatás, mondta a Lifewire egy e-mailes interjúban. "A találkozó résztvevői körültekintőbbek lehetnek azzal kapcsolatban, hogy mely pontokat vetik fel, és hogyan írják le beszédüket. Ez jó dolog lehet, mert javíthatja a tiszteletteljes viselkedést, de lehet rossz is, mivel a beszélgetés kevésbé nyitott fenntartások az alkalmazott technológiával kapcsolatban."
Hallgatni és tanulni
A Columbia kutatói egy olyan algoritmus tervezésén dolgoztak, amely valós időben képes feltörni a neurális hálózatokat. Az új megközelítés "prediktív támadásokat" használ – egy olyan jelzést, amely megzavarhat minden olyan szót, amelyet az automatikus beszédfelismerő modellek átírnak. Ezen túlmenően, amikor támadási hangokat szól altatnak meg az éterben, azoknak elég hangosaknak kell lenniük ahhoz, hogy megzavarjanak minden olyan rosszindulatú „behallgató” mikrofont, amely esetleg távol van.
"Ennek eléréséhez az volt a kulcsfontosságú technikai kihívás, hogy mindezt kellően gyorsan működjön" - mondta Carl Vondrick, a Columbia informatika professzora, az új megközelítést leíró tanulmány egyik szerzője. kiadás. "A mi algoritmusunk, amely az esetek 80%-ában megakadályozza, hogy egy szélhámos mikrofon helyesen hallja az Ön szavait, a leggyorsabb és a legpontosabb tesztágyunkon."
Az új technika valós idejű teljesítményt ér el a jel vagy szó jövője elleni támadás előrejelzésével. A csapat optimalizálta a támadást, így a normál háttérzajhoz hasonló hangerővel rendelkezik, lehetővé téve a szobában lévő emberek számára a természetes beszélgetést anélkül, hogy az automatikus beszédfelismerő rendszer sikeresen felügyelné őket.
Az értekezlet résztvevői körültekintőbbek lehetnek azzal kapcsolatban, hogy mely szempontokat vetik fel, és hogyan írják le beszédüket.
A tudósok azt mondták, hogy technikájuk akkor is működik, ha nem tud semmit a szélhámos mikrofonról, például annak elhelyezkedéséről, vagy akár a rajta futó számítógépes szoftverről. Az éteren keresztül álcázza az emberek hangját, elrejtve azt ezektől a lehallgatórendszerektől, anélkül, hogy zavarná a szobában lévők közötti beszélgetést.
"Eddig a módszerünk az angol nyelvi szókincs nagy részénél működik, és azt tervezzük, hogy az algoritmust több nyelven alkalmazzuk, és végül teljesen észrevehetetlenné tesszük a suttogást." Mia Chiquier, a vezető szerző a tanulmány egyik tagja és egy PhD-hallgató Vondrick laboratóriumában, mondta a sajtóközleményben.
Beszélgetései privátban tartása
Mint mintha mindez nem lenne elég, a hirdetések az okostelefonodról vagy okosotthoni eszközeidről gyűjtött hangok alapján is megcélozhatják Önt.
"Az olyan eszközökkel, mint az [Amazon Echo] és társaik, ezek az eszközök nemcsak mindig az otthonodban vannak, és folyamatosan hallgatnak mindent, amit mondasz vagy teszel, hanem – az évek óta tartó adatgyűjtés során a felhasználóktól – tökéletesített természetes nyelvi feldolgozás (mikrofonok, szoftverek és mesterséges intelligencia kombinációjával a kimondott szót szöveggé/használható adatokká alakítja az eszközökön)” – mondta Erik Haig, a Harbour Research stratégiai tanácsadó és vállalkozásfejlesztő cég munkatársa egy e-mailben.
A társalgási beszéd mesterséges intelligenciájának átírása ma már a szabványos kereskedelmi szoftverek szabványos részét képezi, mondta Huth. Például a Microsoft Teams rendelkezik értekezlet rögzítési lehetőséggel, beépített mesterséges intelligencia átiratokkal, amelyeket minden résztvevő valós időben láthat. A teljes jegyzőkönyv az ülés jegyzőkönyveként szolgálhat. Általában az ilyen átiratok lehetővé teszik a jegyzőkönyvezést (más néven jegyzetelést), ahol a jegyzőkönyvet a következő ülésen hagyják jóvá.
"Az emberek aggódhatnak amiatt, hogy kémkednek utánuk, amikor a mesterséges intelligencia átírása be van kapcsolva" - tette hozzá Huth."Ez nagyon hasonlít ahhoz az aggodalomhoz, hogy egy beszélgetést beleegyezés nélkül vagy titokban rögzítenek."
De nem mindenki ért egyet azzal, hogy az okoseszközök veszélyt jelentenek. A legtöbb embernek nem kell aggódnia amiatt, hogy a műsorok meghallgatják az Ön beszélgetéseit – mondta el e-mailben a Lifewire-nek Brad Hong, a Horizon3 kiberbiztonsági cég ügyfelei sikerének vezetője. Azt mondta, hogy most nem az a legnagyobb gond, hogy ki rögzíti Önt, hanem az, hogy hogyan tárolják az adatokat.
"Minden olyan történet, amelyet az ember a számítógépén vagy a mobileszközein lévő mikrofon aktiválásáról, az Alexáról vagy a Google Home-ról, vagy akár a kormányzati felügyeletről hall, igaz, hogy ezek mindegyike felkavarja a laikus gyomrát" - tette hozzá Hong.. "De összességében az emberek ritkán kerülnek olyan helyzetbe, amely ténylegesen megköveteli a hangjuk álcázását."