Bezva hlasové ověřování pro zábavu a zisk

LAS VEGAS – Vycvičili jste svůj chytrý reproduktor, aby reagoval na vás a ne na vašeho idiota? Když se přihlásíte na web své banky, ověříte se vyslovením přístupové fráze?



Hlasová autentizace vypadá jako skvělá technologie, ale ukázalo se, že ji můžete prolomit pomocí strojového učení a nástrojů s otevřeným zdrojovým kódem, podle Johna Seymoura, vedoucího datového vědce Salesforce, a Azeema Aqila, softwarového inženýra Salesforce, kteří svá zjištění prezentovali zde na Černý klobouk.

Rozpoznávání hlasu nebo hlasové ověřování?

„Se strojovým učením se hlasová autentizace stává všudypřítomnou,“ řekl Azil. „Můžete otevřít telefon vyslovením speciální věty. Ani Google, ani Apple však toto ověření neoznačují. A pomocí hlasu můžete otevřít pouze podmnožinu funkcí. Domníváme se, že věděli, že nazývat to autentizací by byl boj.“





Black Hat Bug ArtCílem dua bylo 'prolomit hlasovou autentizaci s minimálním úsilím,' řekl Aqil. „Prolomením myslíme získání přístupu předstíráním identity. Minimálním úsilím máme na mysli, že by to nemělo vyžadovat tuny výpočetní techniky – představte si spíše desktop než serverovou farmu. Mělo by to skončit v rozumném čase. A to by mělo vyžadovat minimální nebo žádné odborné znalosti v oblasti datové vědy.“

Crossbody pouzdro na iphone 12 mini

Seymour ukázal klip z filmu Tenisky (můj osobní favorit). Hackeři předstírali cestu kolem rozpoznání hlasu tím, že přiměli cíl, aby vyslovoval jednotlivá slova na pásce.



'V praxi je to těžké,' poznamenal Seymour. „Lidé, které chcete, jsou zaneprázdnění generální ředitelé, politici a další, kteří si s vámi nemusí sednout. Naštěstí existuje převod textu na řeč. Nezajímá nás kvalita zvuku našeho zvuku. Mohlo by to znít jako smetí, pokud to rozpoznávací software akceptuje.“

Všechny vaše hlasy patří nám

Obecná moudrost říká, že k vytvoření skutečně kvalitního převodu hlasu člověka na řeč potřebujete 24 hodin řeči, která je označena tak, aby přesně naznačovala, co se říká. To nesplňuje cíl hacku, který skončí v rozumném čase.

jak rozmrazit notebook lenovo

'Chtěli jsme udělat důkaz konceptu tohoto nápadu,' řekl Seymour. „Použili jsme web LyreBird, který založili průkopníci v převodu textu na řeč a strojovém učení. Vytvoříte si účet, řeknete 30 předdefinovaných vět a dáte mu text, aby se vám ozval. Zabere to jen pár minut.“

Když webová stránka namluvila požadovanou frázi, hlasový software společnosti Microsoft to přijal.

Specifikace lenovo C40-05

Samozřejmě jste nemohli přimět cíl svého hlasového hacku, aby pronesl těch 30 vět. Aqil a Seymour místo toho seškrábali zvuk z videí YouTube nejmenovaného cíle. Pracně vyčistili zvuk, odstranili šum a slova jako 'hm'. A přepsali to ručně. Poté výsledek vložili do open-source nástroje Tacotron. 'Nepotřebujete rozumět Tacotronu, abyste ho mohli používat,' poznamenal Aqil.

Doporučeno našimi redaktory

Australský ptákLyrebird dokáže poslouchat a kopírovat jakýkoli hlas během jedné minuty Skutečný důvod, proč jsou hlasové asistentky ženy (a proč na tom záleží)

Výsledek nestačil k vytvoření věrohodného falešného hlasu, a tak rozšířili data zvýšením a snížením výšky, čímž efektivně vytvořili 30krát více vstupů. Pro kontrolu zdravého rozumu vyzkoušeli nahrávky s upravenou výškou tónu na Siri a zjistili, že akceptuje rozsah zhruba mezi 10 procenty pomalejší a 20 procent rychlejší. I s touto augmentací dostali odpadky. Prostě nebylo dost dat.

Ukazuje se, že existují dvě obrovské open-source datové sady pro použití v převodu textu na řeč, Blizzard a LJ Speech. Když dvojice nejprve vyzkoušela trénink na jednom z těchto modelů a poté přešla na vlastní data, dostali jackpot. 'Je to jako když trénovat model s Blizzardem učí model mluvit,' řekl Seymour, 'a trénink s našimi daty ho trénuje, aby mluvil jako cíl.' Trénink modelu trval den nebo dva, ale výsledek testem konzistentně prošel a naboural se do testovacího účtu pomocí převodu textu na řeč.

Nespoléhejte na hlasové ověřování

'Rozpoznání mluvčího s neznámými slovy je těžké,' řekl Aqil, 'ale heslo nemusí být tajné. I když to není předdefinované, vyslovíte to nahlas. Je to jako dát své heslo. Hlasové ověřování byste měli považovat pouze za slabý signál navíc vícefaktorové ověřování. Rozpoznání mluvčího není totéž jako autentizace mluvčího.'

'Autentizace reproduktoru může být narušena, pokud útočník může získat data řeči a zná správnou výzvu,' řekl Seymour. „Rozšiřování dat a učení přenosu zpřístupňují proces v rozumném čase. Falšování hlasu někoho jiného bude snazší. Poté, co jsme odeslali tento dokument, jsme se dozvěděli, že společnost Google předložila dokument o učení s přenosem. Nejde jen o nás!“

Doporučená