Använda smartphone rörelsesensorer för att lyssna på konversationer

En grupp forskare från fem amerikanska universitet har utvecklat sidokanalattacktekniken EarSpy, som gör det möjligt att avlyssna telefonsamtal genom att analysera information från rörelsesensorer. Metoden bygger på det faktum att moderna smartphones är utrustade med en ganska känslig accelerometer och gyroskop, som också reagerar på vibrationer som induceras av enhetens lågeffekthögtalare, som används vid kommunikation utan högtalartelefon. Med hjälp av maskininlärningsmetoder kunde forskaren delvis återställa talet som hördes på enheten baserat på information som tagits emot från rörelsesensorer och bestämma talarens kön.

Tidigare trodde man att sidokanalattacker med rörelsesensorer endast kunde utföras med kraftfulla högtalare som används för handsfreesamtal, och högtalare som låter när telefonen läggs mot örat leder inte till läckor. Den ökande sensorkänsligheten och användningen av kraftfullare dubbelöronhögtalare i moderna smartphones har dock förändrat situationen. Attacken kan utföras i alla mobilapplikationer för Android-plattformen, eftersom åtkomst till rörelsesensorer ges till applikationer utan särskilda behörigheter (med undantag för Android 13).

Användningen av ett konvolutionellt neuralt nätverk och klassiska maskininlärningsalgoritmer gjorde det möjligt att, när man analyserade spektrogram som genererades baserat på data från accelerometern på OnePlus 7T-smarttelefonen, uppnå en noggrannhet för könsbestämning på 98.66 %, högtalarbestämning på 92.6 %, och talsiffrig bestämning på 56.42 %. På OnePlus 9-smarttelefonen var dessa siffror 88.7 %, 73.6 % respektive 41.6 %. När högtalartelefonen var påslagen ökade taligenkänningens noggrannhet till 80 %. För att registrera data från accelerometern användes en vanlig Physics Toolbox Sensor Suite-mobilapplikation.

Använda smartphone rörelsesensorer för att lyssna på konversationer

För att skydda mot den här typen av attacker har ändringar redan gjorts på Android 13-plattformen som begränsar noggrannheten för data från sensorer som tillhandahålls utan speciella krafter till 200 Hz. Vid sampling vid 200 Hz reduceras attacknoggrannheten till 10 %. Det noteras dessutom att utöver kraften och antalet högtalare, påverkas noggrannheten också i hög grad av högtalarnas närhet till rörelsesensorerna, tätheten hos huset och närvaron av externa störningar från omgivningen.

Källa: opennet.ru

Lägg en kommentar