Technik zur Ermittlung eines PIN-Codes aus einer Videoaufzeichnung einer mit der Hand verdeckten Eingabe an einem Geldautomaten

Ein Forscherteam der Universität Padua (Italien) und der Universität Delft (Niederlande) hat eine Methode veröffentlicht, mit der mithilfe von maschinellem Lernen ein eingegebener PIN-Code aus einer Videoaufzeichnung des mit der Hand bedeckten Eingabebereichs eines Geldautomaten rekonstruiert werden kann . Bei der Eingabe eines 4-stelligen PIN-Codes wird die Wahrscheinlichkeit, den richtigen Code vorherzusagen, auf 41 % geschätzt, wobei die Möglichkeit von drei Versuchen vor der Sperrung berücksichtigt wird. Bei 5-stelligen PIN-Codes lag die Vorhersagewahrscheinlichkeit bei 30 %. Es wurde ein separates Experiment durchgeführt, bei dem 78 Freiwillige versuchten, den PIN-Code aus ähnlich aufgezeichneten Videos vorherzusagen. In diesem Fall betrug die Wahrscheinlichkeit einer erfolgreichen Vorhersage nach drei Versuchen 7.92 %.

Wenn Sie das digitale Panel eines Geldautomaten mit der Handfläche abdecken, bleibt der Teil der Hand, mit dem die Eingabe erfolgt, unbedeckt, was ausreicht, um Klicks vorherzusagen, indem Sie die Position der Hand ändern und die nicht vollständig bedeckten Finger verschieben. Bei der Analyse der Eingabe jeder Ziffer eliminiert das System Tasten, die nicht gedrückt werden können, unter Berücksichtigung der Position der abdeckenden Hand und berechnet außerdem die wahrscheinlichsten Optionen zum Drücken basierend auf der Position der drückenden Hand relativ zur Position der Tasten . Um die Wahrscheinlichkeit der Eingabeerkennung zu erhöhen, kann zusätzlich der Ton von Tastenanschlägen aufgezeichnet werden, der bei jeder Taste leicht unterschiedlich ist.

Technik zur Ermittlung eines PIN-Codes aus einer Videoaufzeichnung einer mit der Hand verdeckten Eingabe an einem Geldautomaten

Das Experiment verwendete ein maschinelles Lernsystem, das auf der Verwendung eines Faltungs-Neuronalen Netzwerks (CNN) und eines wiederkehrenden Neuronalen Netzwerks basierend auf der LSTM-Architektur (Long Short Term Memory) basiert. Das CNN-Netzwerk war für die Extraktion räumlicher Daten für jeden Frame verantwortlich, und das LSTM-Netzwerk nutzte diese Daten, um zeitlich variierende Muster zu extrahieren. Das Modell wurde anhand von Videos von 58 verschiedenen Personen trainiert, die PIN-Codes mit von den Teilnehmern ausgewählten Eingabemethoden eingegeben haben (jeder Teilnehmer gab 100 verschiedene Codes ein, d. h. 5800 Eingabebeispiele wurden für das Training verwendet). Während der Schulung stellte sich heraus, dass die meisten Benutzer eine von drei Hauptmethoden zur Abdeckung von Eingaben verwenden.

Technik zur Ermittlung eines PIN-Codes aus einer Videoaufzeichnung einer mit der Hand verdeckten Eingabe an einem Geldautomaten

Zum Trainieren des Machine-Learning-Modells wurde ein Server auf Basis eines Xeon E5-2670-Prozessors mit 128 GB RAM und drei Tesla K20m-Karten mit jeweils 5 GB Speicher verwendet. Der Softwareteil ist in Python unter Verwendung der Keras-Bibliothek und der Tensorflow-Plattform geschrieben. Da ATM-Eingabepanels unterschiedlich sind und das Vorhersageergebnis von Merkmalen wie Schlüsselgröße und Topologie abhängt, ist für jeden Paneltyp ein separates Training erforderlich.

Technik zur Ermittlung eines PIN-Codes aus einer Videoaufzeichnung einer mit der Hand verdeckten Eingabe an einem Geldautomaten

Als Maßnahmen zum Schutz vor der vorgeschlagenen Angriffsmethode wird empfohlen, wenn möglich, PIN-Codes mit 5 statt 4 Ziffern zu verwenden und außerdem zu versuchen, so viel Eingaberaum wie möglich mit der Hand abzudecken (die Methode bleibt wirksam, wenn ca. 75 % der Eingabefläche werden mit der Hand abgedeckt). Geldautomatenherstellern wird empfohlen, spezielle Schutzschirme zu verwenden, die die Eingabe verbergen, sowie keine mechanischen, sondern Touch-Eingabefelder, deren Position sich die Zahlen zufällig ändern.

Source: opennet.ru

Kommentar hinzufügen