Reverse Engineering eines Heimrouters mit Binwalk. Vertrauen Sie der Software Ihres Routers?

Reverse Engineering eines Heimrouters mit Binwalk. Vertrauen Sie der Software Ihres Routers?

Vor ein paar Tagen habe ich beschlossen, die Firmware meines Routers mithilfe von Binwalk zurückzuentwickeln.

Ich habe es mir selbst gekauft TP-Link Archer C7 Heimrouter. Nicht der beste Router, aber für meine Bedürfnisse ausreichend.

Jedes Mal, wenn ich einen neuen Router kaufe, installiere ich ihn OpenWRT. Wofür? In der Regel legen Hersteller keinen großen Wert auf die Unterstützung ihrer Router, und mit der Zeit veraltet die Software, es treten Schwachstellen auf und so weiter. Im Allgemeinen verstehen Sie das. Daher bevorzuge ich die gut gepflegte Open-Source-Firmware OpenWRT.

Nachdem ich mir OpenWRT heruntergeladen habe, habe ich auch habe das neueste Firmware-Image heruntergeladen unter meinem neuen Archer C7 von der offiziellen Website und beschloss, es zu analysieren. Rein zum Spaß und um über Binwalk zu reden.

Was ist Binwalk?

Binwalk ist ein Open-Source-Tool zum Analysieren, Reverse Engineering und Extrahieren von Firmware-Images.

Binwalk wurde 2010 von Craig Heffner entwickelt und kann Firmware-Images scannen und Dateien finden, Dateisystem-Images, ausführbaren Code, komprimierte Archive, Bootloader und Kernel, Dateiformate wie JPEG und PDF und vieles mehr identifizieren und extrahieren.

Mit binwalk können Sie die Firmware zurückentwickeln, um zu verstehen, wie sie funktioniert. Suchen Sie nach Schwachstellen in Binärdateien, extrahieren Sie Dateien und suchen Sie nach Hintertüren oder digitalen Zertifikaten. Kann auch gefunden werden opcodes für eine Reihe verschiedener CPUs.

Sie können Dateisystem-Images entpacken, um nach bestimmten Passwortdateien (passwd, Shadow usw.) zu suchen und zu versuchen, Passwort-Hashes zu knacken. Sie können eine binäre Analyse zwischen zwei oder mehr Dateien durchführen. Sie können eine Datenentropieanalyse durchführen, um komprimierte Daten oder codierte Verschlüsselungsschlüssel zu finden. Und das alles, ohne auf den Quellcode zugreifen zu müssen.

Im Allgemeinen ist alles da, was Sie brauchen 🙂

Wie funktioniert Binwalk?

Das Hauptmerkmal von binwalk ist das Scannen von Signaturen. Binwalk kann das Firmware-Image nach verschiedenen integrierten Dateitypen und Dateisystemen durchsuchen.

Kennen Sie das Befehlszeilenprogramm? file?

file /bin/bash
/bin/bash: ELF 64-bit LSB shared object, x86-64, version 1 (SYSV), dynamically linked, interpreter /lib64/l, for GNU/Linux 3.2.0, BuildID[sha1]=12f73d7a8e226c663034529c8dd20efec22dde54, stripped

Team fileschaut sich den Dateikopf an und sucht nach der Signatur (magische Zahl), um den Dateityp zu bestimmen. Wenn die Datei beispielsweise mit der Bytefolge beginnt 0x89 0x50 0x4E 0x47 0x0D 0x0A 0x1A 0x0A, sie weiß, dass es eine PNG-Datei ist. An Wikipedia Es gibt eine Liste gängiger Dateisignaturen.

Binwalk funktioniert auf die gleiche Weise. Aber anstatt nur am Anfang der Datei nach Signaturen zu suchen, scannt binwalk die gesamte Datei. Darüber hinaus kann binwalk im Bild gefundene Dateien extrahieren.

Werkzeuge file и binwalk die Bibliothek nutzen libmagic um Dateisignaturen zu identifizieren. Aber binwalk verwaltet zusätzlich eine Liste benutzerdefinierter magischer Signaturen, um nach komprimierten/komprimierten Dateien, Firmware-Headern, Linux-Kerneln, Bootloadern, Dateisystemen usw. zu suchen.

Lass uns Spaß haben?

Binwalk installieren

Binwalk wird auf mehreren Plattformen unterstützt, darunter Linux, OSX, FreeBSD und Windows.

Um die neueste Version von binwalk zu installieren, können Sie Quellcode herunterladen und folgen Installationsanleitung oder Kurzanleitungverfügbar auf der Projektwebsite.

Binwalk bietet viele verschiedene Optionen:

$ binwalk

Binwalk v2.2.0
Craig Heffner, ReFirmLabs
https://github.com/ReFirmLabs/binwalk

Usage: binwalk [OPTIONS] [FILE1] [FILE2] [FILE3] ...

Signature Scan Options:
    -B, --signature              Scan target file(s) for common file signatures
    -R, --raw=<str>              Scan target file(s) for the specified sequence of bytes
    -A, --opcodes                Scan target file(s) for common executable opcode signatures
    -m, --magic=<file>           Specify a custom magic file to use
    -b, --dumb                   Disable smart signature keywords
    -I, --invalid                Show results marked as invalid
    -x, --exclude=<str>          Exclude results that match <str>
    -y, --include=<str>          Only show results that match <str>

Extraction Options:
    -e, --extract                Automatically extract known file types
    -D, --dd=<type:ext:cmd>      Extract <type> signatures, give the files an extension of <ext>, and execute <cmd>
    -M, --matryoshka             Recursively scan extracted files
    -d, --depth=<int>            Limit matryoshka recursion depth (default: 8 levels deep)
    -C, --directory=<str>        Extract files/folders to a custom directory (default: current working directory)
    -j, --size=<int>             Limit the size of each extracted file
    -n, --count=<int>            Limit the number of extracted files
    -r, --rm                     Delete carved files after extraction
    -z, --carve                  Carve data from files, but don't execute extraction utilities
    -V, --subdirs                Extract into sub-directories named by the offset

Entropy Options:
    -E, --entropy                Calculate file entropy
    -F, --fast                   Use faster, but less detailed, entropy analysis
    -J, --save                   Save plot as a PNG
    -Q, --nlegend                Omit the legend from the entropy plot graph
    -N, --nplot                  Do not generate an entropy plot graph
    -H, --high=<float>           Set the rising edge entropy trigger threshold (default: 0.95)
    -L, --low=<float>            Set the falling edge entropy trigger threshold (default: 0.85)

Binary Diffing Options:
    -W, --hexdump                Perform a hexdump / diff of a file or files
    -G, --green                  Only show lines containing bytes that are the same among all files
    -i, --red                    Only show lines containing bytes that are different among all files
    -U, --blue                   Only show lines containing bytes that are different among some files
    -u, --similar                Only display lines that are the same between all files
    -w, --terse                  Diff all files, but only display a hex dump of the first file

Raw Compression Options:
    -X, --deflate                Scan for raw deflate compression streams
    -Z, --lzma                   Scan for raw LZMA compression streams
    -P, --partial                Perform a superficial, but faster, scan
    -S, --stop                   Stop after the first result

General Options:
    -l, --length=<int>           Number of bytes to scan
    -o, --offset=<int>           Start scan at this file offset
    -O, --base=<int>             Add a base address to all printed offsets
    -K, --block=<int>            Set file block size
    -g, --swap=<int>             Reverse every n bytes before scanning
    -f, --log=<file>             Log results to file
    -c, --csv                    Log results to file in CSV format
    -t, --term                   Format output to fit the terminal window
    -q, --quiet                  Suppress output to stdout
    -v, --verbose                Enable verbose output
    -h, --help                   Show help output
    -a, --finclude=<str>         Only scan files whose names match this regex
    -p, --fexclude=<str>         Do not scan files whose names match this regex
    -s, --status=<int>           Enable the status server on the specified port

Bildscannen

Beginnen wir mit der Suche nach Dateisignaturen im Bild (Bild von der Website). TP-Link).

Binwalk mit der Option --signature ausführen:

$ binwalk --signature --term archer-c7.bin

DECIMAL       HEXADECIMAL     DESCRIPTION
------------------------------------------------------------------------------------------
21876         0x5574          U-Boot version string, "U-Boot 1.1.4-g4480d5f9-dirty (May
                              20 2019 - 18:45:16)"
21940         0x55B4          CRC32 polynomial table, big endian
23232         0x5AC0          uImage header, header size: 64 bytes, header CRC:
                              0x386C2BD5, created: 2019-05-20 10:45:17, image size:
                              41162 bytes, Data Address: 0x80010000, Entry Point:
                              0x80010000, data CRC: 0xC9CD1E38, OS: Linux, CPU: MIPS,
                              image type: Firmware Image, compression type: lzma, image
                              name: "u-boot image"
23296         0x5B00          LZMA compressed data, properties: 0x5D, dictionary size:
                              8388608 bytes, uncompressed size: 97476 bytes
64968         0xFDC8          XML document, version: "1.0"
78448         0x13270         uImage header, header size: 64 bytes, header CRC:
                              0x78A267FF, created: 2019-07-26 07:46:14, image size:
                              1088500 bytes, Data Address: 0x80060000, Entry Point:
                              0x80060000, data CRC: 0xBB9D4F94, OS: Linux, CPU: MIPS,
                              image type: Multi-File Image, compression type: lzma,
                              image name: "MIPS OpenWrt Linux-3.3.8"
78520         0x132B8         LZMA compressed data, properties: 0x6D, dictionary size:
                              8388608 bytes, uncompressed size: 3164228 bytes
1167013       0x11CEA5        Squashfs filesystem, little endian, version 4.0,
                              compression:xz, size: 14388306 bytes, 2541 inodes,
                              blocksize: 65536 bytes, created: 2019-07-26 07:51:38
15555328      0xED5B00        gzip compressed data, from Unix, last modified: 2019-07-26
                              07:51:41

Jetzt haben wir viele Informationen zu diesem Bild.

Bildverwendungen U-Boot als Bootloader (Image-Header unter 0x5AC0 und ein komprimiertes Bootloader-Image unter 0x5B00). Basierend auf dem uImage-Header bei 0x13270 wissen wir, dass die Prozessorarchitektur MIPS ist und der Linux-Kernel Version 3.3.8 ist. Und basierend auf dem Bild, das unter gefunden wurde 0x11CEA5, wir können das sehen rootfs ist ein Dateisystem squashfs.

Lassen Sie uns nun den Bootloader (U-Boot) mit dem Befehl extrahieren dd:

$ dd if=archer-c7.bin of=u-boot.bin.lzma bs=1 skip=23296 count=41162
41162+0 records in
41162+0 records out
41162 bytes (41 kB, 40 KiB) copied, 0,0939608 s, 438 kB/s

Da das Bild mit LZMA komprimiert ist, müssen wir es dekomprimieren:

$ unlzma u-boot.bin.lzma

Wir haben jetzt ein U-Boot-Image:

$ ls -l u-boot.bin
-rw-rw-r-- 1 sprado sprado 97476 Fev  5 08:48 u-boot.bin

Wie wäre es, den Standardwert für zu finden? bootargs?

$ strings u-boot.bin | grep bootargs
bootargs
bootargs=console=ttyS0,115200 board=AP152 rootfstype=squashfs init=/etc/preinit mtdparts=spi0.0:128k(factory-uboot),192k(u-boot),64k(ART),1536k(uImage),14464k@0x1e0000(rootfs) mem=128M

U-Boot-Umgebungsvariable bootargs Wird verwendet, um Parameter an den Linux-Kernel zu übergeben. Und aus dem oben Gesagten haben wir ein besseres Verständnis für den Flash-Speicher des Geräts.

Wie wäre es mit dem Extrahieren eines Linux-Kernel-Images?

$ dd if=archer-c7.bin of=uImage bs=1 skip=78448 count=1088572
1088572+0 records in
1088572+0 records out
1088572 bytes (1,1 MB, 1,0 MiB) copied, 1,68628 s, 646 kB/s

Mit dem Befehl können wir überprüfen, ob das Bild erfolgreich extrahiert wurde file:

$ file uImage
uImage: u-boot legacy uImage, MIPS OpenWrt Linux-3.3.8, Linux/MIPS, Multi-File Image (lzma), 1088500 bytes, Fri Jul 26 07:46:14 2019, Load Address: 0x80060000, Entry Point: 0x80060000, Header CRC: 0x78A267FF, Data CRC: 0xBB9D4F94

Das uImage-Dateiformat ist im Grunde ein Linux-Kernel-Image mit einem zusätzlichen Header. Entfernen wir diesen Header, um das endgültige Linux-Kernel-Image zu erhalten:

$ dd if=uImage of=Image.lzma bs=1 skip=72
1088500+0 records in
1088500+0 records out
1088500 bytes (1,1 MB, 1,0 MiB) copied, 1,65603 s, 657 kB/s

Das Bild ist komprimiert, also entpacken wir es:

$ unlzma Image.lzma

Wir haben jetzt ein Linux-Kernel-Image:

$ ls -la Image
-rw-rw-r-- 1 sprado sprado 3164228 Fev  5 10:51 Image

Was können wir mit dem Kernel-Image machen? Wir könnten zum Beispiel die Zeichenfolgen im Bild durchsuchen und die Version des Linux-Kernels finden und etwas über die Umgebung herausfinden, die zum Erstellen des Kernels verwendet wurde:

$ strings Image | grep "Linux version"
Linux version 3.3.8 (leo@leo-MS-7529) (gcc version 4.6.3 20120201 (prerelease) (Linaro GCC 4.6-2012.02) ) #1 Mon May 20 18:53:02 CST 2019

Obwohl die Firmware letztes Jahr (2019) veröffentlicht wurde, verwendet sie zum Zeitpunkt des Schreibens dieses Artikels eine alte Version des Linux-Kernels (3.3.8), die 2012 veröffentlicht wurde, kompiliert mit einer sehr alten Version von GCC (4.6), ebenfalls seit 2012!
Vertrauen Sie Ihren Routern im Büro und zu Hause noch?

Mit Option --opcodes Wir können binwalk auch verwenden, um Maschinenanweisungen nachzuschlagen und die Prozessorarchitektur des Bildes zu bestimmen:

$ binwalk --opcodes Image
DECIMAL       HEXADECIMAL     DESCRIPTION
--------------------------------------------------------------------------------
2400          0x960           MIPS instructions, function epilogue
2572          0xA0C           MIPS instructions, function epilogue
2828          0xB0C           MIPS instructions, function epilogue

Was ist mit dem Root-Dateisystem? Anstatt das Bild manuell zu extrahieren, verwenden wir die Option binwalk --extract:

$ binwalk --extract --quiet archer-c7.bin

Das komplette Root-Dateisystem wird in ein Unterverzeichnis extrahiert:

$ cd _archer-c7.bin.extracted/squashfs-root/

$ ls
bin  dev  etc  lib  mnt  overlay  proc  rom  root  sbin  sys  tmp  usr  var  www

$ cat etc/banner
     MM           NM                    MMMMMMM          M       M
   $MMMMM        MMMMM                MMMMMMMMMMM      MMM     MMM
  MMMMMMMM     MM MMMMM.              MMMMM:MMMMMM:   MMMM   MMMMM
MMMM= MMMMMM  MMM   MMMM       MMMMM   MMMM  MMMMMM   MMMM  MMMMM'
MMMM=  MMMMM MMMM    MM       MMMMM    MMMM    MMMM   MMMMNMMMMM
MMMM=   MMMM  MMMMM          MMMMM     MMMM    MMMM   MMMMMMMM
MMMM=   MMMM   MMMMMM       MMMMM      MMMM    MMMM   MMMMMMMMM
MMMM=   MMMM     MMMMM,    NMMMMMMMM   MMMM    MMMM   MMMMMMMMMMM
MMMM=   MMMM      MMMMMM   MMMMMMMM    MMMM    MMMM   MMMM  MMMMMM
MMMM=   MMMM   MM    MMMM    MMMM      MMMM    MMMM   MMMM    MMMM
MMMM$ ,MMMMM  MMMMM  MMMM    MMM       MMMM   MMMMM   MMMM    MMMM
  MMMMMMM:      MMMMMMM     M         MMMMMMMMMMMM  MMMMMMM MMMMMMM
    MMMMMM       MMMMN     M           MMMMMMMMM      MMMM    MMMM
     MMMM          M                    MMMMMMM        M       M
       M
 ---------------------------------------------------------------
   For those about to rock... (%C, %R)
 ---------------------------------------------------------------

Jetzt können wir vieles tun.

Wir können nach Konfigurationsdateien, Passwort-Hashes, kryptografischen Schlüsseln und digitalen Zertifikaten suchen. Wir können Binärdateien analysieren nach Fehlern suchen und Schwachstellen.

Mit qemu и Chroot Wir können sogar eine ausführbare Datei von einem Image aus ausführen (emulieren):

$ ls
bin  dev  etc  lib  mnt  overlay  proc  rom  root  sbin  sys  tmp  usr  var  www

$ cp /usr/bin/qemu-mips-static .

$ sudo chroot . ./qemu-mips-static bin/busybox
BusyBox v1.19.4 (2019-05-20 18:13:49 CST) multi-call binary.
Copyright (C) 1998-2011 Erik Andersen, Rob Landley, Denys Vlasenko
and others. Licensed under GPLv2.
See source distribution for full notice.

Usage: busybox [function] [arguments]...
   or: busybox --list[-full]
   or: function [arguments]...

    BusyBox is a multi-call binary that combines many common Unix
    utilities into a single executable.  Most people will create a
    link to busybox for each function they wish to use and BusyBox
    will act like whatever it was invoked as.

Currently defined functions:
    [, [[, addgroup, adduser, arping, ash, awk, basename, cat, chgrp, chmod, chown, chroot, clear, cmp, cp, crond, crontab, cut, date, dd, delgroup, deluser, dirname, dmesg, echo, egrep, env, expr, false,
    fgrep, find, free, fsync, grep, gunzip, gzip, halt, head, hexdump, hostid, id, ifconfig, init, insmod, kill, killall, klogd, ln, lock, logger, ls, lsmod, mac_addr, md5sum, mkdir, mkfifo, mknod, mktemp,
    mount, mv, nice, passwd, pgrep, pidof, ping, ping6, pivot_root, poweroff, printf, ps, pwd, readlink, reboot, reset, rm, rmdir, rmmod, route, sed, seq, sh, sleep, sort, start-stop-daemon, strings,
    switch_root, sync, sysctl, tail, tar, tee, telnet, test, tftp, time, top, touch, tr, traceroute, true, udhcpc, umount, uname, uniq, uptime, vconfig, vi, watchdog, wc, wget, which, xargs, yes, zcat

Großartig! Beachten Sie jedoch, dass die BusyBox-Version 1.19.4 ist. Dies ist eine sehr alte Version von BusyBoxveröffentlicht im April 2012.

Deshalb veröffentlicht TP-Link 2019 ein Firmware-Image unter Verwendung von Software (GCC-Toolchain, Kernel, BusyBox usw.) aus dem Jahr 2012!

Verstehen Sie jetzt, warum ich OpenWRT immer auf meinen Routern installiere?

Das ist nicht alles

Binwalk kann auch Entropieanalysen durchführen, rohe Entropiedaten drucken und Entropiediagramme erstellen. Typischerweise wird mehr Entropie beobachtet, wenn die Bytes im Bild zufällig sind. Dies kann bedeuten, dass das Bild eine verschlüsselte, komprimierte oder verschleierte Datei enthält. Hardcore-Verschlüsselungsschlüssel? Warum nicht.

Reverse Engineering eines Heimrouters mit Binwalk. Vertrauen Sie der Software Ihres Routers?

Wir können den Parameter auch verwenden --raw um nach einer benutzerdefinierten Folge von Rohbytes in einem Bild oder Parameter zu suchen --hexdump um einen Hex-Dump durchzuführen, der zwei oder mehr Eingabedateien vergleicht.

Benutzerdefinierte Signaturen kann entweder über eine benutzerdefinierte Signaturdatei, die in der Befehlszeile mit dem Parameter angegeben wird, zu binwalk hinzugefügt werden --magic, oder indem Sie sie dem Verzeichnis hinzufügen $ HOME / .config / binwalk / magic.

Weitere Informationen zu binwalk finden Sie unter amtliche Dokumentation.

Binwalk-Erweiterung

Es gibt API binwalk ist als Python-Modul implementiert, das von jedem Python-Skript verwendet werden kann, um programmgesteuert einen Binwalk-Scan durchzuführen, und das binwalk-Befehlszeilendienstprogramm kann mit nur zwei Zeilen Python-Code fast vollständig dupliziert werden!

import binwalk
binwalk.scan()

Mit Hilfe der Python-API können Sie auch erstellen Plugins für Python um binwalk anzupassen und zu erweitern.

Es gibt auch eine IDA-Plugin und Cloud-Version Binwalk Pro.

Warum laden Sie also nicht das Firmware-Image aus dem Internet herunter und probieren Binwalk aus? Ich verspreche dir, dass du viel Spaß haben wirst 🙂

Source: habr.com

Kommentar hinzufügen