Eseguire il reverse engineering di un router domestico utilizzando Binwalk. Ti fidi del software del tuo router?

Eseguire il reverse engineering di un router domestico utilizzando Binwalk. Ti fidi del software del tuo router?

Qualche giorno fa ho deciso di decodificare il firmware del mio router utilizzando binwalk.

Mi sono comprato Router domestico TP-Link Archer C7. Non è il miglior router, ma abbastanza per le mie esigenze.

Ogni volta che compro un nuovo router, lo installo OpenWRT. Per quello? Di norma, i produttori non si preoccupano molto del supporto dei propri router e col tempo il software diventa obsoleto, compaiono vulnerabilità e così via, in generale, hai un'idea. Pertanto preferisco il firmware OpenWRT, che è ben supportato dalla comunità open source.

Avendo scaricato OpenWRT, anch'io scaricato l'ultima immagine del firmware sotto il mio nuovo Archer C7 dal sito ufficiale e ho deciso di analizzarlo. Puramente per divertimento e per parlare di binwalk.

Cos'è Binwalk?

Binwalk è uno strumento open source per l'analisi, il reverse engineering e l'estrazione delle immagini del firmware.

Creato nel 2010 da Craig Heffner, binwalk può scansionare immagini del firmware e trovare file, identificare ed estrarre immagini di file system, codice eseguibile, archivi compressi, bootloader e kernel, formati di file come JPEG e PDF e molto altro.

Puoi utilizzare binwalk per decodificare il firmware per capire come funziona. Cerca vulnerabilità nei file binari, estrai file e cerca backdoor o certificati digitali. Puoi anche trovare opcodes per un sacco di CPU diverse.

Puoi estrarre le immagini del filesystem per cercare file di password specifici (passwd, shadow, ecc.) e provare a violare gli hash delle password. È possibile eseguire l'analisi binaria tra due o più file. È possibile eseguire l'analisi entropica sui dati per cercare dati compressi o chiavi di crittografia codificate. Tutto questo senza la necessità di accedere al codice sorgente.

In generale, tutto ciò di cui hai bisogno è lì :)

Come funziona Binwalk?

La caratteristica principale di binwalk è la scansione della firma. Binwalk può scansionare l'immagine del firmware per cercare vari tipi di file e file system integrati.

Conosci l'utilità della riga di comando file?

file /bin/bash
/bin/bash: ELF 64-bit LSB shared object, x86-64, version 1 (SYSV), dynamically linked, interpreter /lib64/l, for GNU/Linux 3.2.0, BuildID[sha1]=12f73d7a8e226c663034529c8dd20efec22dde54, stripped

Squadra fileguarda l'intestazione del file e cerca una firma (numero magico) per determinare il tipo di file. Ad esempio, se il file inizia con la sequenza di byte 0x89 0x50 0x4E 0x47 0x0D 0x0A 0x1A 0x0A, sa che è un file PNG. SU Wikipedia C'è un elenco di firme di file comuni.

Binwalk funziona allo stesso modo. Ma invece di cercare le firme solo all'inizio del file, binwalk scansionerà l'intero file. Inoltre, binwalk può estrarre i file trovati nell'immagine.

Strumenti file и binwalk utilizzare la biblioteca libmagic per identificare le firme dei file. Ma binwalk supporta inoltre un elenco di firme magiche personalizzate per cercare file compressi/zippati, intestazioni firmware, kernel Linux, bootloader, file system e così via.

Divertiamoci un po'?

Installazione della passerella

Binwalk è supportato su più piattaforme tra cui Linux, OSX, FreeBSD e Windows.

Per installare l'ultima versione di binwalk puoi farlo scaricare il codice sorgente e seguire Istruzioni per l'installazione o guida veloce, disponibile sul sito web del progetto.

Binwalk ha molti parametri diversi:

$ binwalk

Binwalk v2.2.0
Craig Heffner, ReFirmLabs
https://github.com/ReFirmLabs/binwalk

Usage: binwalk [OPTIONS] [FILE1] [FILE2] [FILE3] ...

Signature Scan Options:
    -B, --signature              Scan target file(s) for common file signatures
    -R, --raw=<str>              Scan target file(s) for the specified sequence of bytes
    -A, --opcodes                Scan target file(s) for common executable opcode signatures
    -m, --magic=<file>           Specify a custom magic file to use
    -b, --dumb                   Disable smart signature keywords
    -I, --invalid                Show results marked as invalid
    -x, --exclude=<str>          Exclude results that match <str>
    -y, --include=<str>          Only show results that match <str>

Extraction Options:
    -e, --extract                Automatically extract known file types
    -D, --dd=<type:ext:cmd>      Extract <type> signatures, give the files an extension of <ext>, and execute <cmd>
    -M, --matryoshka             Recursively scan extracted files
    -d, --depth=<int>            Limit matryoshka recursion depth (default: 8 levels deep)
    -C, --directory=<str>        Extract files/folders to a custom directory (default: current working directory)
    -j, --size=<int>             Limit the size of each extracted file
    -n, --count=<int>            Limit the number of extracted files
    -r, --rm                     Delete carved files after extraction
    -z, --carve                  Carve data from files, but don't execute extraction utilities
    -V, --subdirs                Extract into sub-directories named by the offset

Entropy Options:
    -E, --entropy                Calculate file entropy
    -F, --fast                   Use faster, but less detailed, entropy analysis
    -J, --save                   Save plot as a PNG
    -Q, --nlegend                Omit the legend from the entropy plot graph
    -N, --nplot                  Do not generate an entropy plot graph
    -H, --high=<float>           Set the rising edge entropy trigger threshold (default: 0.95)
    -L, --low=<float>            Set the falling edge entropy trigger threshold (default: 0.85)

Binary Diffing Options:
    -W, --hexdump                Perform a hexdump / diff of a file or files
    -G, --green                  Only show lines containing bytes that are the same among all files
    -i, --red                    Only show lines containing bytes that are different among all files
    -U, --blue                   Only show lines containing bytes that are different among some files
    -u, --similar                Only display lines that are the same between all files
    -w, --terse                  Diff all files, but only display a hex dump of the first file

Raw Compression Options:
    -X, --deflate                Scan for raw deflate compression streams
    -Z, --lzma                   Scan for raw LZMA compression streams
    -P, --partial                Perform a superficial, but faster, scan
    -S, --stop                   Stop after the first result

General Options:
    -l, --length=<int>           Number of bytes to scan
    -o, --offset=<int>           Start scan at this file offset
    -O, --base=<int>             Add a base address to all printed offsets
    -K, --block=<int>            Set file block size
    -g, --swap=<int>             Reverse every n bytes before scanning
    -f, --log=<file>             Log results to file
    -c, --csv                    Log results to file in CSV format
    -t, --term                   Format output to fit the terminal window
    -q, --quiet                  Suppress output to stdout
    -v, --verbose                Enable verbose output
    -h, --help                   Show help output
    -a, --finclude=<str>         Only scan files whose names match this regex
    -p, --fexclude=<str>         Do not scan files whose names match this regex
    -s, --status=<int>           Enable the status server on the specified port

Scansione di immagini

Iniziamo cercando le firme dei file all'interno dell'immagine (immagine dal sito TP-Link).

Eseguendo binwalk con il parametro --signature:

$ binwalk --signature --term archer-c7.bin

DECIMAL       HEXADECIMAL     DESCRIPTION
------------------------------------------------------------------------------------------
21876         0x5574          U-Boot version string, "U-Boot 1.1.4-g4480d5f9-dirty (May
                              20 2019 - 18:45:16)"
21940         0x55B4          CRC32 polynomial table, big endian
23232         0x5AC0          uImage header, header size: 64 bytes, header CRC:
                              0x386C2BD5, created: 2019-05-20 10:45:17, image size:
                              41162 bytes, Data Address: 0x80010000, Entry Point:
                              0x80010000, data CRC: 0xC9CD1E38, OS: Linux, CPU: MIPS,
                              image type: Firmware Image, compression type: lzma, image
                              name: "u-boot image"
23296         0x5B00          LZMA compressed data, properties: 0x5D, dictionary size:
                              8388608 bytes, uncompressed size: 97476 bytes
64968         0xFDC8          XML document, version: "1.0"
78448         0x13270         uImage header, header size: 64 bytes, header CRC:
                              0x78A267FF, created: 2019-07-26 07:46:14, image size:
                              1088500 bytes, Data Address: 0x80060000, Entry Point:
                              0x80060000, data CRC: 0xBB9D4F94, OS: Linux, CPU: MIPS,
                              image type: Multi-File Image, compression type: lzma,
                              image name: "MIPS OpenWrt Linux-3.3.8"
78520         0x132B8         LZMA compressed data, properties: 0x6D, dictionary size:
                              8388608 bytes, uncompressed size: 3164228 bytes
1167013       0x11CEA5        Squashfs filesystem, little endian, version 4.0,
                              compression:xz, size: 14388306 bytes, 2541 inodes,
                              blocksize: 65536 bytes, created: 2019-07-26 07:51:38
15555328      0xED5B00        gzip compressed data, from Unix, last modified: 2019-07-26
                              07:51:41

Ora abbiamo molte informazioni su questa immagine.

Usi dell'immagine Sottomarino come bootloader (intestazione dell'immagine su 0x5AC0 e un'immagine compressa del bootloader su 0x5B00). In base all'intestazione uImage su 0x13270, sappiamo che l'architettura del processore è MIPS e il kernel Linux è la versione 3.3.8. E in base all'immagine trovata all'indirizzo 0x11CEA5, possiamo vederlo rootfs è un file system squashfs.

Estraiamo ora il bootloader (U-Boot) tramite il comando dd:

$ dd if=archer-c7.bin of=u-boot.bin.lzma bs=1 skip=23296 count=41162
41162+0 records in
41162+0 records out
41162 bytes (41 kB, 40 KiB) copied, 0,0939608 s, 438 kB/s

Poiché l'immagine è compressa utilizzando LZMA, dobbiamo decomprimerla:

$ unlzma u-boot.bin.lzma

Ora abbiamo un'immagine U-Boot:

$ ls -l u-boot.bin
-rw-rw-r-- 1 sprado sprado 97476 Fev  5 08:48 u-boot.bin

Che ne dici di trovare il valore predefinito per bootargs?

$ strings u-boot.bin | grep bootargs
bootargs
bootargs=console=ttyS0,115200 board=AP152 rootfstype=squashfs init=/etc/preinit mtdparts=spi0.0:128k(factory-uboot),192k(u-boot),64k(ART),1536k(uImage),14464k@0x1e0000(rootfs) mem=128M

Variabile di ambiente U-Boot bootargs utilizzato per passare parametri al kernel Linux. E da quanto sopra abbiamo una migliore comprensione della memoria flash del dispositivo.

Che ne dici di estrarre l'immagine del kernel Linux?

$ dd if=archer-c7.bin of=uImage bs=1 skip=78448 count=1088572
1088572+0 records in
1088572+0 records out
1088572 bytes (1,1 MB, 1,0 MiB) copied, 1,68628 s, 646 kB/s

Possiamo verificare che l'immagine sia stata estratta correttamente utilizzando il comando file:

$ file uImage
uImage: u-boot legacy uImage, MIPS OpenWrt Linux-3.3.8, Linux/MIPS, Multi-File Image (lzma), 1088500 bytes, Fri Jul 26 07:46:14 2019, Load Address: 0x80060000, Entry Point: 0x80060000, Header CRC: 0x78A267FF, Data CRC: 0xBB9D4F94

Il formato file uImage è fondamentalmente un'immagine del kernel Linux con un'intestazione aggiuntiva. Rimuoviamo questa intestazione per ottenere l'immagine finale del kernel Linux:

$ dd if=uImage of=Image.lzma bs=1 skip=72
1088500+0 records in
1088500+0 records out
1088500 bytes (1,1 MB, 1,0 MiB) copied, 1,65603 s, 657 kB/s

L'immagine è compressa, quindi decomprimiamola:

$ unlzma Image.lzma

Ora abbiamo un'immagine del kernel Linux:

$ ls -la Image
-rw-rw-r-- 1 sprado sprado 3164228 Fev  5 10:51 Image

Cosa possiamo fare con l'immagine del kernel? Potremmo, ad esempio, fare una ricerca di stringhe nell'immagine e trovare la versione del kernel Linux e conoscere l'ambiente utilizzato per costruire il kernel:

$ strings Image | grep "Linux version"
Linux version 3.3.8 (leo@leo-MS-7529) (gcc version 4.6.3 20120201 (prerelease) (Linaro GCC 4.6-2012.02) ) #1 Mon May 20 18:53:02 CST 2019

Anche se il firmware è stato rilasciato l'anno scorso (2019), mentre scrivo questo articolo utilizza una vecchia versione del kernel Linux (3.3.8) rilasciata nel 2012, compilata con una versione molto vecchia di GCC (4.6) anch'essa del 2012 !
(trad. ca. ti fidi ancora dei tuoi router in ufficio e a casa?)

Con opzione --opcodes possiamo anche usare binwalk per cercare istruzioni macchina e determinare l'architettura del processore dell'immagine:

$ binwalk --opcodes Image
DECIMAL       HEXADECIMAL     DESCRIPTION
--------------------------------------------------------------------------------
2400          0x960           MIPS instructions, function epilogue
2572          0xA0C           MIPS instructions, function epilogue
2828          0xB0C           MIPS instructions, function epilogue

E il file system root? Invece di estrarre l'immagine manualmente, utilizziamo l'opzione binwalk --extract:

$ binwalk --extract --quiet archer-c7.bin

Il filesystem root completo verrà estratto in una sottodirectory:

$ cd _archer-c7.bin.extracted/squashfs-root/

$ ls
bin  dev  etc  lib  mnt  overlay  proc  rom  root  sbin  sys  tmp  usr  var  www

$ cat etc/banner
     MM           NM                    MMMMMMM          M       M
   $MMMMM        MMMMM                MMMMMMMMMMM      MMM     MMM
  MMMMMMMM     MM MMMMM.              MMMMM:MMMMMM:   MMMM   MMMMM
MMMM= MMMMMM  MMM   MMMM       MMMMM   MMMM  MMMMMM   MMMM  MMMMM'
MMMM=  MMMMM MMMM    MM       MMMMM    MMMM    MMMM   MMMMNMMMMM
MMMM=   MMMM  MMMMM          MMMMM     MMMM    MMMM   MMMMMMMM
MMMM=   MMMM   MMMMMM       MMMMM      MMMM    MMMM   MMMMMMMMM
MMMM=   MMMM     MMMMM,    NMMMMMMMM   MMMM    MMMM   MMMMMMMMMMM
MMMM=   MMMM      MMMMMM   MMMMMMMM    MMMM    MMMM   MMMM  MMMMMM
MMMM=   MMMM   MM    MMMM    MMMM      MMMM    MMMM   MMMM    MMMM
MMMM$ ,MMMMM  MMMMM  MMMM    MMM       MMMM   MMMMM   MMMM    MMMM
  MMMMMMM:      MMMMMMM     M         MMMMMMMMMMMM  MMMMMMM MMMMMMM
    MMMMMM       MMMMN     M           MMMMMMMMM      MMMM    MMMM
     MMMM          M                    MMMMMMM        M       M
       M
 ---------------------------------------------------------------
   For those about to rock... (%C, %R)
 ---------------------------------------------------------------

Ora possiamo fare molte cose diverse.

Possiamo cercare file di configurazione, hash delle password, chiavi crittografiche e certificati digitali. Possiamo analizzare file binari per Risoluzione dei problemi e vulnerabilità.

Con whoa и chroot possiamo anche eseguire (emulare) un eseguibile dall'immagine:

$ ls
bin  dev  etc  lib  mnt  overlay  proc  rom  root  sbin  sys  tmp  usr  var  www

$ cp /usr/bin/qemu-mips-static .

$ sudo chroot . ./qemu-mips-static bin/busybox
BusyBox v1.19.4 (2019-05-20 18:13:49 CST) multi-call binary.
Copyright (C) 1998-2011 Erik Andersen, Rob Landley, Denys Vlasenko
and others. Licensed under GPLv2.
See source distribution for full notice.

Usage: busybox [function] [arguments]...
   or: busybox --list[-full]
   or: function [arguments]...

    BusyBox is a multi-call binary that combines many common Unix
    utilities into a single executable.  Most people will create a
    link to busybox for each function they wish to use and BusyBox
    will act like whatever it was invoked as.

Currently defined functions:
    [, [[, addgroup, adduser, arping, ash, awk, basename, cat, chgrp, chmod, chown, chroot, clear, cmp, cp, crond, crontab, cut, date, dd, delgroup, deluser, dirname, dmesg, echo, egrep, env, expr, false,
    fgrep, find, free, fsync, grep, gunzip, gzip, halt, head, hexdump, hostid, id, ifconfig, init, insmod, kill, killall, klogd, ln, lock, logger, ls, lsmod, mac_addr, md5sum, mkdir, mkfifo, mknod, mktemp,
    mount, mv, nice, passwd, pgrep, pidof, ping, ping6, pivot_root, poweroff, printf, ps, pwd, readlink, reboot, reset, rm, rmdir, rmmod, route, sed, seq, sh, sleep, sort, start-stop-daemon, strings,
    switch_root, sync, sysctl, tail, tar, tee, telnet, test, tftp, time, top, touch, tr, traceroute, true, udhcpc, umount, uname, uniq, uptime, vconfig, vi, watchdog, wc, wget, which, xargs, yes, zcat

Grande! Ma tieni presente che la versione di BusyBox è 1.19.4. Questa è una versione molto vecchia di BusyBox, pubblicato nell'aprile 2012.

Quindi TP-Link rilascia un'immagine firmware nel 2019 utilizzando software (toolchain GCC, kernel, BusyBox, ecc.) del 2012!

Ora capisci perché installo sempre OpenWRT sui miei router?

Non è tutto

Binwalk può anche eseguire analisi entropiche, stampare dati entropici grezzi e generare grafici entropici. In genere, si osserva una maggiore entropia quando i byte nell'immagine sono casuali. Ciò potrebbe significare che l'immagine contiene un file crittografato, compresso o offuscato. Chiave di crittografia avanzata? Perché no.

Eseguire il reverse engineering di un router domestico utilizzando Binwalk. Ti fidi del software del tuo router?

Possiamo anche usare il parametro --raw per trovare una sequenza di byte grezzi personalizzata in un'immagine o in un parametro --hexdump per eseguire un dump esadecimale confrontando due o più file di input.

Firme personalizzate può essere aggiunto a binwalk tramite un file di firma personalizzato specificato sulla riga di comando utilizzando il parametro --magico aggiungendoli alla directory $ HOME / .config / binwalk / magic.

Puoi trovare ulteriori informazioni su Binwalk su documentazione ufficiale.

estensione del marciapiede

Ci API binwalk, implementato come modulo Python che può essere utilizzato da qualsiasi script Python per eseguire a livello di codice una scansione binwalk, e l'utilità della riga di comando binwalk può essere quasi completamente duplicata con solo due righe di codice Python!

import binwalk
binwalk.scan()

Usando l'API Python puoi anche creare Plugin Python per configurare ed espandere binwalk.

Vi è anche un Plug-in IDA e versione cloud Binwalk Pro.

Allora perché non scarichi l'immagine del firmware da Internet e provi Binwalk? Ti prometto che ti divertirai moltissimo :)

Fonte: habr.com

Aggiungi un commento