Spätné inžinierstvo domáceho smerovača pomocou binwalk. Dôverujete softvéru svojho smerovača?

Spätné inžinierstvo domáceho smerovača pomocou binwalk. Dôverujete softvéru svojho smerovača?

Pred pár dňami som sa rozhodol spätne analyzovať firmvér môjho smerovača pomocou binwalk.

Kúpil som si sám seba Domáci router TP-Link Archer C7. Nie je to najlepší router, ale pre moje potreby úplne postačuje.

Vždy, keď si kúpim nový router, nainštalujem OpenWRT. Prečo? Výrobcovia sa spravidla nestarajú o podporu svojich smerovačov a časom sa softvér stáva zastaraným, objavujú sa zraniteľnosti atď., Vo všeobecnosti máte predstavu. Preto uprednostňujem firmvér OpenWRT, ktorý je dobre podporovaný open-source komunitou.

Po stiahnutí OpenWRT aj ja stiahol najnovší obraz firmvéru pod mojím novým Archerom C7 z oficiálnej stránky a rozhodol som sa to analyzovať. Čisto pre zábavu a rozhovory o binwalku.

čo je binwalk?

Binwalk je open source nástroj na analýzu, reverzné inžinierstvo a extrakciu obrazu firmvéru.

binwalk, ktorý v roku 2010 vytvoril Craig Heffner, dokáže skenovať obrázky firmvéru a nájsť súbory, identifikovať a extrahovať obrázky súborových systémov, spustiteľný kód, komprimované archívy, zavádzače a jadrá, formáty súborov ako JPEG a PDF a oveľa viac.

Môžete použiť binwalk na spätnú analýzu firmvéru, aby ste pochopili, ako funguje. Vyhľadávajte v binárnych súboroch chyby zabezpečenia, extrahujte súbory a hľadajte zadné vrátka alebo digitálne certifikáty. Môžete tiež nájsť opcodes pre množstvo rôznych CPU.

Môžete extrahovať obrazy súborového systému, aby ste vyhľadali konkrétne súbory hesiel (passwd, shadow atď.) a pokúsili sa prelomiť hash hesiel. Môžete vykonať binárnu analýzu medzi dvoma alebo viacerými súbormi. Môžete vykonať analýzu entropie údajov a vyhľadať komprimované údaje alebo kódované šifrovacie kľúče. To všetko bez nutnosti prístupu k zdrojovému kódu.

Vo všeobecnosti je tam všetko, čo potrebujete :)

Ako funguje binwalk?

Hlavnou črtou binwalku je skenovanie podpisov. Binwalk dokáže naskenovať obraz firmvéru a vyhľadať rôzne vstavané typy súborov a súborové systémy.

Poznáte nástroj príkazového riadku file?

file /bin/bash
/bin/bash: ELF 64-bit LSB shared object, x86-64, version 1 (SYSV), dynamically linked, interpreter /lib64/l, for GNU/Linux 3.2.0, BuildID[sha1]=12f73d7a8e226c663034529c8dd20efec22dde54, stripped

Tím filepozrie sa na hlavičku súboru a hľadá podpis (magické číslo), aby určil typ súboru. Napríklad, ak súbor začína sekvenciou bajtov 0x89 0x50 0x4E 0x47 0x0D 0x0A 0x1A 0x0A, vie, že ide o súbor PNG. Zapnuté Wikipedia Existuje zoznam bežných podpisov súborov.

Binwalk funguje rovnako. Ale namiesto hľadania podpisov iba na začiatku súboru, binwalk naskenuje celý súbor. Okrem toho môže binwalk extrahovať súbory nájdené v obrázku.

Nástroje file и binwalk používať knižnicu libmagic na identifikáciu podpisov súborov. ale binwalk navyše podporuje zoznam vlastných magických podpisov na vyhľadávanie komprimovaných/zazipovaných súborov, hlavičiek firmvéru, linuxových jadier, zavádzačov, súborových systémov atď.

Poďme sa zabaviť?

Inštalácia Binwalk

Binwalk je podporovaný na viacerých platformách vrátane Linuxu, OSX, FreeBSD a Windows.

Ak chcete nainštalovať najnovšiu verziu binwalk, môžete stiahnuť zdrojový kód a nasledovať pokyny na inštaláciu alebo stručný návod, dostupný na webovej stránke projektu.

Binwalk má mnoho rôznych parametrov:

$ binwalk

Binwalk v2.2.0
Craig Heffner, ReFirmLabs
https://github.com/ReFirmLabs/binwalk

Usage: binwalk [OPTIONS] [FILE1] [FILE2] [FILE3] ...

Signature Scan Options:
    -B, --signature              Scan target file(s) for common file signatures
    -R, --raw=<str>              Scan target file(s) for the specified sequence of bytes
    -A, --opcodes                Scan target file(s) for common executable opcode signatures
    -m, --magic=<file>           Specify a custom magic file to use
    -b, --dumb                   Disable smart signature keywords
    -I, --invalid                Show results marked as invalid
    -x, --exclude=<str>          Exclude results that match <str>
    -y, --include=<str>          Only show results that match <str>

Extraction Options:
    -e, --extract                Automatically extract known file types
    -D, --dd=<type:ext:cmd>      Extract <type> signatures, give the files an extension of <ext>, and execute <cmd>
    -M, --matryoshka             Recursively scan extracted files
    -d, --depth=<int>            Limit matryoshka recursion depth (default: 8 levels deep)
    -C, --directory=<str>        Extract files/folders to a custom directory (default: current working directory)
    -j, --size=<int>             Limit the size of each extracted file
    -n, --count=<int>            Limit the number of extracted files
    -r, --rm                     Delete carved files after extraction
    -z, --carve                  Carve data from files, but don't execute extraction utilities
    -V, --subdirs                Extract into sub-directories named by the offset

Entropy Options:
    -E, --entropy                Calculate file entropy
    -F, --fast                   Use faster, but less detailed, entropy analysis
    -J, --save                   Save plot as a PNG
    -Q, --nlegend                Omit the legend from the entropy plot graph
    -N, --nplot                  Do not generate an entropy plot graph
    -H, --high=<float>           Set the rising edge entropy trigger threshold (default: 0.95)
    -L, --low=<float>            Set the falling edge entropy trigger threshold (default: 0.85)

Binary Diffing Options:
    -W, --hexdump                Perform a hexdump / diff of a file or files
    -G, --green                  Only show lines containing bytes that are the same among all files
    -i, --red                    Only show lines containing bytes that are different among all files
    -U, --blue                   Only show lines containing bytes that are different among some files
    -u, --similar                Only display lines that are the same between all files
    -w, --terse                  Diff all files, but only display a hex dump of the first file

Raw Compression Options:
    -X, --deflate                Scan for raw deflate compression streams
    -Z, --lzma                   Scan for raw LZMA compression streams
    -P, --partial                Perform a superficial, but faster, scan
    -S, --stop                   Stop after the first result

General Options:
    -l, --length=<int>           Number of bytes to scan
    -o, --offset=<int>           Start scan at this file offset
    -O, --base=<int>             Add a base address to all printed offsets
    -K, --block=<int>            Set file block size
    -g, --swap=<int>             Reverse every n bytes before scanning
    -f, --log=<file>             Log results to file
    -c, --csv                    Log results to file in CSV format
    -t, --term                   Format output to fit the terminal window
    -q, --quiet                  Suppress output to stdout
    -v, --verbose                Enable verbose output
    -h, --help                   Show help output
    -a, --finclude=<str>         Only scan files whose names match this regex
    -p, --fexclude=<str>         Do not scan files whose names match this regex
    -s, --status=<int>           Enable the status server on the specified port

Skenovanie obrázkov

Začnime hľadaním podpisov súborov vo vnútri obrázka (obrázok z webu TP-Link).

Spustenie binwalku s parametrom --signature:

$ binwalk --signature --term archer-c7.bin

DECIMAL       HEXADECIMAL     DESCRIPTION
------------------------------------------------------------------------------------------
21876         0x5574          U-Boot version string, "U-Boot 1.1.4-g4480d5f9-dirty (May
                              20 2019 - 18:45:16)"
21940         0x55B4          CRC32 polynomial table, big endian
23232         0x5AC0          uImage header, header size: 64 bytes, header CRC:
                              0x386C2BD5, created: 2019-05-20 10:45:17, image size:
                              41162 bytes, Data Address: 0x80010000, Entry Point:
                              0x80010000, data CRC: 0xC9CD1E38, OS: Linux, CPU: MIPS,
                              image type: Firmware Image, compression type: lzma, image
                              name: "u-boot image"
23296         0x5B00          LZMA compressed data, properties: 0x5D, dictionary size:
                              8388608 bytes, uncompressed size: 97476 bytes
64968         0xFDC8          XML document, version: "1.0"
78448         0x13270         uImage header, header size: 64 bytes, header CRC:
                              0x78A267FF, created: 2019-07-26 07:46:14, image size:
                              1088500 bytes, Data Address: 0x80060000, Entry Point:
                              0x80060000, data CRC: 0xBB9D4F94, OS: Linux, CPU: MIPS,
                              image type: Multi-File Image, compression type: lzma,
                              image name: "MIPS OpenWrt Linux-3.3.8"
78520         0x132B8         LZMA compressed data, properties: 0x6D, dictionary size:
                              8388608 bytes, uncompressed size: 3164228 bytes
1167013       0x11CEA5        Squashfs filesystem, little endian, version 4.0,
                              compression:xz, size: 14388306 bytes, 2541 inodes,
                              blocksize: 65536 bytes, created: 2019-07-26 07:51:38
15555328      0xED5B00        gzip compressed data, from Unix, last modified: 2019-07-26
                              07:51:41

Teraz máme veľa informácií o tomto obrázku.

Použitie obrázka podmorský ako bootloader (hlavička obrázka at 0x5AC0 a komprimovaný obraz zavádzača na adrese 0x5B00). Na základe hlavičky uImage na 0x13270 vieme, že architektúra procesora je MIPS a jadro Linuxu je verzie 3.3.8. A to na základe obrázku, ktorý nájdete na adrese 0x11CEA5, to môžeme vidieť rootfs je súborový systém squashfs.

Poďme teraz extrahovať bootloader (U-Boot) pomocou príkazu dd:

$ dd if=archer-c7.bin of=u-boot.bin.lzma bs=1 skip=23296 count=41162
41162+0 records in
41162+0 records out
41162 bytes (41 kB, 40 KiB) copied, 0,0939608 s, 438 kB/s

Keďže obrázok je komprimovaný pomocou LZMA, musíme ho dekomprimovať:

$ unlzma u-boot.bin.lzma

Teraz máme obrázok U-Boot:

$ ls -l u-boot.bin
-rw-rw-r-- 1 sprado sprado 97476 Fev  5 08:48 u-boot.bin

Čo tak nájsť predvolenú hodnotu pre bootargs?

$ strings u-boot.bin | grep bootargs
bootargs
bootargs=console=ttyS0,115200 board=AP152 rootfstype=squashfs init=/etc/preinit mtdparts=spi0.0:128k(factory-uboot),192k(u-boot),64k(ART),1536k(uImage),14464k@0x1e0000(rootfs) mem=128M

Premenné prostredia U-Boot bootargs používa sa na odovzdávanie parametrov do jadra Linuxu. A z vyššie uvedeného máme lepšie pochopenie flash pamäte zariadenia.

Čo tak extrahovať obraz jadra Linuxu?

$ dd if=archer-c7.bin of=uImage bs=1 skip=78448 count=1088572
1088572+0 records in
1088572+0 records out
1088572 bytes (1,1 MB, 1,0 MiB) copied, 1,68628 s, 646 kB/s

Pomocou príkazu môžeme skontrolovať, či bol obrázok úspešne extrahovaný file:

$ file uImage
uImage: u-boot legacy uImage, MIPS OpenWrt Linux-3.3.8, Linux/MIPS, Multi-File Image (lzma), 1088500 bytes, Fri Jul 26 07:46:14 2019, Load Address: 0x80060000, Entry Point: 0x80060000, Header CRC: 0x78A267FF, Data CRC: 0xBB9D4F94

Formát súboru uImage je v podstate obraz jadra Linuxu s dodatočnou hlavičkou. Odstránime túto hlavičku, aby sme získali konečný obraz jadra Linuxu:

$ dd if=uImage of=Image.lzma bs=1 skip=72
1088500+0 records in
1088500+0 records out
1088500 bytes (1,1 MB, 1,0 MiB) copied, 1,65603 s, 657 kB/s

Obrázok je komprimovaný, takže ho rozbaľme:

$ unlzma Image.lzma

Teraz máme obraz linuxového jadra:

$ ls -la Image
-rw-rw-r-- 1 sprado sprado 3164228 Fev  5 10:51 Image

Čo môžeme urobiť s obrazom jadra? Mohli by sme napríklad vyhľadať reťazec v obrázku a nájsť verziu linuxového jadra a dozvedieť sa o prostredí použitom na zostavenie jadra:

$ strings Image | grep "Linux version"
Linux version 3.3.8 (leo@leo-MS-7529) (gcc version 4.6.3 20120201 (prerelease) (Linaro GCC 4.6-2012.02) ) #1 Mon May 20 18:53:02 CST 2019

Aj keď bol firmvér vydaný minulý rok (2019), pri písaní tohto článku používa starú verziu linuxového jadra (3.3.8) vydanú v roku 2012, skompilovanú s veľmi starou verziou GCC (4.6) tiež od roku 2012 !
(cca preklad, veríte ešte svojim routerom v kancelárii a doma?)

S možnosťou --opcodes môžeme tiež použiť binwalk na vyhľadanie strojových inštrukcií a určenie procesorovej architektúry obrazu:

$ binwalk --opcodes Image
DECIMAL       HEXADECIMAL     DESCRIPTION
--------------------------------------------------------------------------------
2400          0x960           MIPS instructions, function epilogue
2572          0xA0C           MIPS instructions, function epilogue
2828          0xB0C           MIPS instructions, function epilogue

A čo koreňový súborový systém? Namiesto manuálneho extrahovania obrázka použite možnosť binwalk --extract:

$ binwalk --extract --quiet archer-c7.bin

Kompletný koreňový súborový systém bude extrahovaný do podadresára:

$ cd _archer-c7.bin.extracted/squashfs-root/

$ ls
bin  dev  etc  lib  mnt  overlay  proc  rom  root  sbin  sys  tmp  usr  var  www

$ cat etc/banner
     MM           NM                    MMMMMMM          M       M
   $MMMMM        MMMMM                MMMMMMMMMMM      MMM     MMM
  MMMMMMMM     MM MMMMM.              MMMMM:MMMMMM:   MMMM   MMMMM
MMMM= MMMMMM  MMM   MMMM       MMMMM   MMMM  MMMMMM   MMMM  MMMMM'
MMMM=  MMMMM MMMM    MM       MMMMM    MMMM    MMMM   MMMMNMMMMM
MMMM=   MMMM  MMMMM          MMMMM     MMMM    MMMM   MMMMMMMM
MMMM=   MMMM   MMMMMM       MMMMM      MMMM    MMMM   MMMMMMMMM
MMMM=   MMMM     MMMMM,    NMMMMMMMM   MMMM    MMMM   MMMMMMMMMMM
MMMM=   MMMM      MMMMMM   MMMMMMMM    MMMM    MMMM   MMMM  MMMMMM
MMMM=   MMMM   MM    MMMM    MMMM      MMMM    MMMM   MMMM    MMMM
MMMM$ ,MMMMM  MMMMM  MMMM    MMM       MMMM   MMMMM   MMMM    MMMM
  MMMMMMM:      MMMMMMM     M         MMMMMMMMMMMM  MMMMMMM MMMMMMM
    MMMMMM       MMMMN     M           MMMMMMMMM      MMMM    MMMM
     MMMM          M                    MMMMMMM        M       M
       M
 ---------------------------------------------------------------
   For those about to rock... (%C, %R)
 ---------------------------------------------------------------

Teraz môžeme robiť veľa rôznych vecí.

Môžeme vyhľadávať konfiguračné súbory, hash hesiel, kryptografické kľúče a digitálne certifikáty. Môžeme analyzovať binárne súbory pre riešenie problémov a zraniteľnosti.

S ktovie и chroot môžeme dokonca spustiť (emulovať) spustiteľný súbor z obrázka:

$ ls
bin  dev  etc  lib  mnt  overlay  proc  rom  root  sbin  sys  tmp  usr  var  www

$ cp /usr/bin/qemu-mips-static .

$ sudo chroot . ./qemu-mips-static bin/busybox
BusyBox v1.19.4 (2019-05-20 18:13:49 CST) multi-call binary.
Copyright (C) 1998-2011 Erik Andersen, Rob Landley, Denys Vlasenko
and others. Licensed under GPLv2.
See source distribution for full notice.

Usage: busybox [function] [arguments]...
   or: busybox --list[-full]
   or: function [arguments]...

    BusyBox is a multi-call binary that combines many common Unix
    utilities into a single executable.  Most people will create a
    link to busybox for each function they wish to use and BusyBox
    will act like whatever it was invoked as.

Currently defined functions:
    [, [[, addgroup, adduser, arping, ash, awk, basename, cat, chgrp, chmod, chown, chroot, clear, cmp, cp, crond, crontab, cut, date, dd, delgroup, deluser, dirname, dmesg, echo, egrep, env, expr, false,
    fgrep, find, free, fsync, grep, gunzip, gzip, halt, head, hexdump, hostid, id, ifconfig, init, insmod, kill, killall, klogd, ln, lock, logger, ls, lsmod, mac_addr, md5sum, mkdir, mkfifo, mknod, mktemp,
    mount, mv, nice, passwd, pgrep, pidof, ping, ping6, pivot_root, poweroff, printf, ps, pwd, readlink, reboot, reset, rm, rmdir, rmmod, route, sed, seq, sh, sleep, sort, start-stop-daemon, strings,
    switch_root, sync, sysctl, tail, tar, tee, telnet, test, tftp, time, top, touch, tr, traceroute, true, udhcpc, umount, uname, uniq, uptime, vconfig, vi, watchdog, wc, wget, which, xargs, yes, zcat

Skvelé! Upozorňujeme však, že verzia BusyBox je 1.19.4. Toto je veľmi stará verzia BusyBoxu, vydaný v apríli 2012.

TP-Link teda vydáva obraz firmvéru v roku 2019 pomocou softvéru (GCC toolchain, kernel, BusyBox atď.) z roku 2012!

Teraz už chápete, prečo vždy inštalujem OpenWRT na svoje smerovače?

To nie je všetko

Binwalk môže tiež vykonávať analýzu entropie, tlačiť nespracované údaje o entropii a vytvárať grafy entropie. Väčšia entropia sa zvyčajne pozoruje, keď sú bajty v obraze náhodné. Môže to znamenať, že obrázok obsahuje zašifrovaný, komprimovaný alebo zahmlený súbor. Hardcore šifrovací kľúč? Prečo nie.

Spätné inžinierstvo domáceho smerovača pomocou binwalk. Dôverujete softvéru svojho smerovača?

Môžeme použiť aj parameter --raw nájsť vlastnú nespracovanú sekvenciu bajtov v obrázku alebo parametri --hexdump vykonať hexadecimálny výpis porovnávajúci dva alebo viac vstupných súborov.

Vlastné podpisy môže byť pridaný do binwalk buď prostredníctvom súboru vlastného podpisu zadaného v príkazovom riadku pomocou parametra --magicalebo ich pridaním do adresára $ HOME / .config / binwalk / magic.

Viac informácií o binwalk nájdete na oficiálna dokumentácia.

rozšírenie binwalk

Tam API binwalk, implementovaný ako modul Python, ktorý môže byť použitý akýmkoľvek skriptom Python na programové vykonanie skenovania binwalk, a nástroj príkazového riadka binwalk môže byť takmer úplne duplikovaný iba pomocou dvoch riadkov kódu Python!

import binwalk
binwalk.scan()

Pomocou Python API môžete tiež vytvoriť Python pluginy konfigurovať a rozširovať binwalk.

Tiež existuje Doplnok IDA a cloudovej verzii Binwalk Pro.

Prečo si teda nestiahnete obrázok firmvéru z internetu a nevyskúšate binwalk? Sľubujem, že si užijete veľa zábavy :)

Zdroj: hab.com

Pridať komentár