Zpětné inženýrství domácího routeru s binwalkem. Důvěřujete softwaru svého routeru?

Zpětné inženýrství domácího routeru s binwalkem. Důvěřujete softwaru svého routeru?

Před pár dny jsem se rozhodl provést zpětnou analýzu firmwaru mého routeru pomocí binwalk.

Koupil jsem si sám Domácí router TP-Link Archer C7. Není to nejlepší router, ale pro mé potřeby stačí.

Pokaždé, když si koupím nový router, nainstaluji OpenWRT. Proč? Výrobci se zpravidla o podporu svých routerů moc nestarají a software časem zastarává, objevují se zranitelnosti a tak dále, obecně chápete. Proto preferuji dobře udržovaný open-source firmware OpenWRT.

Po stažení OpenWRT jsem také stáhli nejnovější image firmwaru pod mým novým Archerem C7 z oficiálních stránek a rozhodl jsem se to analyzovat. Čistě pro zábavu a povídání o binwalku.

Co je binwalk?

Binwalk je open source nástroj pro analýzu, reverzní inženýrství a extrahování obrázků firmwaru.

binwalk, vytvořený v roce 2010 Craigem Heffnerem, dokáže skenovat obrázky firmwaru a vyhledávat soubory, identifikovat a extrahovat obrazy systému souborů, spustitelný kód, komprimované archivy, bootloadery a jádra, formáty souborů jako JPEG a PDF a mnoho dalšího.

Pomocí binwalk můžete provést zpětnou analýzu firmwaru, abyste pochopili, jak funguje. Hledejte zranitelnosti v binárních souborech, extrahujte soubory a hledejte zadní vrátka nebo digitální certifikáty. Lze také nalézt opcodes pro spoustu různých CPU.

Obrazy souborového systému můžete rozbalit a vyhledat konkrétní soubory s hesly (passwd, shadow atd.) a pokusit se prolomit hash hesel. Můžete provádět binární analýzu mezi dvěma nebo více soubory. Můžete provést analýzu entropie dat, abyste našli komprimovaná data nebo zakódované šifrovací klíče. To vše bez nutnosti přístupu ke zdrojovému kódu.

Obecně platí, že vše, co potřebujete, je tam 🙂

Jak binwalk funguje?

Hlavním rysem binwalku je skenování podpisu. Binwalk dokáže skenovat obraz firmwaru pro různé vestavěné typy souborů a systémy souborů.

Znáte nástroj příkazového řádku file?

file /bin/bash
/bin/bash: ELF 64-bit LSB shared object, x86-64, version 1 (SYSV), dynamically linked, interpreter /lib64/l, for GNU/Linux 3.2.0, BuildID[sha1]=12f73d7a8e226c663034529c8dd20efec22dde54, stripped

Tým filepodívá se na záhlaví souboru a vyhledá podpis (magické číslo), aby určil typ souboru. Například pokud soubor začíná sekvencí bajtů 0x89 0x50 0x4E 0x47 0x0D 0x0A 0x1A 0x0A, ví, že je to soubor PNG. Na Wikipedia existuje seznam běžných podpisů souborů.

Binwalk funguje stejně. Ale místo hledání podpisů pouze na začátku souboru, binwalk naskenuje celý soubor. Kromě toho může binwalk extrahovat soubory nalezené v obrázku.

Nástroje file и binwalk používat knihovnu libmagic k identifikaci podpisů souborů. Ale binwalk navíc udržuje seznam vlastních magických signatur pro vyhledávání komprimovaných/zazipovaných souborů, hlaviček firmwaru, linuxových jader, bootloaderů, souborových systémů a tak dále.

Pojďme se bavit?

Instalace binwalku

Binwalk je podporován na více platformách včetně Linuxu, OSX, FreeBSD a Windows.

Chcete-li nainstalovat nejnovější verzi binwalk, můžete stáhnout zdrojový kód a následovat instrukce k instalaci nebo rychlý průvodcek dispozici na webových stránkách projektu.

Binwalk má mnoho různých možností:

$ binwalk

Binwalk v2.2.0
Craig Heffner, ReFirmLabs
https://github.com/ReFirmLabs/binwalk

Usage: binwalk [OPTIONS] [FILE1] [FILE2] [FILE3] ...

Signature Scan Options:
    -B, --signature              Scan target file(s) for common file signatures
    -R, --raw=<str>              Scan target file(s) for the specified sequence of bytes
    -A, --opcodes                Scan target file(s) for common executable opcode signatures
    -m, --magic=<file>           Specify a custom magic file to use
    -b, --dumb                   Disable smart signature keywords
    -I, --invalid                Show results marked as invalid
    -x, --exclude=<str>          Exclude results that match <str>
    -y, --include=<str>          Only show results that match <str>

Extraction Options:
    -e, --extract                Automatically extract known file types
    -D, --dd=<type:ext:cmd>      Extract <type> signatures, give the files an extension of <ext>, and execute <cmd>
    -M, --matryoshka             Recursively scan extracted files
    -d, --depth=<int>            Limit matryoshka recursion depth (default: 8 levels deep)
    -C, --directory=<str>        Extract files/folders to a custom directory (default: current working directory)
    -j, --size=<int>             Limit the size of each extracted file
    -n, --count=<int>            Limit the number of extracted files
    -r, --rm                     Delete carved files after extraction
    -z, --carve                  Carve data from files, but don't execute extraction utilities
    -V, --subdirs                Extract into sub-directories named by the offset

Entropy Options:
    -E, --entropy                Calculate file entropy
    -F, --fast                   Use faster, but less detailed, entropy analysis
    -J, --save                   Save plot as a PNG
    -Q, --nlegend                Omit the legend from the entropy plot graph
    -N, --nplot                  Do not generate an entropy plot graph
    -H, --high=<float>           Set the rising edge entropy trigger threshold (default: 0.95)
    -L, --low=<float>            Set the falling edge entropy trigger threshold (default: 0.85)

Binary Diffing Options:
    -W, --hexdump                Perform a hexdump / diff of a file or files
    -G, --green                  Only show lines containing bytes that are the same among all files
    -i, --red                    Only show lines containing bytes that are different among all files
    -U, --blue                   Only show lines containing bytes that are different among some files
    -u, --similar                Only display lines that are the same between all files
    -w, --terse                  Diff all files, but only display a hex dump of the first file

Raw Compression Options:
    -X, --deflate                Scan for raw deflate compression streams
    -Z, --lzma                   Scan for raw LZMA compression streams
    -P, --partial                Perform a superficial, but faster, scan
    -S, --stop                   Stop after the first result

General Options:
    -l, --length=<int>           Number of bytes to scan
    -o, --offset=<int>           Start scan at this file offset
    -O, --base=<int>             Add a base address to all printed offsets
    -K, --block=<int>            Set file block size
    -g, --swap=<int>             Reverse every n bytes before scanning
    -f, --log=<file>             Log results to file
    -c, --csv                    Log results to file in CSV format
    -t, --term                   Format output to fit the terminal window
    -q, --quiet                  Suppress output to stdout
    -v, --verbose                Enable verbose output
    -h, --help                   Show help output
    -a, --finclude=<str>         Only scan files whose names match this regex
    -p, --fexclude=<str>         Do not scan files whose names match this regex
    -s, --status=<int>           Enable the status server on the specified port

Skenování obrázků

Začněme hledáním podpisů souborů uvnitř obrázku (obrázek z webu TP-Link).

Spuštění binwalku s možností --signature:

$ binwalk --signature --term archer-c7.bin

DECIMAL       HEXADECIMAL     DESCRIPTION
------------------------------------------------------------------------------------------
21876         0x5574          U-Boot version string, "U-Boot 1.1.4-g4480d5f9-dirty (May
                              20 2019 - 18:45:16)"
21940         0x55B4          CRC32 polynomial table, big endian
23232         0x5AC0          uImage header, header size: 64 bytes, header CRC:
                              0x386C2BD5, created: 2019-05-20 10:45:17, image size:
                              41162 bytes, Data Address: 0x80010000, Entry Point:
                              0x80010000, data CRC: 0xC9CD1E38, OS: Linux, CPU: MIPS,
                              image type: Firmware Image, compression type: lzma, image
                              name: "u-boot image"
23296         0x5B00          LZMA compressed data, properties: 0x5D, dictionary size:
                              8388608 bytes, uncompressed size: 97476 bytes
64968         0xFDC8          XML document, version: "1.0"
78448         0x13270         uImage header, header size: 64 bytes, header CRC:
                              0x78A267FF, created: 2019-07-26 07:46:14, image size:
                              1088500 bytes, Data Address: 0x80060000, Entry Point:
                              0x80060000, data CRC: 0xBB9D4F94, OS: Linux, CPU: MIPS,
                              image type: Multi-File Image, compression type: lzma,
                              image name: "MIPS OpenWrt Linux-3.3.8"
78520         0x132B8         LZMA compressed data, properties: 0x6D, dictionary size:
                              8388608 bytes, uncompressed size: 3164228 bytes
1167013       0x11CEA5        Squashfs filesystem, little endian, version 4.0,
                              compression:xz, size: 14388306 bytes, 2541 inodes,
                              blocksize: 65536 bytes, created: 2019-07-26 07:51:38
15555328      0xED5B00        gzip compressed data, from Unix, last modified: 2019-07-26
                              07:51:41

Nyní máme o tomto obrázku mnoho informací.

Použití obrázku podmořský jako bootloader (záhlaví obrázku at 0x5AC0 a komprimovaný obraz bootloaderu na adrese 0x5B00). Na základě hlavičky uImage na 0x13270 víme, že architektura procesoru je MIPS a jádro Linuxu je verze 3.3.8. A na základě obrázku nalezeného na 0x11CEA5, to vidíme rootfs je souborový systém squashfs.

Pojďme nyní extrahovat bootloader (U-Boot) pomocí příkazu dd:

$ dd if=archer-c7.bin of=u-boot.bin.lzma bs=1 skip=23296 count=41162
41162+0 records in
41162+0 records out
41162 bytes (41 kB, 40 KiB) copied, 0,0939608 s, 438 kB/s

Protože je obrázek komprimován pomocí LZMA, musíme jej dekomprimovat:

$ unlzma u-boot.bin.lzma

Nyní máme obrázek U-Boot:

$ ls -l u-boot.bin
-rw-rw-r-- 1 sprado sprado 97476 Fev  5 08:48 u-boot.bin

Co takhle najít výchozí hodnotu pro bootargs?

$ strings u-boot.bin | grep bootargs
bootargs
bootargs=console=ttyS0,115200 board=AP152 rootfstype=squashfs init=/etc/preinit mtdparts=spi0.0:128k(factory-uboot),192k(u-boot),64k(ART),1536k(uImage),14464k@0x1e0000(rootfs) mem=128M

Proměnná prostředí U-Boot bootargs slouží k předávání parametrů linuxovému jádru. A z výše uvedeného lépe rozumíme flash paměti zařízení.

Co takhle extrahovat obraz linuxového jádra?

$ dd if=archer-c7.bin of=uImage bs=1 skip=78448 count=1088572
1088572+0 records in
1088572+0 records out
1088572 bytes (1,1 MB, 1,0 MiB) copied, 1,68628 s, 646 kB/s

Pomocí příkazu můžeme ověřit, že byl obrázek úspěšně extrahován file:

$ file uImage
uImage: u-boot legacy uImage, MIPS OpenWrt Linux-3.3.8, Linux/MIPS, Multi-File Image (lzma), 1088500 bytes, Fri Jul 26 07:46:14 2019, Load Address: 0x80060000, Entry Point: 0x80060000, Header CRC: 0x78A267FF, Data CRC: 0xBB9D4F94

Formát souboru uImage je v podstatě obrázek jádra Linuxu s dodatečným záhlavím. Odstraníme tuto hlavičku, abychom získali konečný obrázek jádra Linuxu:

$ dd if=uImage of=Image.lzma bs=1 skip=72
1088500+0 records in
1088500+0 records out
1088500 bytes (1,1 MB, 1,0 MiB) copied, 1,65603 s, 657 kB/s

Obrázek je komprimovaný, takže jej rozbalíme:

$ unlzma Image.lzma

Nyní máme obraz linuxového jádra:

$ ls -la Image
-rw-rw-r-- 1 sprado sprado 3164228 Fev  5 10:51 Image

Co můžeme dělat s obrazem jádra? Mohli bychom například prohledávat řetězce v obrázku a najít verzi linuxového jádra a zjistit o prostředí použitém k sestavení jádra:

$ strings Image | grep "Linux version"
Linux version 3.3.8 (leo@leo-MS-7529) (gcc version 4.6.3 20120201 (prerelease) (Linaro GCC 4.6-2012.02) ) #1 Mon May 20 18:53:02 CST 2019

I když byl firmware vydán minulý rok (2019), v době, kdy píšu tento článek, používá starou verzi linuxového jádra (3.3.8) vydanou v roce 2012 zkompilovanou s velmi starou verzí GCC (4.6) také od roku 2012!
Stále důvěřujete svým routerům v kanceláři i doma?

S možností --opcodes můžeme také použít binwalk k vyhledání strojových instrukcí a určení procesorové architektury obrázku:

$ binwalk --opcodes Image
DECIMAL       HEXADECIMAL     DESCRIPTION
--------------------------------------------------------------------------------
2400          0x960           MIPS instructions, function epilogue
2572          0xA0C           MIPS instructions, function epilogue
2828          0xB0C           MIPS instructions, function epilogue

A co kořenový souborový systém? Místo ručního extrahování obrázku použijme možnost binwalk --extract:

$ binwalk --extract --quiet archer-c7.bin

Kompletní kořenový souborový systém bude extrahován do podadresáře:

$ cd _archer-c7.bin.extracted/squashfs-root/

$ ls
bin  dev  etc  lib  mnt  overlay  proc  rom  root  sbin  sys  tmp  usr  var  www

$ cat etc/banner
     MM           NM                    MMMMMMM          M       M
   $MMMMM        MMMMM                MMMMMMMMMMM      MMM     MMM
  MMMMMMMM     MM MMMMM.              MMMMM:MMMMMM:   MMMM   MMMMM
MMMM= MMMMMM  MMM   MMMM       MMMMM   MMMM  MMMMMM   MMMM  MMMMM'
MMMM=  MMMMM MMMM    MM       MMMMM    MMMM    MMMM   MMMMNMMMMM
MMMM=   MMMM  MMMMM          MMMMM     MMMM    MMMM   MMMMMMMM
MMMM=   MMMM   MMMMMM       MMMMM      MMMM    MMMM   MMMMMMMMM
MMMM=   MMMM     MMMMM,    NMMMMMMMM   MMMM    MMMM   MMMMMMMMMMM
MMMM=   MMMM      MMMMMM   MMMMMMMM    MMMM    MMMM   MMMM  MMMMMM
MMMM=   MMMM   MM    MMMM    MMMM      MMMM    MMMM   MMMM    MMMM
MMMM$ ,MMMMM  MMMMM  MMMM    MMM       MMMM   MMMMM   MMMM    MMMM
  MMMMMMM:      MMMMMMM     M         MMMMMMMMMMMM  MMMMMMM MMMMMMM
    MMMMMM       MMMMN     M           MMMMMMMMM      MMMM    MMMM
     MMMM          M                    MMMMMMM        M       M
       M
 ---------------------------------------------------------------
   For those about to rock... (%C, %R)
 ---------------------------------------------------------------

Teď můžeme dělat spoustu věcí.

Můžeme hledat konfigurační soubory, hashe hesel, kryptografické klíče a digitální certifikáty. Můžeme analyzovat binární soubory pro hledat chyby a zranitelnosti.

S qemu и chroot můžeme dokonce spustit (emulovat) spustitelný soubor z obrázku:

$ ls
bin  dev  etc  lib  mnt  overlay  proc  rom  root  sbin  sys  tmp  usr  var  www

$ cp /usr/bin/qemu-mips-static .

$ sudo chroot . ./qemu-mips-static bin/busybox
BusyBox v1.19.4 (2019-05-20 18:13:49 CST) multi-call binary.
Copyright (C) 1998-2011 Erik Andersen, Rob Landley, Denys Vlasenko
and others. Licensed under GPLv2.
See source distribution for full notice.

Usage: busybox [function] [arguments]...
   or: busybox --list[-full]
   or: function [arguments]...

    BusyBox is a multi-call binary that combines many common Unix
    utilities into a single executable.  Most people will create a
    link to busybox for each function they wish to use and BusyBox
    will act like whatever it was invoked as.

Currently defined functions:
    [, [[, addgroup, adduser, arping, ash, awk, basename, cat, chgrp, chmod, chown, chroot, clear, cmp, cp, crond, crontab, cut, date, dd, delgroup, deluser, dirname, dmesg, echo, egrep, env, expr, false,
    fgrep, find, free, fsync, grep, gunzip, gzip, halt, head, hexdump, hostid, id, ifconfig, init, insmod, kill, killall, klogd, ln, lock, logger, ls, lsmod, mac_addr, md5sum, mkdir, mkfifo, mknod, mktemp,
    mount, mv, nice, passwd, pgrep, pidof, ping, ping6, pivot_root, poweroff, printf, ps, pwd, readlink, reboot, reset, rm, rmdir, rmmod, route, sed, seq, sh, sleep, sort, start-stop-daemon, strings,
    switch_root, sync, sysctl, tail, tar, tee, telnet, test, tftp, time, top, touch, tr, traceroute, true, udhcpc, umount, uname, uniq, uptime, vconfig, vi, watchdog, wc, wget, which, xargs, yes, zcat

Skvělý! Všimněte si však, že verze BusyBox je 1.19.4. Toto je velmi stará verze BusyBoxuvyšlo v dubnu 2012.

TP-Link tedy vydává image firmwaru v roce 2019 pomocí softwaru (GCC toolchain, kernel, BusyBox atd.) z roku 2012!

Teď už chápete, proč na své routery vždy instaluji OpenWRT?

To není vše

Binwalk může také provádět analýzu entropie, tisknout nezpracovaná entropická data a generovat entropické grafy. Obvykle je větší entropie pozorována, když jsou bajty v obrázku náhodné. To může znamenat, že obrázek obsahuje zašifrovaný, komprimovaný nebo obfuskovaný soubor. Hardcore šifrovací klíč? Proč ne.

Zpětné inženýrství domácího routeru s binwalkem. Důvěřujete softwaru svého routeru?

Můžeme také použít parametr --raw k vyhledání vlastní sekvence nezpracovaných bajtů v obrázku nebo parametru --hexdump k provedení hexadecimálního výpisu, který porovná dva nebo více vstupních souborů.

Vlastní podpisy lze přidat do binwalk buď prostřednictvím souboru vlastního podpisu zadaného na příkazovém řádku pomocí parametru --magicnebo jejich přidáním do adresáře $ HOME / .config / binwalk / magic.

Více informací o binwalku najdete na oficiální dokumentace.

rozšíření binwalk

Tam API binwalk implementovaný jako modul Pythonu, který může být použit libovolným skriptem Pythonu k programovému provádění skenování binwalk, a nástroj příkazového řádku binwalk lze téměř úplně duplikovat pomocí pouhých dvou řádků kódu Pythonu!

import binwalk
binwalk.scan()

S pomocí Python API můžete také tvořit pluginy pro Python přizpůsobit a rozšířit binwalk.

Také existuje plugin IDA a cloudovou verzi Binwalk Pro.

Proč si tedy nestáhnete image firmwaru z internetu a nezkusíte binwalk? Slibuji, že si užijete spoustu zábavy 🙂

Zdroj: www.habr.com

Přidat komentář