Reverse engineering av en hemmarouter med binwalk. Litar du på din routermjukvara?

Reverse engineering av en hemmarouter med binwalk. Litar du på din routermjukvara?

För några dagar sedan bestämde jag mig för att reverse engineering av min routers firmware med binwalk.

Jag köpte mig själv TP-Link Archer C7 hemmarouter. Inte den bästa routern, men tillräckligt för mina behov.

Varje gång jag köper en ny router installerar jag OpenWRT. För vad? Tillverkarna bryr sig som regel inte så mycket om att stödja sina routrar och med tiden blir mjukvaran föråldrad, sårbarheter dyker upp och så vidare, i allmänhet förstår man. Därför föredrar jag OpenWRT-firmware, som stöds väl av open source-gemenskapen.

Efter att ha laddat ner OpenWRT har jag också laddade ner den senaste firmware-bilden under min nya Archer C7 från den officiella hemsidan och bestämde mig för att analysera den. Rent för skojs skull och prata om binwalk.

Vad är binwalk?

Binwalk är ett verktyg med öppen källkod för analys, reverse engineering och extrahering av firmware-bilder.

Skapat 2010 av Craig Heffner, kan binwalk skanna firmware-bilder och hitta filer, identifiera och extrahera filsystembilder, körbar kod, komprimerade arkiv, bootloaders och kärnor, filformat som JPEG och PDF och mycket mer.

Du kan använda binwalk för att omvända den fasta programvaran för att förstå hur den fungerar. Sök i binära filer efter sårbarheter, extrahera filer och leta efter bakdörrar eller digitala certifikat. Du kan också hitta opcodes för en massa olika processorer.

Du kan extrahera filsystemsbilder för att leta efter specifika lösenordsfiler (passwd, shadow, etc.) och försöka bryta lösenordshashar. Du kan utföra binär analys mellan två eller flera filer. Du kan utföra entropianalys på data för att leta efter komprimerad data eller kodade krypteringsnycklar. Allt detta utan att behöva komma åt källkoden.

I allmänhet finns allt du behöver :)

Hur fungerar binwalk?

Det viktigaste med binwalk är dess signaturskanning. Binwalk kan skanna firmwarebilden för att söka efter olika inbyggda filtyper och filsystem.

Känner du till kommandoradsverktyget file?

file /bin/bash
/bin/bash: ELF 64-bit LSB shared object, x86-64, version 1 (SYSV), dynamically linked, interpreter /lib64/l, for GNU/Linux 3.2.0, BuildID[sha1]=12f73d7a8e226c663034529c8dd20efec22dde54, stripped

Team filetittar på filhuvudet och letar efter en signatur (magiskt nummer) för att bestämma filtypen. Till exempel, om filen börjar med sekvensen av byte 0x89 0x50 0x4E 0x47 0x0D 0x0A 0x1A 0x0A, den vet att det är en PNG-fil. På Wikipedia Det finns en lista över vanliga filsignaturer.

Binwalk fungerar på samma sätt. Men istället för att bara leta efter signaturer i början av filen, kommer binwalk att skanna hela filen. Dessutom kan binwalk extrahera filer som finns i bilden.

Verktyg file и binwalk använda biblioteket libmagic för att identifiera filsignaturer. Men binwalk stöder dessutom en lista med anpassade magiska signaturer för att söka efter komprimerade/zippade filer, firmware-rubriker, Linux-kärnor, bootloaders, filsystem och så vidare.

Låt oss ha lite kul?

Binwalk installation

Binwalk stöds på flera plattformar inklusive Linux, OSX, FreeBSD och Windows.

För att installera den senaste versionen av binwalk kan du ladda ner källkod och följ installations instruktioner eller snabb guide, tillgänglig på projektets webbplats.

Binwalk har många olika parametrar:

$ binwalk

Binwalk v2.2.0
Craig Heffner, ReFirmLabs
https://github.com/ReFirmLabs/binwalk

Usage: binwalk [OPTIONS] [FILE1] [FILE2] [FILE3] ...

Signature Scan Options:
    -B, --signature              Scan target file(s) for common file signatures
    -R, --raw=<str>              Scan target file(s) for the specified sequence of bytes
    -A, --opcodes                Scan target file(s) for common executable opcode signatures
    -m, --magic=<file>           Specify a custom magic file to use
    -b, --dumb                   Disable smart signature keywords
    -I, --invalid                Show results marked as invalid
    -x, --exclude=<str>          Exclude results that match <str>
    -y, --include=<str>          Only show results that match <str>

Extraction Options:
    -e, --extract                Automatically extract known file types
    -D, --dd=<type:ext:cmd>      Extract <type> signatures, give the files an extension of <ext>, and execute <cmd>
    -M, --matryoshka             Recursively scan extracted files
    -d, --depth=<int>            Limit matryoshka recursion depth (default: 8 levels deep)
    -C, --directory=<str>        Extract files/folders to a custom directory (default: current working directory)
    -j, --size=<int>             Limit the size of each extracted file
    -n, --count=<int>            Limit the number of extracted files
    -r, --rm                     Delete carved files after extraction
    -z, --carve                  Carve data from files, but don't execute extraction utilities
    -V, --subdirs                Extract into sub-directories named by the offset

Entropy Options:
    -E, --entropy                Calculate file entropy
    -F, --fast                   Use faster, but less detailed, entropy analysis
    -J, --save                   Save plot as a PNG
    -Q, --nlegend                Omit the legend from the entropy plot graph
    -N, --nplot                  Do not generate an entropy plot graph
    -H, --high=<float>           Set the rising edge entropy trigger threshold (default: 0.95)
    -L, --low=<float>            Set the falling edge entropy trigger threshold (default: 0.85)

Binary Diffing Options:
    -W, --hexdump                Perform a hexdump / diff of a file or files
    -G, --green                  Only show lines containing bytes that are the same among all files
    -i, --red                    Only show lines containing bytes that are different among all files
    -U, --blue                   Only show lines containing bytes that are different among some files
    -u, --similar                Only display lines that are the same between all files
    -w, --terse                  Diff all files, but only display a hex dump of the first file

Raw Compression Options:
    -X, --deflate                Scan for raw deflate compression streams
    -Z, --lzma                   Scan for raw LZMA compression streams
    -P, --partial                Perform a superficial, but faster, scan
    -S, --stop                   Stop after the first result

General Options:
    -l, --length=<int>           Number of bytes to scan
    -o, --offset=<int>           Start scan at this file offset
    -O, --base=<int>             Add a base address to all printed offsets
    -K, --block=<int>            Set file block size
    -g, --swap=<int>             Reverse every n bytes before scanning
    -f, --log=<file>             Log results to file
    -c, --csv                    Log results to file in CSV format
    -t, --term                   Format output to fit the terminal window
    -q, --quiet                  Suppress output to stdout
    -v, --verbose                Enable verbose output
    -h, --help                   Show help output
    -a, --finclude=<str>         Only scan files whose names match this regex
    -p, --fexclude=<str>         Do not scan files whose names match this regex
    -s, --status=<int>           Enable the status server on the specified port

Bildskanning

Låt oss börja med att söka efter filsignaturer inuti bilden (bild från webbplatsen TP-Link).

Kör binwalk med parametern --signature:

$ binwalk --signature --term archer-c7.bin

DECIMAL       HEXADECIMAL     DESCRIPTION
------------------------------------------------------------------------------------------
21876         0x5574          U-Boot version string, "U-Boot 1.1.4-g4480d5f9-dirty (May
                              20 2019 - 18:45:16)"
21940         0x55B4          CRC32 polynomial table, big endian
23232         0x5AC0          uImage header, header size: 64 bytes, header CRC:
                              0x386C2BD5, created: 2019-05-20 10:45:17, image size:
                              41162 bytes, Data Address: 0x80010000, Entry Point:
                              0x80010000, data CRC: 0xC9CD1E38, OS: Linux, CPU: MIPS,
                              image type: Firmware Image, compression type: lzma, image
                              name: "u-boot image"
23296         0x5B00          LZMA compressed data, properties: 0x5D, dictionary size:
                              8388608 bytes, uncompressed size: 97476 bytes
64968         0xFDC8          XML document, version: "1.0"
78448         0x13270         uImage header, header size: 64 bytes, header CRC:
                              0x78A267FF, created: 2019-07-26 07:46:14, image size:
                              1088500 bytes, Data Address: 0x80060000, Entry Point:
                              0x80060000, data CRC: 0xBB9D4F94, OS: Linux, CPU: MIPS,
                              image type: Multi-File Image, compression type: lzma,
                              image name: "MIPS OpenWrt Linux-3.3.8"
78520         0x132B8         LZMA compressed data, properties: 0x6D, dictionary size:
                              8388608 bytes, uncompressed size: 3164228 bytes
1167013       0x11CEA5        Squashfs filesystem, little endian, version 4.0,
                              compression:xz, size: 14388306 bytes, 2541 inodes,
                              blocksize: 65536 bytes, created: 2019-07-26 07:51:38
15555328      0xED5B00        gzip compressed data, from Unix, last modified: 2019-07-26
                              07:51:41

Nu har vi mycket information om den här bilden.

Bildanvändning ubåt som en bootloader (bildhuvud på 0x5AC0 och en komprimerad bootloader-bild på 0x5B00). Baserat på uImage-huvudet på 0x13270 vet vi att processorarkitekturen är MIPS och att Linux-kärnan är version 3.3.8. Och baserat på bilden som finns på adressen 0x11CEA5, vi kan se det rootfs är ett filsystem squashfs.

Låt oss nu extrahera starthanteraren (U-Boot) med kommandot dd:

$ dd if=archer-c7.bin of=u-boot.bin.lzma bs=1 skip=23296 count=41162
41162+0 records in
41162+0 records out
41162 bytes (41 kB, 40 KiB) copied, 0,0939608 s, 438 kB/s

Eftersom bilden är komprimerad med LZMA måste vi dekomprimera den:

$ unlzma u-boot.bin.lzma

Nu har vi en U-Boot-bild:

$ ls -l u-boot.bin
-rw-rw-r-- 1 sprado sprado 97476 Fev  5 08:48 u-boot.bin

Vad sägs om att hitta standardvärdet för bootargs?

$ strings u-boot.bin | grep bootargs
bootargs
bootargs=console=ttyS0,115200 board=AP152 rootfstype=squashfs init=/etc/preinit mtdparts=spi0.0:128k(factory-uboot),192k(u-boot),64k(ART),1536k(uImage),14464k@0x1e0000(rootfs) mem=128M

U-boot miljövariabel bootargs används för att skicka parametrar till Linux-kärnan. Och från ovanstående har vi en bättre förståelse för enhetens flashminne.

Vad sägs om att extrahera Linux-kärnavbildningen?

$ dd if=archer-c7.bin of=uImage bs=1 skip=78448 count=1088572
1088572+0 records in
1088572+0 records out
1088572 bytes (1,1 MB, 1,0 MiB) copied, 1,68628 s, 646 kB/s

Vi kan kontrollera att bilden extraherades framgångsrikt med kommandot file:

$ file uImage
uImage: u-boot legacy uImage, MIPS OpenWrt Linux-3.3.8, Linux/MIPS, Multi-File Image (lzma), 1088500 bytes, Fri Jul 26 07:46:14 2019, Load Address: 0x80060000, Entry Point: 0x80060000, Header CRC: 0x78A267FF, Data CRC: 0xBB9D4F94

Filformatet uImage är i grunden en Linux-kärnabild med en extra rubrik. Låt oss ta bort den här rubriken för att få den slutliga Linux-kärnbilden:

$ dd if=uImage of=Image.lzma bs=1 skip=72
1088500+0 records in
1088500+0 records out
1088500 bytes (1,1 MB, 1,0 MiB) copied, 1,65603 s, 657 kB/s

Bilden är komprimerad, så låt oss packa upp den:

$ unlzma Image.lzma

Nu har vi en Linux-kärnabild:

$ ls -la Image
-rw-rw-r-- 1 sprado sprado 3164228 Fev  5 10:51 Image

Vad kan vi göra med kärnbilden? Vi kan till exempel göra en strängsökning i bilden och hitta versionen av Linux-kärnan och lära oss om miljön som används för att bygga kärnan:

$ strings Image | grep "Linux version"
Linux version 3.3.8 (leo@leo-MS-7529) (gcc version 4.6.3 20120201 (prerelease) (Linaro GCC 4.6-2012.02) ) #1 Mon May 20 18:53:02 CST 2019

Även om den fasta programvaran släpptes förra året (2019), använder den när jag skriver den här artikeln en gammal version av Linux-kärnan (3.3.8) som släpptes 2012, kompilerad med en mycket gammal version av GCC (4.6) också sedan 2012 !
(ca. översättning litar du fortfarande på dina routrar på kontoret och hemma?)

Med option --opcodes vi kan också använda binwalk för att slå upp maskininstruktioner och bestämma processorarkitekturen för bilden:

$ binwalk --opcodes Image
DECIMAL       HEXADECIMAL     DESCRIPTION
--------------------------------------------------------------------------------
2400          0x960           MIPS instructions, function epilogue
2572          0xA0C           MIPS instructions, function epilogue
2828          0xB0C           MIPS instructions, function epilogue

Hur är det med rotfilsystemet? Istället för att extrahera bilden manuellt, låt oss använda alternativet binwalk --extract:

$ binwalk --extract --quiet archer-c7.bin

Hela rotfilsystemet kommer att extraheras till en underkatalog:

$ cd _archer-c7.bin.extracted/squashfs-root/

$ ls
bin  dev  etc  lib  mnt  overlay  proc  rom  root  sbin  sys  tmp  usr  var  www

$ cat etc/banner
     MM           NM                    MMMMMMM          M       M
   $MMMMM        MMMMM                MMMMMMMMMMM      MMM     MMM
  MMMMMMMM     MM MMMMM.              MMMMM:MMMMMM:   MMMM   MMMMM
MMMM= MMMMMM  MMM   MMMM       MMMMM   MMMM  MMMMMM   MMMM  MMMMM'
MMMM=  MMMMM MMMM    MM       MMMMM    MMMM    MMMM   MMMMNMMMMM
MMMM=   MMMM  MMMMM          MMMMM     MMMM    MMMM   MMMMMMMM
MMMM=   MMMM   MMMMMM       MMMMM      MMMM    MMMM   MMMMMMMMM
MMMM=   MMMM     MMMMM,    NMMMMMMMM   MMMM    MMMM   MMMMMMMMMMM
MMMM=   MMMM      MMMMMM   MMMMMMMM    MMMM    MMMM   MMMM  MMMMMM
MMMM=   MMMM   MM    MMMM    MMMM      MMMM    MMMM   MMMM    MMMM
MMMM$ ,MMMMM  MMMMM  MMMM    MMM       MMMM   MMMMM   MMMM    MMMM
  MMMMMMM:      MMMMMMM     M         MMMMMMMMMMMM  MMMMMMM MMMMMMM
    MMMMMM       MMMMN     M           MMMMMMMMM      MMMM    MMMM
     MMMM          M                    MMMMMMM        M       M
       M
 ---------------------------------------------------------------
   For those about to rock... (%C, %R)
 ---------------------------------------------------------------

Nu kan vi göra många olika saker.

Vi kan söka efter konfigurationsfiler, lösenordshaschar, kryptografiska nycklar och digitala certifikat. Vi kan analysera binära filer för felsökning och sårbarheter.

Med qemu и chroot vi kan till och med köra (emulera) en körbar fil från bilden:

$ ls
bin  dev  etc  lib  mnt  overlay  proc  rom  root  sbin  sys  tmp  usr  var  www

$ cp /usr/bin/qemu-mips-static .

$ sudo chroot . ./qemu-mips-static bin/busybox
BusyBox v1.19.4 (2019-05-20 18:13:49 CST) multi-call binary.
Copyright (C) 1998-2011 Erik Andersen, Rob Landley, Denys Vlasenko
and others. Licensed under GPLv2.
See source distribution for full notice.

Usage: busybox [function] [arguments]...
   or: busybox --list[-full]
   or: function [arguments]...

    BusyBox is a multi-call binary that combines many common Unix
    utilities into a single executable.  Most people will create a
    link to busybox for each function they wish to use and BusyBox
    will act like whatever it was invoked as.

Currently defined functions:
    [, [[, addgroup, adduser, arping, ash, awk, basename, cat, chgrp, chmod, chown, chroot, clear, cmp, cp, crond, crontab, cut, date, dd, delgroup, deluser, dirname, dmesg, echo, egrep, env, expr, false,
    fgrep, find, free, fsync, grep, gunzip, gzip, halt, head, hexdump, hostid, id, ifconfig, init, insmod, kill, killall, klogd, ln, lock, logger, ls, lsmod, mac_addr, md5sum, mkdir, mkfifo, mknod, mktemp,
    mount, mv, nice, passwd, pgrep, pidof, ping, ping6, pivot_root, poweroff, printf, ps, pwd, readlink, reboot, reset, rm, rmdir, rmmod, route, sed, seq, sh, sleep, sort, start-stop-daemon, strings,
    switch_root, sync, sysctl, tail, tar, tee, telnet, test, tftp, time, top, touch, tr, traceroute, true, udhcpc, umount, uname, uniq, uptime, vconfig, vi, watchdog, wc, wget, which, xargs, yes, zcat

Bra! Men observera att BusyBox version är 1.19.4. Detta är en mycket gammal version av BusyBox, släpptes i april 2012.

Så TP-Link släpper en firmware-bild 2019 med hjälp av programvara (GCC-verktygskedja, kärna, BusyBox, etc.) från 2012!

Förstår du nu varför jag alltid installerar OpenWRT på mina routrar?

Det är inte allt

Binwalk kan också utföra entropianalys, skriva ut rå entropidata och generera entropigrafer. Vanligtvis observeras större entropi när byten i bilden är slumpmässiga. Detta kan betyda att bilden innehåller en krypterad, komprimerad eller obfuskerad fil. Hardcore krypteringsnyckel? Varför inte.

Reverse engineering av en hemmarouter med binwalk. Litar du på din routermjukvara?

Vi kan också använda parametern --raw för att hitta en anpassad råbytesekvens i en bild eller parameter --hexdump för att utföra en hex-dump som jämför två eller flera indatafiler.

Anpassade signaturer kan läggas till i binwalk antingen genom en anpassad signaturfil som anges på kommandoraden med parametern --magic, eller genom att lägga till dem i katalogen $ HOME / .config / binwalk / magic.

Du kan hitta mer information om binwalk på officiell dokumentation.

binwalk förlängning

Det API binwalk, implementerad som en Python-modul som kan användas av vilket Python-skript som helst för att programmatiskt utföra en binwalk-skanning, och kommandoradsverktyget binwalk kan nästan helt dupliceras med bara två rader Python-kod!

import binwalk
binwalk.scan()

Med hjälp av Python API kan du också skapa Python plugins för att konfigurera och utöka binwalk.

Finns också IDA-plugin och molnversion Binwalk Pro.

Så varför laddar du inte ner firmwarebilden från Internet och provar binwalk? Jag lovar att du kommer att ha mycket kul :)

Källa: will.com

Lägg en kommentar