Omvendt utvikling av en hjemmeruter ved hjelp av binwalk. Stoler du på ruterprogramvaren din?

Omvendt utvikling av en hjemmeruter ved hjelp av binwalk. Stoler du på ruterprogramvaren din?

For noen dager siden bestemte jeg meg for å reversere ruterens fastvare ved å bruke binwalk.

Jeg kjøpte meg selv TP-Link Archer C7 hjemmeruter. Ikke den beste ruteren, men ganske nok for mine behov.

Hver gang jeg kjøper en ny ruter, installerer jeg OpenWRT. For hva? Som regel bryr ikke produsentene seg så mye om å støtte sine rutere og over tid blir programvaren utdatert, sårbarheter dukker opp, og så videre, generelt sett skjønner du. Derfor foretrekker jeg OpenWRT-fastvaren, som er godt støttet av åpen kildekode-fellesskapet.

Etter å ha lastet ned OpenWRT, har jeg også lastet ned det siste firmwarebildet under min nye Archer C7 fra den offisielle nettsiden og bestemte seg for å analysere den. Rent for moro skyld og snakk om binwalk.

Hva er binwalk?

Binwalk er et åpen kildekodeverktøy for analyse, omvendt utvikling og utvinning av fastvarebilder.

Binwalk ble opprettet i 2010 av Craig Heffner, og kan skanne fastvarebilder og finne filer, identifisere og trekke ut filsystembilder, kjørbar kode, komprimerte arkiver, bootloadere og kjerner, filformater som JPEG og PDF, og mye mer.

Du kan bruke binwalk til å reversere fastvaren for å forstå hvordan den fungerer. Søk i binære filer for sårbarheter, pakk ut filer og se etter bakdører eller digitale sertifikater. Du kan også finne opcodes for en haug med forskjellige CPUer.

Du kan trekke ut filsystembilder for å se etter spesifikke passordfiler (passwd, shadow, etc.) og prøve å bryte passordhasher. Du kan utføre binær parsing mellom to eller flere filer. Du kan utføre entropianalyse på data for å finne komprimerte data eller kodede krypteringsnøkler. Alt dette uten behov for tilgang til kildekoden.

Generelt er alt du trenger der :)

Hvordan fungerer binwalk?

Hovedfunksjonen til binwalk er dens signaturskanning. Binwalk kan skanne fastvarebildet for å søke etter ulike innebygde filtyper og filsystemer.

Kjenner du kommandolinjeverktøyet file?

file /bin/bash
/bin/bash: ELF 64-bit LSB shared object, x86-64, version 1 (SYSV), dynamically linked, interpreter /lib64/l, for GNU/Linux 3.2.0, BuildID[sha1]=12f73d7a8e226c663034529c8dd20efec22dde54, stripped

Lag fileser på filoverskriften og ser etter signaturen (magisk tall) for å bestemme filtypen. For eksempel hvis filen begynner med rekkefølgen av byte 0x89 0x50 0x4E 0x47 0x0D 0x0A 0x1A 0x0A, den vet at det er en PNG-fil. På Wikipedia Det er en liste over vanlige filsignaturer.

Binwalk fungerer på samme måte. Men i stedet for å lete etter signaturer bare i begynnelsen av filen, vil binwalk skanne hele filen. I tillegg kan binwalk trekke ut filer som finnes i bildet.

Verktøy file и binwalk bruke biblioteket libmagic for å identifisere filsignaturer. Men binwalk støtter i tillegg en liste over egendefinerte magiske signaturer for å søke etter komprimerte/zippede filer, fastvarehoder, Linux-kjerner, oppstartslastere, filsystemer og så videre.

La oss ha det litt gøy?

Binwalk installasjon

Binwalk støttes på flere plattformer inkludert Linux, OSX, FreeBSD og Windows.

For å installere den nyeste versjonen av binwalk kan du last ned kildekoden og følg installasjonsinstruksjoner eller hurtiginnføring, tilgjengelig på prosjektets nettside.

Binwalk har mange forskjellige parametere:

$ binwalk

Binwalk v2.2.0
Craig Heffner, ReFirmLabs
https://github.com/ReFirmLabs/binwalk

Usage: binwalk [OPTIONS] [FILE1] [FILE2] [FILE3] ...

Signature Scan Options:
    -B, --signature              Scan target file(s) for common file signatures
    -R, --raw=<str>              Scan target file(s) for the specified sequence of bytes
    -A, --opcodes                Scan target file(s) for common executable opcode signatures
    -m, --magic=<file>           Specify a custom magic file to use
    -b, --dumb                   Disable smart signature keywords
    -I, --invalid                Show results marked as invalid
    -x, --exclude=<str>          Exclude results that match <str>
    -y, --include=<str>          Only show results that match <str>

Extraction Options:
    -e, --extract                Automatically extract known file types
    -D, --dd=<type:ext:cmd>      Extract <type> signatures, give the files an extension of <ext>, and execute <cmd>
    -M, --matryoshka             Recursively scan extracted files
    -d, --depth=<int>            Limit matryoshka recursion depth (default: 8 levels deep)
    -C, --directory=<str>        Extract files/folders to a custom directory (default: current working directory)
    -j, --size=<int>             Limit the size of each extracted file
    -n, --count=<int>            Limit the number of extracted files
    -r, --rm                     Delete carved files after extraction
    -z, --carve                  Carve data from files, but don't execute extraction utilities
    -V, --subdirs                Extract into sub-directories named by the offset

Entropy Options:
    -E, --entropy                Calculate file entropy
    -F, --fast                   Use faster, but less detailed, entropy analysis
    -J, --save                   Save plot as a PNG
    -Q, --nlegend                Omit the legend from the entropy plot graph
    -N, --nplot                  Do not generate an entropy plot graph
    -H, --high=<float>           Set the rising edge entropy trigger threshold (default: 0.95)
    -L, --low=<float>            Set the falling edge entropy trigger threshold (default: 0.85)

Binary Diffing Options:
    -W, --hexdump                Perform a hexdump / diff of a file or files
    -G, --green                  Only show lines containing bytes that are the same among all files
    -i, --red                    Only show lines containing bytes that are different among all files
    -U, --blue                   Only show lines containing bytes that are different among some files
    -u, --similar                Only display lines that are the same between all files
    -w, --terse                  Diff all files, but only display a hex dump of the first file

Raw Compression Options:
    -X, --deflate                Scan for raw deflate compression streams
    -Z, --lzma                   Scan for raw LZMA compression streams
    -P, --partial                Perform a superficial, but faster, scan
    -S, --stop                   Stop after the first result

General Options:
    -l, --length=<int>           Number of bytes to scan
    -o, --offset=<int>           Start scan at this file offset
    -O, --base=<int>             Add a base address to all printed offsets
    -K, --block=<int>            Set file block size
    -g, --swap=<int>             Reverse every n bytes before scanning
    -f, --log=<file>             Log results to file
    -c, --csv                    Log results to file in CSV format
    -t, --term                   Format output to fit the terminal window
    -q, --quiet                  Suppress output to stdout
    -v, --verbose                Enable verbose output
    -h, --help                   Show help output
    -a, --finclude=<str>         Only scan files whose names match this regex
    -p, --fexclude=<str>         Do not scan files whose names match this regex
    -s, --status=<int>           Enable the status server on the specified port

Bildeskanning

La oss starte med å søke etter filsignaturer inne i bildet (bilde fra nettstedet TP-Link).

Kjører binwalk med --signature-parameteren:

$ binwalk --signature --term archer-c7.bin

DECIMAL       HEXADECIMAL     DESCRIPTION
------------------------------------------------------------------------------------------
21876         0x5574          U-Boot version string, "U-Boot 1.1.4-g4480d5f9-dirty (May
                              20 2019 - 18:45:16)"
21940         0x55B4          CRC32 polynomial table, big endian
23232         0x5AC0          uImage header, header size: 64 bytes, header CRC:
                              0x386C2BD5, created: 2019-05-20 10:45:17, image size:
                              41162 bytes, Data Address: 0x80010000, Entry Point:
                              0x80010000, data CRC: 0xC9CD1E38, OS: Linux, CPU: MIPS,
                              image type: Firmware Image, compression type: lzma, image
                              name: "u-boot image"
23296         0x5B00          LZMA compressed data, properties: 0x5D, dictionary size:
                              8388608 bytes, uncompressed size: 97476 bytes
64968         0xFDC8          XML document, version: "1.0"
78448         0x13270         uImage header, header size: 64 bytes, header CRC:
                              0x78A267FF, created: 2019-07-26 07:46:14, image size:
                              1088500 bytes, Data Address: 0x80060000, Entry Point:
                              0x80060000, data CRC: 0xBB9D4F94, OS: Linux, CPU: MIPS,
                              image type: Multi-File Image, compression type: lzma,
                              image name: "MIPS OpenWrt Linux-3.3.8"
78520         0x132B8         LZMA compressed data, properties: 0x6D, dictionary size:
                              8388608 bytes, uncompressed size: 3164228 bytes
1167013       0x11CEA5        Squashfs filesystem, little endian, version 4.0,
                              compression:xz, size: 14388306 bytes, 2541 inodes,
                              blocksize: 65536 bytes, created: 2019-07-26 07:51:38
15555328      0xED5B00        gzip compressed data, from Unix, last modified: 2019-07-26
                              07:51:41

Nå har vi mye informasjon om dette bildet.

Bildebruk Submarine som en bootloader (bildeoverskrift på 0x5AC0 og et komprimert bootloader-bilde på 0x5B00). Basert på uImage-overskriften på 0x13270, vet vi at prosessorarkitekturen er MIPS og Linux-kjernen er versjon 3.3.8. Og basert på bildet funnet på adressen 0x11CEA5, det kan vi se rootfs er et filsystem squashfs.

La oss nå trekke ut bootloaderen (U-Boot) ved å bruke kommandoen dd:

$ dd if=archer-c7.bin of=u-boot.bin.lzma bs=1 skip=23296 count=41162
41162+0 records in
41162+0 records out
41162 bytes (41 kB, 40 KiB) copied, 0,0939608 s, 438 kB/s

Siden bildet er komprimert med LZMA, må vi dekomprimere det:

$ unlzma u-boot.bin.lzma

Nå har vi et U-Boot-bilde:

$ ls -l u-boot.bin
-rw-rw-r-- 1 sprado sprado 97476 Fev  5 08:48 u-boot.bin

Hva med å finne standardverdien for bootargs?

$ strings u-boot.bin | grep bootargs
bootargs
bootargs=console=ttyS0,115200 board=AP152 rootfstype=squashfs init=/etc/preinit mtdparts=spi0.0:128k(factory-uboot),192k(u-boot),64k(ART),1536k(uImage),14464k@0x1e0000(rootfs) mem=128M

U-boot miljøvariabel bootargs brukes til å sende parametere til Linux-kjernen. Og fra det ovenstående har vi en bedre forståelse av flashminnet til enheten.

Hva med å trekke ut Linux-kjernebildet?

$ dd if=archer-c7.bin of=uImage bs=1 skip=78448 count=1088572
1088572+0 records in
1088572+0 records out
1088572 bytes (1,1 MB, 1,0 MiB) copied, 1,68628 s, 646 kB/s

Vi kan sjekke at bildet ble trukket ut vellykket ved å bruke kommandoen file:

$ file uImage
uImage: u-boot legacy uImage, MIPS OpenWrt Linux-3.3.8, Linux/MIPS, Multi-File Image (lzma), 1088500 bytes, Fri Jul 26 07:46:14 2019, Load Address: 0x80060000, Entry Point: 0x80060000, Header CRC: 0x78A267FF, Data CRC: 0xBB9D4F94

Filformatet uImage er i utgangspunktet et Linux-kjernebilde med en ekstra overskrift. La oss fjerne denne overskriften for å få det endelige Linux-kjernebildet:

$ dd if=uImage of=Image.lzma bs=1 skip=72
1088500+0 records in
1088500+0 records out
1088500 bytes (1,1 MB, 1,0 MiB) copied, 1,65603 s, 657 kB/s

Bildet er komprimert, så la oss pakke det ut:

$ unlzma Image.lzma

Nå har vi et Linux-kjernebilde:

$ ls -la Image
-rw-rw-r-- 1 sprado sprado 3164228 Fev  5 10:51 Image

Hva kan vi gjøre med kjernebildet? Vi kan for eksempel gjøre et strengsøk i bildet og finne versjonen av Linux-kjernen og lære om miljøet som brukes til å bygge kjernen:

$ strings Image | grep "Linux version"
Linux version 3.3.8 (leo@leo-MS-7529) (gcc version 4.6.3 20120201 (prerelease) (Linaro GCC 4.6-2012.02) ) #1 Mon May 20 18:53:02 CST 2019

Selv om fastvaren ble utgitt i fjor (2019), mens jeg skriver denne artikkelen bruker den en gammel versjon av Linux-kjernen (3.3.8) utgitt i 2012, kompilert med en veldig gammel versjon av GCC (4.6) også siden 2012 !
(ca. overs. stoler du fortsatt på ruterne på kontoret og hjemme?)

Med opsjon --opcodes vi kan også bruke binwalk til å slå opp maskininstruksjoner og bestemme prosessorarkitekturen til bildet:

$ binwalk --opcodes Image
DECIMAL       HEXADECIMAL     DESCRIPTION
--------------------------------------------------------------------------------
2400          0x960           MIPS instructions, function epilogue
2572          0xA0C           MIPS instructions, function epilogue
2828          0xB0C           MIPS instructions, function epilogue

Hva med rotfilsystemet? I stedet for å trekke ut bildet manuelt, la oss bruke alternativet binwalk --extract:

$ binwalk --extract --quiet archer-c7.bin

Hele rotfilsystemet vil bli trukket ut til en underkatalog:

$ cd _archer-c7.bin.extracted/squashfs-root/

$ ls
bin  dev  etc  lib  mnt  overlay  proc  rom  root  sbin  sys  tmp  usr  var  www

$ cat etc/banner
     MM           NM                    MMMMMMM          M       M
   $MMMMM        MMMMM                MMMMMMMMMMM      MMM     MMM
  MMMMMMMM     MM MMMMM.              MMMMM:MMMMMM:   MMMM   MMMMM
MMMM= MMMMMM  MMM   MMMM       MMMMM   MMMM  MMMMMM   MMMM  MMMMM'
MMMM=  MMMMM MMMM    MM       MMMMM    MMMM    MMMM   MMMMNMMMMM
MMMM=   MMMM  MMMMM          MMMMM     MMMM    MMMM   MMMMMMMM
MMMM=   MMMM   MMMMMM       MMMMM      MMMM    MMMM   MMMMMMMMM
MMMM=   MMMM     MMMMM,    NMMMMMMMM   MMMM    MMMM   MMMMMMMMMMM
MMMM=   MMMM      MMMMMM   MMMMMMMM    MMMM    MMMM   MMMM  MMMMMM
MMMM=   MMMM   MM    MMMM    MMMM      MMMM    MMMM   MMMM    MMMM
MMMM$ ,MMMMM  MMMMM  MMMM    MMM       MMMM   MMMMM   MMMM    MMMM
  MMMMMMM:      MMMMMMM     M         MMMMMMMMMMMM  MMMMMMM MMMMMMM
    MMMMMM       MMMMN     M           MMMMMMMMM      MMMM    MMMM
     MMMM          M                    MMMMMMM        M       M
       M
 ---------------------------------------------------------------
   For those about to rock... (%C, %R)
 ---------------------------------------------------------------

Nå kan vi gjøre mye forskjellig.

Vi kan søke etter konfigurasjonsfiler, passordhasher, kryptografiske nøkler og digitale sertifikater. Vi kan analysere binære filer for feilsøking og sårbarheter.

Med qemu и chroot vi kan til og med kjøre (emulere) en kjørbar fil fra bildet:

$ ls
bin  dev  etc  lib  mnt  overlay  proc  rom  root  sbin  sys  tmp  usr  var  www

$ cp /usr/bin/qemu-mips-static .

$ sudo chroot . ./qemu-mips-static bin/busybox
BusyBox v1.19.4 (2019-05-20 18:13:49 CST) multi-call binary.
Copyright (C) 1998-2011 Erik Andersen, Rob Landley, Denys Vlasenko
and others. Licensed under GPLv2.
See source distribution for full notice.

Usage: busybox [function] [arguments]...
   or: busybox --list[-full]
   or: function [arguments]...

    BusyBox is a multi-call binary that combines many common Unix
    utilities into a single executable.  Most people will create a
    link to busybox for each function they wish to use and BusyBox
    will act like whatever it was invoked as.

Currently defined functions:
    [, [[, addgroup, adduser, arping, ash, awk, basename, cat, chgrp, chmod, chown, chroot, clear, cmp, cp, crond, crontab, cut, date, dd, delgroup, deluser, dirname, dmesg, echo, egrep, env, expr, false,
    fgrep, find, free, fsync, grep, gunzip, gzip, halt, head, hexdump, hostid, id, ifconfig, init, insmod, kill, killall, klogd, ln, lock, logger, ls, lsmod, mac_addr, md5sum, mkdir, mkfifo, mknod, mktemp,
    mount, mv, nice, passwd, pgrep, pidof, ping, ping6, pivot_root, poweroff, printf, ps, pwd, readlink, reboot, reset, rm, rmdir, rmmod, route, sed, seq, sh, sleep, sort, start-stop-daemon, strings,
    switch_root, sync, sysctl, tail, tar, tee, telnet, test, tftp, time, top, touch, tr, traceroute, true, udhcpc, umount, uname, uniq, uptime, vconfig, vi, watchdog, wc, wget, which, xargs, yes, zcat

Flott! Men vær oppmerksom på at BusyBox-versjonen er 1.19.4. Dette er en veldig gammel versjon av BusyBox, utgitt i april 2012.

Så TP-Link slipper et fastvarebilde i 2019 ved hjelp av programvare (GCC-verktøykjede, kjerne, BusyBox, etc.) fra 2012!

Nå forstår du hvorfor jeg alltid installerer OpenWRT på ruterne mine?

Det er ikke alt

Binwalk kan også utføre entropianalyse, skrive ut råentropidata og generere entropigrafer. Vanligvis observeres større entropi når bytene i bildet er tilfeldige. Dette kan bety at bildet inneholder en kryptert, komprimert eller obfuskert fil. Hardcore krypteringsnøkkel? Hvorfor ikke.

Omvendt utvikling av en hjemmeruter ved hjelp av binwalk. Stoler du på ruterprogramvaren din?

Vi kan også bruke parameteren --raw for å finne en egendefinert råbytesekvens i et bilde eller en parameter --hexdump for å utføre en hex-dump som sammenligner to eller flere inndatafiler.

Egendefinerte signaturer kan legges til binwalk enten gjennom en egendefinert signaturfil spesifisert på kommandolinjen ved å bruke parameteren --magic, eller ved å legge dem til i katalogen $ HOME / .config / binwalk / magic.

Du finner mer informasjon om binwalk på offisiell dokumentasjon.

binwalk forlengelse

Det API binwalk, implementert som en Python-modul som kan brukes av et hvilket som helst Python-skript for å programmatisk utføre en binwalk-skanning, og binwalk-kommandolinjeverktøyet kan dupliseres nesten fullstendig med bare to linjer med Python-kode!

import binwalk
binwalk.scan()

Ved å bruke Python API kan du også lage Python-plugins å konfigurere og utvide binwalk.

Finnes også IDA-plugin og skyversjon Binwalk Pro.

Så hvorfor laster du ikke ned fastvarebildet fra Internett og prøver binwalk? Jeg lover at du kommer til å ha det mye moro :)

Kilde: www.habr.com

Legg til en kommentar