Inżynieria wsteczna routera domowego za pomocą programu Binwalk. Czy ufasz swojemu oprogramowaniu routera?

Inżynieria wsteczna routera domowego za pomocą programu Binwalk. Czy ufasz swojemu oprogramowaniu routera?

Kilka dni temu zdecydowałem się na inżynierię wsteczną oprogramowania sprzętowego mojego routera za pomocą programu Binwalk.

Kupiłem sobie Domowy router TP-Link Archer C7. Nie jest to najlepszy router, ale na moje potrzeby w zupełności wystarczający.

Za każdym razem, gdy kupuję nowy router, instaluję go OpenWRT. Po co? Z reguły producenci nie przejmują się zbytnio obsługą swoich routerów i z biegiem czasu oprogramowanie staje się przestarzałe, pojawiają się luki w zabezpieczeniach i tak dalej, ogólnie rzecz biorąc, rozumiesz. Dlatego wolę oprogramowanie OpenWRT, które jest dobrze obsługiwane przez społeczność open source.

Po pobraniu OpenWRT, ja również pobrałem najnowszy obraz oprogramowania sprzętowego pod moim nowym Archerem C7 z oficjalnej strony i postanowiłem to przeanalizować. Czysto dla zabawy i rozmów o binwalku.

Co to jest binwalk?

Binwalk to narzędzie typu open source do analizy, inżynierii wstecznej i ekstrakcji obrazu oprogramowania sprzętowego.

Stworzony w 2010 roku przez Craiga Heffnera, binwalk może skanować obrazy oprogramowania sprzętowego i znajdować pliki, identyfikować i wyodrębniać obrazy systemów plików, kod wykonywalny, skompresowane archiwa, programy ładujące i jądra, formaty plików takie jak JPEG i PDF i wiele więcej.

Możesz użyć programu Binwalk do przeprowadzenia inżynierii wstecznej oprogramowania sprzętowego, aby zrozumieć, jak ono działa. Przeszukuj pliki binarne pod kątem luk w zabezpieczeniach, wyodrębniaj pliki i szukaj backdoorów lub certyfikatów cyfrowych. Można również znaleźć opcodes dla kilku różnych procesorów.

Możesz wyodrębnić obrazy systemów plików, aby wyszukać określone pliki haseł (passwd, Shadow itp.) i spróbować złamać skróty haseł. Można przeprowadzić analizę binarną pomiędzy dwoma lub większą liczbą plików. Można przeprowadzić analizę entropii danych w celu wyszukania skompresowanych danych lub zakodowanych kluczy szyfrowania. Wszystko to bez konieczności dostępu do kodu źródłowego.

Ogólnie rzecz biorąc, jest tam wszystko, czego potrzebujesz :)

Jak działa binwalk?

Główną cechą binwalk jest skanowanie podpisów. Binwalk może skanować obraz oprogramowania sprzętowego w celu wyszukiwania różnych wbudowanych typów plików i systemów plików.

Czy znasz narzędzie wiersza poleceń file?

file /bin/bash
/bin/bash: ELF 64-bit LSB shared object, x86-64, version 1 (SYSV), dynamically linked, interpreter /lib64/l, for GNU/Linux 3.2.0, BuildID[sha1]=12f73d7a8e226c663034529c8dd20efec22dde54, stripped

Zespół filesprawdza nagłówek pliku i szuka podpisu (magicznej liczby), aby określić typ pliku. Na przykład, jeśli plik zaczyna się od sekwencji bajtów 0x89 0x50 0x4E 0x47 0x0D 0x0A 0x1A 0x0A, wie, że jest to plik PNG. NA Wikipedia Istnieje lista typowych podpisów plików.

Binwalk działa w ten sam sposób. Zamiast jednak szukać podpisów tylko na początku pliku, binwalk przeskanuje cały plik. Dodatkowo binwalk może wyodrębnić pliki znalezione na obrazie.

Narzędzia file и binwalk skorzystać z biblioteki libmagic do identyfikacji podpisów plików. Ale binwalk dodatkowo obsługuje listę niestandardowych magicznych podpisów do wyszukiwania skompresowanych/spakowanych plików, nagłówków oprogramowania sprzętowego, jąder Linuksa, programów ładujących, systemów plików i tak dalej.

Zabawmy się?

Instalacja Binwalk’a

Binwalk jest obsługiwany na wielu platformach, w tym Linux, OSX, FreeBSD i Windows.

Aby zainstalować najnowszą wersję binwalk, możesz pobierz kod źródłowy i podążaj Instrukcje Instalacji lub Szybka porada, dostępne na stronie internetowej projektu.

Binwalk ma wiele różnych parametrów:

$ binwalk

Binwalk v2.2.0
Craig Heffner, ReFirmLabs
https://github.com/ReFirmLabs/binwalk

Usage: binwalk [OPTIONS] [FILE1] [FILE2] [FILE3] ...

Signature Scan Options:
    -B, --signature              Scan target file(s) for common file signatures
    -R, --raw=<str>              Scan target file(s) for the specified sequence of bytes
    -A, --opcodes                Scan target file(s) for common executable opcode signatures
    -m, --magic=<file>           Specify a custom magic file to use
    -b, --dumb                   Disable smart signature keywords
    -I, --invalid                Show results marked as invalid
    -x, --exclude=<str>          Exclude results that match <str>
    -y, --include=<str>          Only show results that match <str>

Extraction Options:
    -e, --extract                Automatically extract known file types
    -D, --dd=<type:ext:cmd>      Extract <type> signatures, give the files an extension of <ext>, and execute <cmd>
    -M, --matryoshka             Recursively scan extracted files
    -d, --depth=<int>            Limit matryoshka recursion depth (default: 8 levels deep)
    -C, --directory=<str>        Extract files/folders to a custom directory (default: current working directory)
    -j, --size=<int>             Limit the size of each extracted file
    -n, --count=<int>            Limit the number of extracted files
    -r, --rm                     Delete carved files after extraction
    -z, --carve                  Carve data from files, but don't execute extraction utilities
    -V, --subdirs                Extract into sub-directories named by the offset

Entropy Options:
    -E, --entropy                Calculate file entropy
    -F, --fast                   Use faster, but less detailed, entropy analysis
    -J, --save                   Save plot as a PNG
    -Q, --nlegend                Omit the legend from the entropy plot graph
    -N, --nplot                  Do not generate an entropy plot graph
    -H, --high=<float>           Set the rising edge entropy trigger threshold (default: 0.95)
    -L, --low=<float>            Set the falling edge entropy trigger threshold (default: 0.85)

Binary Diffing Options:
    -W, --hexdump                Perform a hexdump / diff of a file or files
    -G, --green                  Only show lines containing bytes that are the same among all files
    -i, --red                    Only show lines containing bytes that are different among all files
    -U, --blue                   Only show lines containing bytes that are different among some files
    -u, --similar                Only display lines that are the same between all files
    -w, --terse                  Diff all files, but only display a hex dump of the first file

Raw Compression Options:
    -X, --deflate                Scan for raw deflate compression streams
    -Z, --lzma                   Scan for raw LZMA compression streams
    -P, --partial                Perform a superficial, but faster, scan
    -S, --stop                   Stop after the first result

General Options:
    -l, --length=<int>           Number of bytes to scan
    -o, --offset=<int>           Start scan at this file offset
    -O, --base=<int>             Add a base address to all printed offsets
    -K, --block=<int>            Set file block size
    -g, --swap=<int>             Reverse every n bytes before scanning
    -f, --log=<file>             Log results to file
    -c, --csv                    Log results to file in CSV format
    -t, --term                   Format output to fit the terminal window
    -q, --quiet                  Suppress output to stdout
    -v, --verbose                Enable verbose output
    -h, --help                   Show help output
    -a, --finclude=<str>         Only scan files whose names match this regex
    -p, --fexclude=<str>         Do not scan files whose names match this regex
    -s, --status=<int>           Enable the status server on the specified port

Skanowanie obrazu

Zacznijmy od wyszukania sygnatur plików wewnątrz obrazu (obrazek ze strony TP-Link).

Uruchamianie binwalk z parametrem --signature:

$ binwalk --signature --term archer-c7.bin

DECIMAL       HEXADECIMAL     DESCRIPTION
------------------------------------------------------------------------------------------
21876         0x5574          U-Boot version string, "U-Boot 1.1.4-g4480d5f9-dirty (May
                              20 2019 - 18:45:16)"
21940         0x55B4          CRC32 polynomial table, big endian
23232         0x5AC0          uImage header, header size: 64 bytes, header CRC:
                              0x386C2BD5, created: 2019-05-20 10:45:17, image size:
                              41162 bytes, Data Address: 0x80010000, Entry Point:
                              0x80010000, data CRC: 0xC9CD1E38, OS: Linux, CPU: MIPS,
                              image type: Firmware Image, compression type: lzma, image
                              name: "u-boot image"
23296         0x5B00          LZMA compressed data, properties: 0x5D, dictionary size:
                              8388608 bytes, uncompressed size: 97476 bytes
64968         0xFDC8          XML document, version: "1.0"
78448         0x13270         uImage header, header size: 64 bytes, header CRC:
                              0x78A267FF, created: 2019-07-26 07:46:14, image size:
                              1088500 bytes, Data Address: 0x80060000, Entry Point:
                              0x80060000, data CRC: 0xBB9D4F94, OS: Linux, CPU: MIPS,
                              image type: Multi-File Image, compression type: lzma,
                              image name: "MIPS OpenWrt Linux-3.3.8"
78520         0x132B8         LZMA compressed data, properties: 0x6D, dictionary size:
                              8388608 bytes, uncompressed size: 3164228 bytes
1167013       0x11CEA5        Squashfs filesystem, little endian, version 4.0,
                              compression:xz, size: 14388306 bytes, 2541 inodes,
                              blocksize: 65536 bytes, created: 2019-07-26 07:51:38
15555328      0xED5B00        gzip compressed data, from Unix, last modified: 2019-07-26
                              07:51:41

Teraz mamy wiele informacji na temat tego obrazu.

Używa obrazu Podwodny jako program ładujący (nagłówek obrazu pod adresem 0x5AC0 i skompresowany obraz bootloadera pod adresem 0x5B00). Na podstawie nagłówka uImage pod adresem 0x13270 wiemy, że architektura procesora to MIPS, a jądro Linuksa to wersja 3.3.8. I na podstawie obrazu znalezionego pod adresem 0x11CEA5, widzimy to rootfs jest systemem plików squashfs.

Wyodrębnijmy teraz bootloader (U-Boot) za pomocą polecenia dd:

$ dd if=archer-c7.bin of=u-boot.bin.lzma bs=1 skip=23296 count=41162
41162+0 records in
41162+0 records out
41162 bytes (41 kB, 40 KiB) copied, 0,0939608 s, 438 kB/s

Ponieważ obraz jest kompresowany przy użyciu LZMA, musimy go zdekompresować:

$ unlzma u-boot.bin.lzma

Teraz mamy obraz U-Boota:

$ ls -l u-boot.bin
-rw-rw-r-- 1 sprado sprado 97476 Fev  5 08:48 u-boot.bin

A co powiesz na znalezienie wartości domyślnej dla bootargs?

$ strings u-boot.bin | grep bootargs
bootargs
bootargs=console=ttyS0,115200 board=AP152 rootfstype=squashfs init=/etc/preinit mtdparts=spi0.0:128k(factory-uboot),192k(u-boot),64k(ART),1536k(uImage),14464k@0x1e0000(rootfs) mem=128M

Zmienna środowiskowa U-Boota bootargs używany do przekazywania parametrów do jądra Linuksa. Z powyższego lepiej rozumiemy pamięć flash urządzenia.

A co powiesz na wyodrębnienie obrazu jądra Linuksa?

$ dd if=archer-c7.bin of=uImage bs=1 skip=78448 count=1088572
1088572+0 records in
1088572+0 records out
1088572 bytes (1,1 MB, 1,0 MiB) copied, 1,68628 s, 646 kB/s

Za pomocą polecenia możemy sprawdzić, czy obraz został pomyślnie wyodrębniony file:

$ file uImage
uImage: u-boot legacy uImage, MIPS OpenWrt Linux-3.3.8, Linux/MIPS, Multi-File Image (lzma), 1088500 bytes, Fri Jul 26 07:46:14 2019, Load Address: 0x80060000, Entry Point: 0x80060000, Header CRC: 0x78A267FF, Data CRC: 0xBB9D4F94

Format pliku uImage to w zasadzie obraz jądra Linuksa z dodatkowym nagłówkiem. Usuńmy ten nagłówek, aby uzyskać ostateczny obraz jądra Linuksa:

$ dd if=uImage of=Image.lzma bs=1 skip=72
1088500+0 records in
1088500+0 records out
1088500 bytes (1,1 MB, 1,0 MiB) copied, 1,65603 s, 657 kB/s

Obraz jest skompresowany, więc go rozpakujmy:

$ unlzma Image.lzma

Teraz mamy obraz jądra Linuksa:

$ ls -la Image
-rw-rw-r-- 1 sprado sprado 3164228 Fev  5 10:51 Image

Co możemy zrobić z obrazem jądra? Moglibyśmy na przykład przeprowadzić wyszukiwanie ciągów znaków na obrazie i znaleźć wersję jądra Linuksa oraz poznać środowisko użyte do zbudowania jądra:

$ strings Image | grep "Linux version"
Linux version 3.3.8 (leo@leo-MS-7529) (gcc version 4.6.3 20120201 (prerelease) (Linaro GCC 4.6-2012.02) ) #1 Mon May 20 18:53:02 CST 2019

Mimo że oprogramowanie zostało wydane w zeszłym roku (2019), kiedy piszę ten artykuł, korzysta ze starej wersji jądra Linuksa (3.3.8) wydanej w 2012 r., skompilowanej z bardzo starą wersją GCC (4.6) również od 2012 r. !
(w przybliżeniu czy nadal ufasz swoim routerom w biurze i w domu?)

Z opcją --opcodes możemy również użyć binwalk do wyszukania instrukcji maszynowych i określenia architektury procesora obrazu:

$ binwalk --opcodes Image
DECIMAL       HEXADECIMAL     DESCRIPTION
--------------------------------------------------------------------------------
2400          0x960           MIPS instructions, function epilogue
2572          0xA0C           MIPS instructions, function epilogue
2828          0xB0C           MIPS instructions, function epilogue

A co z głównym systemem plików? Zamiast ręcznie wyodrębniać obraz, skorzystajmy z opcji binwalk --extract:

$ binwalk --extract --quiet archer-c7.bin

Cały główny system plików zostanie rozpakowany do podkatalogu:

$ cd _archer-c7.bin.extracted/squashfs-root/

$ ls
bin  dev  etc  lib  mnt  overlay  proc  rom  root  sbin  sys  tmp  usr  var  www

$ cat etc/banner
     MM           NM                    MMMMMMM          M       M
   $MMMMM        MMMMM                MMMMMMMMMMM      MMM     MMM
  MMMMMMMM     MM MMMMM.              MMMMM:MMMMMM:   MMMM   MMMMM
MMMM= MMMMMM  MMM   MMMM       MMMMM   MMMM  MMMMMM   MMMM  MMMMM'
MMMM=  MMMMM MMMM    MM       MMMMM    MMMM    MMMM   MMMMNMMMMM
MMMM=   MMMM  MMMMM          MMMMM     MMMM    MMMM   MMMMMMMM
MMMM=   MMMM   MMMMMM       MMMMM      MMMM    MMMM   MMMMMMMMM
MMMM=   MMMM     MMMMM,    NMMMMMMMM   MMMM    MMMM   MMMMMMMMMMM
MMMM=   MMMM      MMMMMM   MMMMMMMM    MMMM    MMMM   MMMM  MMMMMM
MMMM=   MMMM   MM    MMMM    MMMM      MMMM    MMMM   MMMM    MMMM
MMMM$ ,MMMMM  MMMMM  MMMM    MMM       MMMM   MMMMM   MMMM    MMMM
  MMMMMMM:      MMMMMMM     M         MMMMMMMMMMMM  MMMMMMM MMMMMMM
    MMMMMM       MMMMN     M           MMMMMMMMM      MMMM    MMMM
     MMMM          M                    MMMMMMM        M       M
       M
 ---------------------------------------------------------------
   For those about to rock... (%C, %R)
 ---------------------------------------------------------------

Teraz możemy robić mnóstwo różnych rzeczy.

Możemy wyszukiwać pliki konfiguracyjne, skróty haseł, klucze kryptograficzne i certyfikaty cyfrowe. Możemy analizować pliki binarne pod kątem rozwiązywanie problemów i podatności.

Z qemu и chroot możemy nawet uruchomić (emulować) plik wykonywalny z obrazu:

$ ls
bin  dev  etc  lib  mnt  overlay  proc  rom  root  sbin  sys  tmp  usr  var  www

$ cp /usr/bin/qemu-mips-static .

$ sudo chroot . ./qemu-mips-static bin/busybox
BusyBox v1.19.4 (2019-05-20 18:13:49 CST) multi-call binary.
Copyright (C) 1998-2011 Erik Andersen, Rob Landley, Denys Vlasenko
and others. Licensed under GPLv2.
See source distribution for full notice.

Usage: busybox [function] [arguments]...
   or: busybox --list[-full]
   or: function [arguments]...

    BusyBox is a multi-call binary that combines many common Unix
    utilities into a single executable.  Most people will create a
    link to busybox for each function they wish to use and BusyBox
    will act like whatever it was invoked as.

Currently defined functions:
    [, [[, addgroup, adduser, arping, ash, awk, basename, cat, chgrp, chmod, chown, chroot, clear, cmp, cp, crond, crontab, cut, date, dd, delgroup, deluser, dirname, dmesg, echo, egrep, env, expr, false,
    fgrep, find, free, fsync, grep, gunzip, gzip, halt, head, hexdump, hostid, id, ifconfig, init, insmod, kill, killall, klogd, ln, lock, logger, ls, lsmod, mac_addr, md5sum, mkdir, mkfifo, mknod, mktemp,
    mount, mv, nice, passwd, pgrep, pidof, ping, ping6, pivot_root, poweroff, printf, ps, pwd, readlink, reboot, reset, rm, rmdir, rmmod, route, sed, seq, sh, sleep, sort, start-stop-daemon, strings,
    switch_root, sync, sysctl, tail, tar, tee, telnet, test, tftp, time, top, touch, tr, traceroute, true, udhcpc, umount, uname, uniq, uptime, vconfig, vi, watchdog, wc, wget, which, xargs, yes, zcat

Świetnie! Należy jednak pamiętać, że wersja BusyBox to 1.19.4. To jest bardzo stara wersja BusyBox, wydany w kwietniu 2012 roku.

Dlatego TP-Link wypuszcza obraz oprogramowania sprzętowego w 2019 r., korzystając z oprogramowania (łańcuch narzędzi GCC, jądro, BusyBox itp.) z 2012 r.!

Czy teraz rozumiesz, dlaczego zawsze instaluję OpenWRT na moich routerach?

To nie wszystko

Binwalk może również przeprowadzać analizę entropii, drukować surowe dane dotyczące entropii i generować wykresy entropii. Zazwyczaj większą entropię obserwuje się, gdy bajty obrazu są losowe. Może to oznaczać, że obraz zawiera zaszyfrowany, skompresowany lub zaciemniony plik. Hardkorowy klucz szyfrujący? Dlaczego nie.

Inżynieria wsteczna routera domowego za pomocą programu Binwalk. Czy ufasz swojemu oprogramowaniu routera?

Możemy również użyć parametru --raw aby znaleźć niestandardową sekwencję surowych bajtów w obrazie lub parametrze --hexdump aby wykonać zrzut szesnastkowy porównujący dwa lub więcej plików wejściowych.

Niestandardowe podpisy można dodać do binwalk poprzez niestandardowy plik podpisu określony w wierszu poleceń za pomocą parametru --magiclub dodając je do katalogu $ HOME / .config / binwalk / magic.

Więcej informacji na temat Binwalk można znaleźć pod adresem oficjalna dokumentacja.

rozszerzenie Binwalk

tam API binwalk, zaimplementowany jako moduł Pythona, który może być używany przez dowolny skrypt Pythona do programowego wykonywania skanowania binwalk, a narzędzie wiersza poleceń binwalk można prawie całkowicie zduplikować za pomocą zaledwie dwóch linijek kodu Pythona!

import binwalk
binwalk.scan()

Korzystając z API Pythona możesz także tworzyć Wtyczki do Pythona aby skonfigurować i rozszerzyć binwalk.

Istnieje również wtyczka IDA i wersja w chmurze Binwalk Pro.

Dlaczego więc nie pobierzesz obrazu oprogramowania sprzętowego z Internetu i nie wypróbujesz programu Binwalk? Obiecuję, że będziesz się dobrze bawić :)

Źródło: www.habr.com

Dodaj komentarz