Реверс-інжиніринг домашнього роутера за допомогою binwalk. Довіряєте софту свого роутера?

Реверс-інжиніринг домашнього роутера за допомогою binwalk. Довіряєте софту свого роутера?

Кілька днів тому я вирішив провести реверс-інжиніринг прошивки свого роутера використовуючи binwalk.

Я купив собі TP-Link Archer C7 home router. Не найкращий роутер, але для моїх потреб цілком вистачає.

Щоразу коли я купую новий роутер, я встановлюю OpenWRT. Навіщо? Як правило, виробники не сильно дбають про підтримку своїх роутерів і згодом софт застаріває, з'являються вразливості і так далі, загалом ви зрозуміли. Тому я віддаю перевагу прошивці OpenWRT, що добре підтримується спільнотою open-source.

Завантаживши собі OpenWRT, я так само скачав останній образ прошивки під мій новий Archer C7 з офіційного сайту та вирішив проаналізувати його. Чисто заради фана і розповісти про binwalk.

Що таке binwalk?

Binwalk — це інструмент із відкритим вихідним кодом для аналізу, реверс-інжинірингу та вилучення образів прошивок.

Створений у 2010 році Крейгом Хеффнером, binwalk може сканувати образи прошивок та знаходити файли, ідентифікувати та вилучати образи файлової системи, виконуваний код, стислі архіви, завантажувачі та ядра, формати файлів, такі як JPEG та PDF, та багато іншого.

Ви можете використовувати binwalk для реверс-інжинірингу прошивки для того, щоб зрозуміти як вона влаштована. Шукати в бінарних файлах уразливості, витягувати файли та шукати бекдори чи цифрові сертифікати. Можна також знайти opcodes для купи різних CPU.

Ви можете розпакувати образи файлової системи для пошуку певних файлів паролів (passwd, shadow і т.д.) та спробувати зламати хеші паролів. Ви можете виконати двійковий аналіз між двома або більше файлами. Ви можете здійснити аналіз ентропії даних для пошуку стислих даних або закодованих ключів шифрування. Все це без необхідності доступу до вихідного коду.

Загалом все, що потрібно, є 🙂

Як працює binwalk?

Основною особливістю binwalk є його сигнатурне сканування. Binwalk може сканувати образ прошивки для пошуку різних вбудованих типів файлів та файлових систем.

Ви знаєте утиліту командного рядка file?

file /bin/bash
/bin/bash: ELF 64-bit LSB shared object, x86-64, version 1 (SYSV), dynamically linked, interpreter /lib64/l, for GNU/Linux 3.2.0, BuildID[sha1]=12f73d7a8e226c663034529c8dd20efec22dde54, stripped

Команда fileдивиться на заголовок файлу та шукає підпис (магічне число), щоб визначити тип файлу. Наприклад, якщо файл починається з послідовності байтів 0x89 0x50 0x4E 0x47 0x0D 0x0A 0x1A 0x0Aвона знає, що це файл PNG. на Вікіпедії є список найпоширеніших підписів файлів.

Binwalk працює так само. Але замість того, щоб шукати підписи тільки на початку файлу, binwalk скануватиме весь файл. Крім того, binwalk може отримати файли, знайдені в образі.

Інструменти file и binwalk використовують бібліотеку libmagic для визначення підписів файлів. Але binwalk додатково підтримує список магічних сигнатур для пошуку стислих / заархівованих файлів, заголовків прошивок, ядер Linux, завантажувачів, файлових систем і так далі.

Давайте повеселимося?

Встановлення binwalk

Binwalk підтримується на кількох платформах, включаючи Linux, OSX, FreeBSD та Windows.

Щоб встановити останню версію binwalk, ви можете завантажити вихідний код і слідувати інструкції встановлення або короткому керівництву, доступний на веб-сайті проекту.

Binwalk має багато різних параметрів:

$ binwalk

Binwalk v2.2.0
Craig Heffner, ReFirmLabs
https://github.com/ReFirmLabs/binwalk

Usage: binwalk [OPTIONS] [FILE1] [FILE2] [FILE3] ...

Signature Scan Options:
    -B, --signature              Scan target file(s) for common file signatures
    -R, --raw=<str>              Scan target file(s) for the specified sequence of bytes
    -A, --opcodes                Scan target file(s) for common executable opcode signatures
    -m, --magic=<file>           Specify a custom magic file to use
    -b, --dumb                   Disable smart signature keywords
    -I, --invalid                Show results marked as invalid
    -x, --exclude=<str>          Exclude results that match <str>
    -y, --include=<str>          Only show results that match <str>

Extraction Options:
    -e, --extract                Automatically extract known file types
    -D, --dd=<type:ext:cmd>      Extract <type> signatures, give the files an extension of <ext>, and execute <cmd>
    -M, --matryoshka             Recursively scan extracted files
    -d, --depth=<int>            Limit matryoshka recursion depth (default: 8 levels deep)
    -C, --directory=<str>        Extract files/folders to a custom directory (default: current working directory)
    -j, --size=<int>             Limit the size of each extracted file
    -n, --count=<int>            Limit the number of extracted files
    -r, --rm                     Delete carved files after extraction
    -z, --carve                  Carve data from files, but don't execute extraction utilities
    -V, --subdirs                Extract into sub-directories named by the offset

Entropy Options:
    -E, --entropy                Calculate file entropy
    -F, --fast                   Use faster, but less detailed, entropy analysis
    -J, --save                   Save plot as a PNG
    -Q, --nlegend                Omit the legend from the entropy plot graph
    -N, --nplot                  Do not generate an entropy plot graph
    -H, --high=<float>           Set the rising edge entropy trigger threshold (default: 0.95)
    -L, --low=<float>            Set the falling edge entropy trigger threshold (default: 0.85)

Binary Diffing Options:
    -W, --hexdump                Perform a hexdump / diff of a file or files
    -G, --green                  Only show lines containing bytes that are the same among all files
    -i, --red                    Only show lines containing bytes that are different among all files
    -U, --blue                   Only show lines containing bytes that are different among some files
    -u, --similar                Only display lines that are the same between all files
    -w, --terse                  Diff all files, but only display a hex dump of the first file

Raw Compression Options:
    -X, --deflate                Scan for raw deflate compression streams
    -Z, --lzma                   Scan for raw LZMA compression streams
    -P, --partial                Perform a superficial, but faster, scan
    -S, --stop                   Stop after the first result

General Options:
    -l, --length=<int>           Number of bytes to scan
    -o, --offset=<int>           Start scan at this file offset
    -O, --base=<int>             Add a base address to all printed offsets
    -K, --block=<int>            Set file block size
    -g, --swap=<int>             Reverse every n bytes before scanning
    -f, --log=<file>             Log results to file
    -c, --csv                    Log results to file in CSV format
    -t, --term                   Format output to fit the terminal window
    -q, --quiet                  Suppress output to stdout
    -v, --verbose                Enable verbose output
    -h, --help                   Show help output
    -a, --finclude=<str>         Only scan files whose names match this regex
    -p, --fexclude=<str>         Do not scan files whose names match this regex
    -s, --status=<int>           Enable the status server on the specified port

Сканування образів

Почнемо з пошуку сигнатур файлів усередині образу (образ із сайту TP-Link).

Запуск binwalk з параметром -signature:

$ binwalk --signature --term archer-c7.bin

DECIMAL       HEXADECIMAL     DESCRIPTION
------------------------------------------------------------------------------------------
21876         0x5574          U-Boot version string, "U-Boot 1.1.4-g4480d5f9-dirty (May
                              20 2019 - 18:45:16)"
21940         0x55B4          CRC32 polynomial table, big endian
23232         0x5AC0          uImage header, header size: 64 bytes, header CRC:
                              0x386C2BD5, created: 2019-05-20 10:45:17, image size:
                              41162 bytes, Data Address: 0x80010000, Entry Point:
                              0x80010000, data CRC: 0xC9CD1E38, OS: Linux, CPU: MIPS,
                              image type: Firmware Image, compression type: lzma, image
                              name: "u-boot image"
23296         0x5B00          LZMA compressed data, properties: 0x5D, dictionary size:
                              8388608 bytes, uncompressed size: 97476 bytes
64968         0xFDC8          XML document, version: "1.0"
78448         0x13270         uImage header, header size: 64 bytes, header CRC:
                              0x78A267FF, created: 2019-07-26 07:46:14, image size:
                              1088500 bytes, Data Address: 0x80060000, Entry Point:
                              0x80060000, data CRC: 0xBB9D4F94, OS: Linux, CPU: MIPS,
                              image type: Multi-File Image, compression type: lzma,
                              image name: "MIPS OpenWrt Linux-3.3.8"
78520         0x132B8         LZMA compressed data, properties: 0x6D, dictionary size:
                              8388608 bytes, uncompressed size: 3164228 bytes
1167013       0x11CEA5        Squashfs filesystem, little endian, version 4.0,
                              compression:xz, size: 14388306 bytes, 2541 inodes,
                              blocksize: 65536 bytes, created: 2019-07-26 07:51:38
15555328      0xED5B00        gzip compressed data, from Unix, last modified: 2019-07-26
                              07:51:41

Тепер у нас багато інформації про цей образ.

Образ використовує підводний човен як завантажувач (заголовок образу за адресою 0x5AC0 та стислий образ завантажувача за адресою 0x5B00). На основі заголовку uImage за адресою 0x13270, ми знаємо, що архітектура процесора — MIPS, а ядро ​​Linux — версія 3.3.8. І на підставі образу, знайденого за адресою 0x11CEA5, ми можемо бачити, що rootfs є файловою системою squashfs.

Давайте тепер розпакуємо завантажувач (U-Boot) за допомогою команди dd:

$ dd if=archer-c7.bin of=u-boot.bin.lzma bs=1 skip=23296 count=41162
41162+0 records in
41162+0 records out
41162 bytes (41 kB, 40 KiB) copied, 0,0939608 s, 438 kB/s

Оскільки образ стиснутий за допомогою LZMA, нам потрібно розпакувати його:

$ unlzma u-boot.bin.lzma

Тепер у нас є образ U-Boot:

$ ls -l u-boot.bin
-rw-rw-r-- 1 sprado sprado 97476 Fev  5 08:48 u-boot.bin

Як щодо пошуку дефолтного значення для bootargs?

$ strings u-boot.bin | grep bootargs
bootargs
bootargs=console=ttyS0,115200 board=AP152 rootfstype=squashfs init=/etc/preinit mtdparts=spi0.0:128k(factory-uboot),192k(u-boot),64k(ART),1536k(uImage),14464k@0x1e0000(rootfs) mem=128M

Змінне оточення U-Boot bootargs використовується передачі параметрів ядру Linux. І з вищенаведеного ми краще розуміємо флеш-пам'ять пристрою.

Як щодо отримання образа ядра Linux?

$ dd if=archer-c7.bin of=uImage bs=1 skip=78448 count=1088572
1088572+0 records in
1088572+0 records out
1088572 bytes (1,1 MB, 1,0 MiB) copied, 1,68628 s, 646 kB/s

Ми можемо перевірити, що образ було успішно вилучено за допомогою команди file:

$ file uImage
uImage: u-boot legacy uImage, MIPS OpenWrt Linux-3.3.8, Linux/MIPS, Multi-File Image (lzma), 1088500 bytes, Fri Jul 26 07:46:14 2019, Load Address: 0x80060000, Entry Point: 0x80060000, Header CRC: 0x78A267FF, Data CRC: 0xBB9D4F94

Формат файлу uImage – це в основному образ ядра Linux із додатковим заголовком. Давайте видалимо цей заголовок, щоб отримати остаточний образ ядра Linux:

$ dd if=uImage of=Image.lzma bs=1 skip=72
1088500+0 records in
1088500+0 records out
1088500 bytes (1,1 MB, 1,0 MiB) copied, 1,65603 s, 657 kB/s

Образ стиснутий, тому розпакуємо його:

$ unlzma Image.lzma

Тепер у нас є образ ядра Linux:

$ ls -la Image
-rw-rw-r-- 1 sprado sprado 3164228 Fev  5 10:51 Image

Що ми можемо зробити із образом ядра? Ми могли б, наприклад, зробити пошук по рядках в образі і знайти версію ядра Linux і дізнатися про навколишнє середовище, що використовується для збирання ядра:

$ strings Image | grep "Linux version"
Linux version 3.3.8 (leo@leo-MS-7529) (gcc version 4.6.3 20120201 (prerelease) (Linaro GCC 4.6-2012.02) ) #1 Mon May 20 18:53:02 CST 2019

Незважаючи на те, що прошивка була випущена минулого року (2019 р.), коли я пишу цю статтю, вона використовує стару версію ядра Linux (3.3.8), випущену в 2012 р., скомпільовану з дуже старою версією GCC (4.6) також із 2012 р.!
(прим. перекл. ще довіряєте своїм роутерам в офісі та вдома?)

З опцією --opcodes ми також можемо використовувати binwalk для пошуку машинних інструкцій та визначення архітектури процесора образу:

$ binwalk --opcodes Image
DECIMAL       HEXADECIMAL     DESCRIPTION
--------------------------------------------------------------------------------
2400          0x960           MIPS instructions, function epilogue
2572          0xA0C           MIPS instructions, function epilogue
2828          0xB0C           MIPS instructions, function epilogue

Як щодо кореневої файлової системи? Замість того, щоб витягувати образ вручну, давайте скористаємося опцією binwalk --extract:

$ binwalk --extract --quiet archer-c7.bin

Повна коренева файлова система буде вилучена в підкаталог:

$ cd _archer-c7.bin.extracted/squashfs-root/

$ ls
bin  dev  etc  lib  mnt  overlay  proc  rom  root  sbin  sys  tmp  usr  var  www

$ cat etc/banner
     MM           NM                    MMMMMMM          M       M
   $MMMMM        MMMMM                MMMMMMMMMMM      MMM     MMM
  MMMMMMMM     MM MMMMM.              MMMMM:MMMMMM:   MMMM   MMMMM
MMMM= MMMMMM  MMM   MMMM       MMMMM   MMMM  MMMMMM   MMMM  MMMMM'
MMMM=  MMMMM MMMM    MM       MMMMM    MMMM    MMMM   MMMMNMMMMM
MMMM=   MMMM  MMMMM          MMMMM     MMMM    MMMM   MMMMMMMM
MMMM=   MMMM   MMMMMM       MMMMM      MMMM    MMMM   MMMMMMMMM
MMMM=   MMMM     MMMMM,    NMMMMMMMM   MMMM    MMMM   MMMMMMMMMMM
MMMM=   MMMM      MMMMMM   MMMMMMMM    MMMM    MMMM   MMMM  MMMMMM
MMMM=   MMMM   MM    MMMM    MMMM      MMMM    MMMM   MMMM    MMMM
MMMM$ ,MMMMM  MMMMM  MMMM    MMM       MMMM   MMMMM   MMMM    MMMM
  MMMMMMM:      MMMMMMM     M         MMMMMMMMMMMM  MMMMMMM MMMMMMM
    MMMMMM       MMMMN     M           MMMMMMMMM      MMMM    MMMM
     MMMM          M                    MMMMMMM        M       M
       M
 ---------------------------------------------------------------
   For those about to rock... (%C, %R)
 ---------------------------------------------------------------

Тепер ми можемо зробити багато різного.

Ми можемо шукати конфігураційні файли, хеші паролів, криптографічні ключі та цифрові сертифікати. Ми можемо проаналізувати бінарні файли для пошуку помилок та вразливостей.

За допомогою qemu и chroot ми можемо навіть запустити (емулювати) файл, що виконується з образу:

$ ls
bin  dev  etc  lib  mnt  overlay  proc  rom  root  sbin  sys  tmp  usr  var  www

$ cp /usr/bin/qemu-mips-static .

$ sudo chroot . ./qemu-mips-static bin/busybox
BusyBox v1.19.4 (2019-05-20 18:13:49 CST) multi-call binary.
Copyright (C) 1998-2011 Erik Andersen, Rob Landley, Denys Vlasenko
and others. Licensed under GPLv2.
See source distribution for full notice.

Usage: busybox [function] [arguments]...
   or: busybox --list[-full]
   or: function [arguments]...

    BusyBox is a multi-call binary that combines many common Unix
    utilities into a single executable.  Most people will create a
    link to busybox for each function they wish to use and BusyBox
    will act like whatever it was invoked as.

Currently defined functions:
    [, [[, addgroup, adduser, arping, ash, awk, basename, cat, chgrp, chmod, chown, chroot, clear, cmp, cp, crond, crontab, cut, date, dd, delgroup, deluser, dirname, dmesg, echo, egrep, env, expr, false,
    fgrep, find, free, fsync, grep, gunzip, gzip, halt, head, hexdump, hostid, id, ifconfig, init, insmod, kill, killall, klogd, ln, lock, logger, ls, lsmod, mac_addr, md5sum, mkdir, mkfifo, mknod, mktemp,
    mount, mv, nice, passwd, pgrep, pidof, ping, ping6, pivot_root, poweroff, printf, ps, pwd, readlink, reboot, reset, rm, rmdir, rmmod, route, sed, seq, sh, sleep, sort, start-stop-daemon, strings,
    switch_root, sync, sysctl, tail, tar, tee, telnet, test, tftp, time, top, touch, tr, traceroute, true, udhcpc, umount, uname, uniq, uptime, vconfig, vi, watchdog, wc, wget, which, xargs, yes, zcat

Здорово! Але зверніть увагу, що версія BusyBox - 1.19.4. Це дуже стара версія BusyBox, випущена у квітні 2012 року.

Таким чином, TP-Link випускає образ прошивки у 2019 році з використанням програмного забезпечення (GCC toolchain, kernel, BusyBox тощо) 2012 року!

Тепер ви знаєте, чому я завжди встановлюю OpenWRT на свої роутери?

Це ще не все

Binwalk також може виконувати ентропійний аналіз, друкувати необроблені ентропійні дані та генерувати ентропійні графіки. Зазвичай велика ентропія спостерігається, коли байти образі випадкові. Це може означати, що зображення містить зашифрований, стислий або обфузований файл. Хардкорно прописаний ключ шифрування? Чому б і ні.

Реверс-інжиніринг домашнього роутера за допомогою binwalk. Довіряєте софту свого роутера?

Ми також можемо використовувати параметр --raw для пошуку послідовності необроблених байтів в образі або параметр --hexdump для виконання шістнадцяткового дампа, що порівнює два або більше вхідних файлів.

Користувацькі сигнатури можуть бути додані в binwalk або через файл сигнатур, вказаний в командному рядку за допомогою параметра --magicабо шляхом додавання їх до каталогу $ HOME / .config / binwalk / magic.

Ви можете знайти більше інформації про binwalk в офіційної документації.

Розширення binwalk

Існує API-інтерфейс binwalk, реалізований у вигляді модуля Python, який може використовуватися будь-яким скриптом Python для програмного виконання сканування binwalk, а утиліта командного рядка binwalk може бути майже повністю продубльована лише двома рядками коду Python!

import binwalk
binwalk.scan()

За допомогою Python API ви також можете створювати плагіни під Python для налаштування та розширення binwalk.

також існує плагін IDA та хмарна версія Binwalk Pro.

Так чому б ви не завантажити образ прошивки з Інтернету і не спробувати binwalk? Обіцяю вам буде дуже весело 🙂

Джерело: habr.com

Додати коментар або відгук