Рэверс-інжынірынг хатняга роўтара з дапамогай binwalk. Давяраеце софту свайго роўтара?

Рэверс-інжынірынг хатняга роўтара з дапамогай binwalk. Давяраеце софту свайго роўтара?

Некалькі дзён таму, я вырашыў правесці рэверс-інжынірынг прашыўкі свайго роўтара выкарыстоўваючы binwalk.

Я купіў сабе TP-Link Archer C7 home router. Не самы лепшы роўтэр, але для маіх патрэб суцэль хапае.

Кожны раз, калі я купляю новы роўтэр, я ўсталёўваю OpenWRT. Навошта? Як правіла вытворцы не моцна клапоцяцца аб падтрымцы сваіх роўтэраў і з часам софт састарваецца, з'яўляюцца ўразлівасці і гэтак далей, увогуле вы зразумелі. Таму я аддаю перавагу добра падтрымоўваную супольнасцю open-source прашыўку OpenWRT.

Запампаваўшы сабе OpenWRT, я гэтак жа запампаваў апошнюю выяву прашыўкі пад мой новы Archer C7 з афіцыйнага сайта і вырашыў прааналізаваць яго Чыста дзеля фана і расказаць пра binwalk.

Што такое binwalk?

Binwalk - Гэта прылада з адкрытым зыходным кодам для аналізу, рэверс-інжынірынгу і вымання выяў прашывак.

Створаны ў 2010 годзе Крэйгам Хефнерам, binwalk можа сканаваць вобразы прашывак і знаходзіць файлы, ідэнтыфікаваць і здабываць вобразы файлавай сістэмы, выкананы код, сціснутыя архівы, загрузнікі і ядры, фарматы файлаў, такія як JPEG і PDF, і многае іншае.

Вы можаце выкарыстоўваць binwalk для рэверс-інжынірынгу прашыўкі для таго, што б зразумець як яна ўладкована. Шукаць у бінарных файлах уразлівасці, здабываць файлы і шукаць бэкдоры або лічбавыя сертыфікаты. Можна таксама знайсці opcodes для кучы розных CPU.

Вы можаце распакаваць выявы файлавай сістэмы для пошуку вызначаных файлаў пароляў (passwd, shadow і г.д.) І паспрабаваць зламаць хэшы пароляў. Вы можаце выканаць двайковы аналіз паміж двума ці больш файламі. Вы можаце выканаць аналіз энтрапіі дадзеных для пошуку сціснутых дадзеных ці закадаваных ключоў шыфравання. Усё гэта без неабходнасці доступу да зыходнага кода.

Увогуле, усё, што неабходна, ёсць 🙂

Як працуе binwalk?

Асноўнай асаблівасцю binwalk з'яўляецца яго сігнатурнае сканаванне. Binwalk можа сканаваць выяву прашыўкі для пошуку розных убудаваных тыпаў файлаў і файлавых сістэм.

Вы ведаеце ўтыліту каманднага радка file?

file /bin/bash
/bin/bash: ELF 64-bit LSB shared object, x86-64, version 1 (SYSV), dynamically linked, interpreter /lib64/l, for GNU/Linux 3.2.0, BuildID[sha1]=12f73d7a8e226c663034529c8dd20efec22dde54, stripped

Каманда fileглядзіць на загаловак файла і шукае подпіс (магічны лік), каб вызначыць тып файла. Напрыклад, калі файл пачынаецца з паслядоўнасці байтаў 0x89 0x50 0x4E 0x47 0x0D 0x0A 0x1A 0x0A, яна ведае, што гэта файл PNG. На Вікіпедыі ёсць спіс распаўсюджаных подпісаў файлаў.

Binwalk працуе гэтак жа. Але замест таго, каб шукаць подпісы толькі ў пачатку файла, binwalk будзе сканаваць увесь файл. Акрамя таго, binwalk можа атрымаць файлы, знойдзеныя ў выяве.

Інструменты file и binwalk выкарыстоўваюць бібліятэку libmagic для ідэнтыфікацыі подпісаў файлаў. Але binwalk дадаткова падтрымлівае спіс карыстацкіх магічных сігнатур для пошуку сціснутых / заархіваваных файлаў, загалоўкаў прашывак, ядраў Linux, загрузнікаў, файлавых сістэм і гэтак далей.

Давайце павесялімся?

Ўстаноўка binwalk

Binwalk падтрымліваецца на некалькіх платформах, у тым ліку Linux, OSX, FreeBSD і Windows.

Каб усталяваць апошнюю версію binwalk, вы можаце загрузіць зыходны код і прытрымлівацца інструкцыі ўстаноўкі або кароткаму кіраўніцтву, даступнаму на вэб-сайце праекта.

У Binwalk шмат розных параметраў:

$ binwalk

Binwalk v2.2.0
Craig Heffner, ReFirmLabs
https://github.com/ReFirmLabs/binwalk

Usage: binwalk [OPTIONS] [FILE1] [FILE2] [FILE3] ...

Signature Scan Options:
    -B, --signature              Scan target file(s) for common file signatures
    -R, --raw=<str>              Scan target file(s) for the specified sequence of bytes
    -A, --opcodes                Scan target file(s) for common executable opcode signatures
    -m, --magic=<file>           Specify a custom magic file to use
    -b, --dumb                   Disable smart signature keywords
    -I, --invalid                Show results marked as invalid
    -x, --exclude=<str>          Exclude results that match <str>
    -y, --include=<str>          Only show results that match <str>

Extraction Options:
    -e, --extract                Automatically extract known file types
    -D, --dd=<type:ext:cmd>      Extract <type> signatures, give the files an extension of <ext>, and execute <cmd>
    -M, --matryoshka             Recursively scan extracted files
    -d, --depth=<int>            Limit matryoshka recursion depth (default: 8 levels deep)
    -C, --directory=<str>        Extract files/folders to a custom directory (default: current working directory)
    -j, --size=<int>             Limit the size of each extracted file
    -n, --count=<int>            Limit the number of extracted files
    -r, --rm                     Delete carved files after extraction
    -z, --carve                  Carve data from files, but don't execute extraction utilities
    -V, --subdirs                Extract into sub-directories named by the offset

Entropy Options:
    -E, --entropy                Calculate file entropy
    -F, --fast                   Use faster, but less detailed, entropy analysis
    -J, --save                   Save plot as a PNG
    -Q, --nlegend                Omit the legend from the entropy plot graph
    -N, --nplot                  Do not generate an entropy plot graph
    -H, --high=<float>           Set the rising edge entropy trigger threshold (default: 0.95)
    -L, --low=<float>            Set the falling edge entropy trigger threshold (default: 0.85)

Binary Diffing Options:
    -W, --hexdump                Perform a hexdump / diff of a file or files
    -G, --green                  Only show lines containing bytes that are the same among all files
    -i, --red                    Only show lines containing bytes that are different among all files
    -U, --blue                   Only show lines containing bytes that are different among some files
    -u, --similar                Only display lines that are the same between all files
    -w, --terse                  Diff all files, but only display a hex dump of the first file

Raw Compression Options:
    -X, --deflate                Scan for raw deflate compression streams
    -Z, --lzma                   Scan for raw LZMA compression streams
    -P, --partial                Perform a superficial, but faster, scan
    -S, --stop                   Stop after the first result

General Options:
    -l, --length=<int>           Number of bytes to scan
    -o, --offset=<int>           Start scan at this file offset
    -O, --base=<int>             Add a base address to all printed offsets
    -K, --block=<int>            Set file block size
    -g, --swap=<int>             Reverse every n bytes before scanning
    -f, --log=<file>             Log results to file
    -c, --csv                    Log results to file in CSV format
    -t, --term                   Format output to fit the terminal window
    -q, --quiet                  Suppress output to stdout
    -v, --verbose                Enable verbose output
    -h, --help                   Show help output
    -a, --finclude=<str>         Only scan files whose names match this regex
    -p, --fexclude=<str>         Do not scan files whose names match this regex
    -s, --status=<int>           Enable the status server on the specified port

Сканіраванне вобразаў

Пачнём з пошуку сігнатур файлаў усярэдзіне выявы (вобраз з сайта TP-Link).

Запуск binwalk з параметрам -signature:

$ binwalk --signature --term archer-c7.bin

DECIMAL       HEXADECIMAL     DESCRIPTION
------------------------------------------------------------------------------------------
21876         0x5574          U-Boot version string, "U-Boot 1.1.4-g4480d5f9-dirty (May
                              20 2019 - 18:45:16)"
21940         0x55B4          CRC32 polynomial table, big endian
23232         0x5AC0          uImage header, header size: 64 bytes, header CRC:
                              0x386C2BD5, created: 2019-05-20 10:45:17, image size:
                              41162 bytes, Data Address: 0x80010000, Entry Point:
                              0x80010000, data CRC: 0xC9CD1E38, OS: Linux, CPU: MIPS,
                              image type: Firmware Image, compression type: lzma, image
                              name: "u-boot image"
23296         0x5B00          LZMA compressed data, properties: 0x5D, dictionary size:
                              8388608 bytes, uncompressed size: 97476 bytes
64968         0xFDC8          XML document, version: "1.0"
78448         0x13270         uImage header, header size: 64 bytes, header CRC:
                              0x78A267FF, created: 2019-07-26 07:46:14, image size:
                              1088500 bytes, Data Address: 0x80060000, Entry Point:
                              0x80060000, data CRC: 0xBB9D4F94, OS: Linux, CPU: MIPS,
                              image type: Multi-File Image, compression type: lzma,
                              image name: "MIPS OpenWrt Linux-3.3.8"
78520         0x132B8         LZMA compressed data, properties: 0x6D, dictionary size:
                              8388608 bytes, uncompressed size: 3164228 bytes
1167013       0x11CEA5        Squashfs filesystem, little endian, version 4.0,
                              compression:xz, size: 14388306 bytes, 2541 inodes,
                              blocksize: 65536 bytes, created: 2019-07-26 07:51:38
15555328      0xED5B00        gzip compressed data, from Unix, last modified: 2019-07-26
                              07:51:41

Цяпер у нас шмат інфармацыі аб гэтым вобразе.

Выява выкарыстоўвае падводная лодка у якасці загрузніка (загаловак выявы па адрасе 0x5AC0 і сціснутая выява загрузніка па адрасе 0x5B00). Грунтуючыся на загалоўку uImage па адрасе 0x13270, мы ведаем, што архітэктура працэсара – MIPS, а ядро ​​Linux – версія 3.3.8. І на падставе выявы, знойдзенай па адрасе 0x11CEA5, мы можам бачыць, што rootfs з'яўляецца файлавай сістэмай squashfs.

Давайце зараз распакуем загрузнік (U-Boot) з дапамогай каманды dd:

$ dd if=archer-c7.bin of=u-boot.bin.lzma bs=1 skip=23296 count=41162
41162+0 records in
41162+0 records out
41162 bytes (41 kB, 40 KiB) copied, 0,0939608 s, 438 kB/s

Паколькі выява сціснуты з дапамогай LZMA, нам трэба распакаваць яго:

$ unlzma u-boot.bin.lzma

Цяпер у нас ёсць вобраз U-Boot:

$ ls -l u-boot.bin
-rw-rw-r-- 1 sprado sprado 97476 Fev  5 08:48 u-boot.bin

Як наконт пошуку дэфолтнага значэння для bootargs?

$ strings u-boot.bin | grep bootargs
bootargs
bootargs=console=ttyS0,115200 board=AP152 rootfstype=squashfs init=/etc/preinit mtdparts=spi0.0:128k(factory-uboot),192k(u-boot),64k(ART),1536k(uImage),14464k@0x1e0000(rootfs) mem=128M

Пераменная асяроддзя U-Boot bootargs выкарыстоўваецца для перадачы параметраў ядру Linux. І з вышэйпрыведзенага мы лепш разумеем флэш-памяць прылады.

Як наконт вымання выявы ядра Linux?

$ dd if=archer-c7.bin of=uImage bs=1 skip=78448 count=1088572
1088572+0 records in
1088572+0 records out
1088572 bytes (1,1 MB, 1,0 MiB) copied, 1,68628 s, 646 kB/s

Мы можам праверыць, што выява была паспяхова вынята з дапамогай каманды file:

$ file uImage
uImage: u-boot legacy uImage, MIPS OpenWrt Linux-3.3.8, Linux/MIPS, Multi-File Image (lzma), 1088500 bytes, Fri Jul 26 07:46:14 2019, Load Address: 0x80060000, Entry Point: 0x80060000, Header CRC: 0x78A267FF, Data CRC: 0xBB9D4F94

Фармат файла uImage - гэта галоўным чынам выява ядра Linux з дадатковым загалоўкам. Давайце выдалім гэты загаловак, каб атрымаць канчатковую выяву ядра Linux:

$ dd if=uImage of=Image.lzma bs=1 skip=72
1088500+0 records in
1088500+0 records out
1088500 bytes (1,1 MB, 1,0 MiB) copied, 1,65603 s, 657 kB/s

Выява сціснуты, таму давайце распакуем яго:

$ unlzma Image.lzma

Цяпер у нас ёсць выява ядра Linux:

$ ls -la Image
-rw-rw-r-- 1 sprado sprado 3164228 Fev  5 10:51 Image

Што мы можам зрабіць з выявай ядра? Мы маглі б, напрыклад, зрабіць пошук па радках у выяве і знайсці версію ядра Linux і пазнаць аб навакольным асяроддзі, выкарыстоўванай для зборкі ядра:

$ strings Image | grep "Linux version"
Linux version 3.3.8 (leo@leo-MS-7529) (gcc version 4.6.3 20120201 (prerelease) (Linaro GCC 4.6-2012.02) ) #1 Mon May 20 18:53:02 CST 2019

Нягледзячы на ​​тое, што прашыўка была выпушчана ў мінулым годзе (2019 г.), калі я пішу гэты артыкул, яна выкарыстоўвае старую версію ядра Linux (3.3.8), выпушчаную ў 2012 г., скампіляваную з вельмі старой версіяй GCC (4.6) таксама з 2012 г.!
(заўв. перакл. яшчэ давяраеце сваім роўтэрам у офісе і дома?)

З опцыяй --opcodes мы таксама можам выкарыстоўваць binwalk для пошуку машынных інструкцый і вызначэння архітэктуры працэсара выявы:

$ binwalk --opcodes Image
DECIMAL       HEXADECIMAL     DESCRIPTION
--------------------------------------------------------------------------------
2400          0x960           MIPS instructions, function epilogue
2572          0xA0C           MIPS instructions, function epilogue
2828          0xB0C           MIPS instructions, function epilogue

Як наконт каранёвай файлавай сістэмы? Замест таго, каб здабываць выяву ўручную, давайце скарыстаемся опцыяй binwalk --extract:

$ binwalk --extract --quiet archer-c7.bin

Поўная каранёвая файлавая сістэма будзе вынятая ў падкаталог:

$ cd _archer-c7.bin.extracted/squashfs-root/

$ ls
bin  dev  etc  lib  mnt  overlay  proc  rom  root  sbin  sys  tmp  usr  var  www

$ cat etc/banner
     MM           NM                    MMMMMMM          M       M
   $MMMMM        MMMMM                MMMMMMMMMMM      MMM     MMM
  MMMMMMMM     MM MMMMM.              MMMMM:MMMMMM:   MMMM   MMMMM
MMMM= MMMMMM  MMM   MMMM       MMMMM   MMMM  MMMMMM   MMMM  MMMMM'
MMMM=  MMMMM MMMM    MM       MMMMM    MMMM    MMMM   MMMMNMMMMM
MMMM=   MMMM  MMMMM          MMMMM     MMMM    MMMM   MMMMMMMM
MMMM=   MMMM   MMMMMM       MMMMM      MMMM    MMMM   MMMMMMMMM
MMMM=   MMMM     MMMMM,    NMMMMMMMM   MMMM    MMMM   MMMMMMMMMMM
MMMM=   MMMM      MMMMMM   MMMMMMMM    MMMM    MMMM   MMMM  MMMMMM
MMMM=   MMMM   MM    MMMM    MMMM      MMMM    MMMM   MMMM    MMMM
MMMM$ ,MMMMM  MMMMM  MMMM    MMM       MMMM   MMMMM   MMMM    MMMM
  MMMMMMM:      MMMMMMM     M         MMMMMMMMMMMM  MMMMMMM MMMMMMM
    MMMMMM       MMMMN     M           MMMMMMMMM      MMMM    MMMM
     MMMM          M                    MMMMMMM        M       M
       M
 ---------------------------------------------------------------
   For those about to rock... (%C, %R)
 ---------------------------------------------------------------

Цяпер мы можам зрабіць шмат рознага.

Мы можам шукаць файлы канфігурацыі, хэшы пароляў, крыптаграфічныя ключы і лічбавыя сертыфікаты. Мы можам прааналізаваць бінарныя файлы для пошуку памылак і ўразлівасцяў.

З дапамогай цьфу и chroot мы можам нават запусціць (эмуляваць) выкананы файл з выявы:

$ ls
bin  dev  etc  lib  mnt  overlay  proc  rom  root  sbin  sys  tmp  usr  var  www

$ cp /usr/bin/qemu-mips-static .

$ sudo chroot . ./qemu-mips-static bin/busybox
BusyBox v1.19.4 (2019-05-20 18:13:49 CST) multi-call binary.
Copyright (C) 1998-2011 Erik Andersen, Rob Landley, Denys Vlasenko
and others. Licensed under GPLv2.
See source distribution for full notice.

Usage: busybox [function] [arguments]...
   or: busybox --list[-full]
   or: function [arguments]...

    BusyBox is a multi-call binary that combines many common Unix
    utilities into a single executable.  Most people will create a
    link to busybox for each function they wish to use and BusyBox
    will act like whatever it was invoked as.

Currently defined functions:
    [, [[, addgroup, adduser, arping, ash, awk, basename, cat, chgrp, chmod, chown, chroot, clear, cmp, cp, crond, crontab, cut, date, dd, delgroup, deluser, dirname, dmesg, echo, egrep, env, expr, false,
    fgrep, find, free, fsync, grep, gunzip, gzip, halt, head, hexdump, hostid, id, ifconfig, init, insmod, kill, killall, klogd, ln, lock, logger, ls, lsmod, mac_addr, md5sum, mkdir, mkfifo, mknod, mktemp,
    mount, mv, nice, passwd, pgrep, pidof, ping, ping6, pivot_root, poweroff, printf, ps, pwd, readlink, reboot, reset, rm, rmdir, rmmod, route, sed, seq, sh, sleep, sort, start-stop-daemon, strings,
    switch_root, sync, sysctl, tail, tar, tee, telnet, test, tftp, time, top, touch, tr, traceroute, true, udhcpc, umount, uname, uniq, uptime, vconfig, vi, watchdog, wc, wget, which, xargs, yes, zcat

Выдатна! Але звернеце ўвагу, што версія BusyBox – 1.19.4. Гэта вельмі старая версія BusyBox, выпушчаная ў красавіку 2012 года.

Такім чынам, TP-Link выпускае выяву прашыўкі ў 2019 годзе з выкарыстаннем праграмнага забеспячэння (GCC toolchain, kernel, BusyBox і г. д.) 2012 года!

Цяпер вы разумееце, чаму я заўсёды ўстанаўліваю OpenWRT на свае роўтэры?

Гэта яшчэ не ўсё

Binwalk таксама можа выконваць энтрапійны аналіз, друкаваць неапрацаваныя энтрапійныя дадзеныя і генераваць энтрапійныя графікі. Звычайна вялікая энтрапія назіраецца, калі байты ў выяве выпадковыя. Гэта можа азначаць, што выява ўтрымоўвае зашыфраваны, сціснуты або обфусцированный файл. Хардкорна прапісаны ключ шыфравання? Чаму б і не.

Рэверс-інжынірынг хатняга роўтара з дапамогай binwalk. Давяраеце софту свайго роўтара?

Мы таксама можам выкарыстоўваць параметр --raw для пошуку карыстацкай паслядоўнасці неапрацаваных байтаў у выяве або параметр --hexdump для выканання шаснаццатковага дампа, які параўноўвае два ці больш уваходных файла.

Карыстальніцкія сігнатуры могуць быць дададзены ў binwalk альбо праз файл карыстацкіх сігнатур, паказаны ў камандным радку з дапамогай параметру --magic, альбо шляхам дадання іх у каталог $ HOME / .config / binwalk / magic.

Вы можаце знайсці больш інфармацыі аб binwalk ў афіцыйнай дакументацыі.

Пашырэнне binwalk

Існуе API-інтэрфейс binwalk, рэалізаваны ў выглядзе модуля Python, які можа выкарыстоўвацца любым скрыптам Python для праграмнага выканання сканавання binwalk, а ўтыліта каманднага радка binwalk можа быць амаль цалкам прадубляваная ўсяго двума радкамі кода Python!

import binwalk
binwalk.scan()

З дапамогай Python API вы таксама можаце ствараць убудовы пад Python для наладкі і пашырэнні binwalk.

таксама існуе убудова IDA і воблачная версія Binwalk Pro.

Дык чаму б вам не спампаваць вобраз прашыўкі з Інтэрнэту і не паспрабаваць binwalk? Абяцаю, вам будзе вельмі весела 🙂

Крыніца: habr.com

Дадаць каментар