Reverse engineering heimabeini með binwalk. Treystir þú router hugbúnaðinum þínum?

Reverse engineering heimabeini með binwalk. Treystir þú router hugbúnaðinum þínum?

Fyrir nokkrum dögum ákvað ég að bakfæra vélbúnaðar beinisins míns með því að nota binwalk.

Ég keypti mér TP-Link Archer C7 heimabeini. Ekki besti routerinn, en alveg nóg fyrir mínar þarfir.

Í hvert skipti sem ég kaupi nýjan router set ég upp OpenWRT. Til hvers? Að jafnaði er framleiðendum ekki mikið sama um að styðja við beina sína og með tímanum verður hugbúnaðurinn úreltur, veikleikar birtast og svo framvegis, almennt skilur maður hugmyndina. Þess vegna kýs ég frekar OpenWRT vélbúnaðinn, sem er vel studdur af open-source samfélaginu.

Eftir að hafa hlaðið niður OpenWRT, ég líka hlaðið niður nýjustu vélbúnaðarmyndinni undir nýja Archer C7 minn frá opinberu vefsíðunni og ákvað að greina það. Eingöngu til gamans og tala um binwalk.

Hvað er binwalk?

Binwalk er opinn uppspretta tól fyrir greiningu, bakverkfræði og vélbúnaðarmyndaútdrátt.

Binwalk, búið til árið 2010 af Craig Heffner, getur skannað vélbúnaðarmyndir og fundið skrár, auðkennt og dregið út skráarkerfismyndir, keyranlegan kóða, þjappað skjalasafn, ræsiforrit og kjarna, skráarsnið eins og JPEG og PDF og margt fleira.

Þú getur notað binwalk til að bakfæra vélbúnaðinn til að skilja hvernig hann virkar. Leitaðu að veikleikum í tvíundarskrám, dragðu út skrár og leitaðu að bakdyrum eða stafrænum skilríkjum. Þú getur líka fundið opcodes fyrir fullt af mismunandi örgjörva.

Þú getur dregið út skráarkerfismyndir til að leita að tilteknum lykilorðaskrám (passwd, shadow, o.s.frv.) og reynt að brjóta kjötkássa lykilorðs. Þú getur framkvæmt tvöfalda þáttun á milli tveggja eða fleiri skráa. Þú getur framkvæmt óreiðugreiningu á gögnum til að leita að þjöppuðum gögnum eða dulkóðuðum dulkóðunarlyklum. Allt þetta án þess að þurfa að fá aðgang að frumkóðann.

Almennt séð er allt sem þú þarft til staðar :)

Hvernig virkar binwalk?

Helsti eiginleiki binwalk er undirskriftarskönnun þess. Binwalk getur skannað vélbúnaðarmyndina til að leita að ýmsum innbyggðum skráargerðum og skráarkerfum.

Þekkir þú skipanalínuforritið file?

file /bin/bash
/bin/bash: ELF 64-bit LSB shared object, x86-64, version 1 (SYSV), dynamically linked, interpreter /lib64/l, for GNU/Linux 3.2.0, BuildID[sha1]=12f73d7a8e226c663034529c8dd20efec22dde54, stripped

Team fileskoðar skráarhausinn og leitar að undirskrift (töfranúmeri) til að ákvarða skráargerðina. Til dæmis, ef skráin byrjar á röð bæta 0x89 0x50 0x4E 0x47 0x0D 0x0A 0x1A 0x0A, það veit að það er PNG skrá. Á Wikipedia Það er listi yfir algengar skráarundirskriftir.

Binwalk virkar á sama hátt. En í stað þess að leita að undirskriftum aðeins í upphafi skráarinnar, mun binwalk skanna alla skrána. Að auki getur binwalk dregið út skrár sem finnast í myndinni.

Verkfæri file и binwalk nota bókasafnið libmagic til að auðkenna skráarundirskrift. En binwalk styður auk þess lista yfir sérsniðnar töfraundirskriftir til að leita að þjöppuðum/þjöppuðum skrám, fastbúnaðarhausum, Linux kjarna, ræsiforritum, skráarkerfum og svo framvegis.

Höfum gaman?

Binwalk uppsetning

Binwalk er stutt á mörgum kerfum, þar á meðal Linux, OSX, FreeBSD og Windows.

Til að setja upp nýjustu útgáfuna af binwalk geturðu sækja frumkóða og fylgja uppsetningarleiðbeiningar eða fljótleg leiðarvísir, aðgengilegt á heimasíðu verkefnisins.

Binwalk hefur margar mismunandi breytur:

$ binwalk

Binwalk v2.2.0
Craig Heffner, ReFirmLabs
https://github.com/ReFirmLabs/binwalk

Usage: binwalk [OPTIONS] [FILE1] [FILE2] [FILE3] ...

Signature Scan Options:
    -B, --signature              Scan target file(s) for common file signatures
    -R, --raw=<str>              Scan target file(s) for the specified sequence of bytes
    -A, --opcodes                Scan target file(s) for common executable opcode signatures
    -m, --magic=<file>           Specify a custom magic file to use
    -b, --dumb                   Disable smart signature keywords
    -I, --invalid                Show results marked as invalid
    -x, --exclude=<str>          Exclude results that match <str>
    -y, --include=<str>          Only show results that match <str>

Extraction Options:
    -e, --extract                Automatically extract known file types
    -D, --dd=<type:ext:cmd>      Extract <type> signatures, give the files an extension of <ext>, and execute <cmd>
    -M, --matryoshka             Recursively scan extracted files
    -d, --depth=<int>            Limit matryoshka recursion depth (default: 8 levels deep)
    -C, --directory=<str>        Extract files/folders to a custom directory (default: current working directory)
    -j, --size=<int>             Limit the size of each extracted file
    -n, --count=<int>            Limit the number of extracted files
    -r, --rm                     Delete carved files after extraction
    -z, --carve                  Carve data from files, but don't execute extraction utilities
    -V, --subdirs                Extract into sub-directories named by the offset

Entropy Options:
    -E, --entropy                Calculate file entropy
    -F, --fast                   Use faster, but less detailed, entropy analysis
    -J, --save                   Save plot as a PNG
    -Q, --nlegend                Omit the legend from the entropy plot graph
    -N, --nplot                  Do not generate an entropy plot graph
    -H, --high=<float>           Set the rising edge entropy trigger threshold (default: 0.95)
    -L, --low=<float>            Set the falling edge entropy trigger threshold (default: 0.85)

Binary Diffing Options:
    -W, --hexdump                Perform a hexdump / diff of a file or files
    -G, --green                  Only show lines containing bytes that are the same among all files
    -i, --red                    Only show lines containing bytes that are different among all files
    -U, --blue                   Only show lines containing bytes that are different among some files
    -u, --similar                Only display lines that are the same between all files
    -w, --terse                  Diff all files, but only display a hex dump of the first file

Raw Compression Options:
    -X, --deflate                Scan for raw deflate compression streams
    -Z, --lzma                   Scan for raw LZMA compression streams
    -P, --partial                Perform a superficial, but faster, scan
    -S, --stop                   Stop after the first result

General Options:
    -l, --length=<int>           Number of bytes to scan
    -o, --offset=<int>           Start scan at this file offset
    -O, --base=<int>             Add a base address to all printed offsets
    -K, --block=<int>            Set file block size
    -g, --swap=<int>             Reverse every n bytes before scanning
    -f, --log=<file>             Log results to file
    -c, --csv                    Log results to file in CSV format
    -t, --term                   Format output to fit the terminal window
    -q, --quiet                  Suppress output to stdout
    -v, --verbose                Enable verbose output
    -h, --help                   Show help output
    -a, --finclude=<str>         Only scan files whose names match this regex
    -p, --fexclude=<str>         Do not scan files whose names match this regex
    -s, --status=<int>           Enable the status server on the specified port

Myndskönnun

Byrjum á því að leita að skráarundirskriftum inni í myndinni (mynd af síðunni TP-Link).

Að keyra binwalk með --signature færibreytunni:

$ binwalk --signature --term archer-c7.bin

DECIMAL       HEXADECIMAL     DESCRIPTION
------------------------------------------------------------------------------------------
21876         0x5574          U-Boot version string, "U-Boot 1.1.4-g4480d5f9-dirty (May
                              20 2019 - 18:45:16)"
21940         0x55B4          CRC32 polynomial table, big endian
23232         0x5AC0          uImage header, header size: 64 bytes, header CRC:
                              0x386C2BD5, created: 2019-05-20 10:45:17, image size:
                              41162 bytes, Data Address: 0x80010000, Entry Point:
                              0x80010000, data CRC: 0xC9CD1E38, OS: Linux, CPU: MIPS,
                              image type: Firmware Image, compression type: lzma, image
                              name: "u-boot image"
23296         0x5B00          LZMA compressed data, properties: 0x5D, dictionary size:
                              8388608 bytes, uncompressed size: 97476 bytes
64968         0xFDC8          XML document, version: "1.0"
78448         0x13270         uImage header, header size: 64 bytes, header CRC:
                              0x78A267FF, created: 2019-07-26 07:46:14, image size:
                              1088500 bytes, Data Address: 0x80060000, Entry Point:
                              0x80060000, data CRC: 0xBB9D4F94, OS: Linux, CPU: MIPS,
                              image type: Multi-File Image, compression type: lzma,
                              image name: "MIPS OpenWrt Linux-3.3.8"
78520         0x132B8         LZMA compressed data, properties: 0x6D, dictionary size:
                              8388608 bytes, uncompressed size: 3164228 bytes
1167013       0x11CEA5        Squashfs filesystem, little endian, version 4.0,
                              compression:xz, size: 14388306 bytes, 2541 inodes,
                              blocksize: 65536 bytes, created: 2019-07-26 07:51:38
15555328      0xED5B00        gzip compressed data, from Unix, last modified: 2019-07-26
                              07:51:41

Nú höfum við miklar upplýsingar um þessa mynd.

Mynd notar Kafbátur sem ræsiforrit (myndahaus kl 0x5AC0 og þjappað ræsiforritamynd á 0x5B00). Byggt á uImage hausnum í 0x13270, vitum við að örgjörva arkitektúrinn er MIPS og Linux kjarninn er útgáfa 3.3.8. Og byggt á myndinni sem fannst á heimilisfanginu 0x11CEA5, við getum séð það rootfs er skráarkerfi squashfs.

Við skulum nú draga út ræsiforritið (U-Boot) með því að nota skipunina dd:

$ dd if=archer-c7.bin of=u-boot.bin.lzma bs=1 skip=23296 count=41162
41162+0 records in
41162+0 records out
41162 bytes (41 kB, 40 KiB) copied, 0,0939608 s, 438 kB/s

Þar sem myndin er þjöppuð með LZMA þurfum við að þjappa henni niður:

$ unlzma u-boot.bin.lzma

Nú höfum við U-Boot mynd:

$ ls -l u-boot.bin
-rw-rw-r-- 1 sprado sprado 97476 Fev  5 08:48 u-boot.bin

Hvernig væri að finna sjálfgefið gildi fyrir bootargs?

$ strings u-boot.bin | grep bootargs
bootargs
bootargs=console=ttyS0,115200 board=AP152 rootfstype=squashfs init=/etc/preinit mtdparts=spi0.0:128k(factory-uboot),192k(u-boot),64k(ART),1536k(uImage),14464k@0x1e0000(rootfs) mem=128M

U-Boot Umhverfisbreyta bootargs notað til að senda breytur til Linux kjarnans. Og af ofangreindu höfum við betri skilning á flassminni tækisins.

Hvað með að draga út Linux kjarnamyndina?

$ dd if=archer-c7.bin of=uImage bs=1 skip=78448 count=1088572
1088572+0 records in
1088572+0 records out
1088572 bytes (1,1 MB, 1,0 MiB) copied, 1,68628 s, 646 kB/s

Við getum athugað hvort myndin hafi verið dregin út með góðum árangri með því að nota skipunina file:

$ file uImage
uImage: u-boot legacy uImage, MIPS OpenWrt Linux-3.3.8, Linux/MIPS, Multi-File Image (lzma), 1088500 bytes, Fri Jul 26 07:46:14 2019, Load Address: 0x80060000, Entry Point: 0x80060000, Header CRC: 0x78A267FF, Data CRC: 0xBB9D4F94

uImage skráarsniðið er í grundvallaratriðum Linux kjarnamynd með viðbótarhaus. Við skulum fjarlægja þennan haus til að fá endanlega Linux kjarnamynd:

$ dd if=uImage of=Image.lzma bs=1 skip=72
1088500+0 records in
1088500+0 records out
1088500 bytes (1,1 MB, 1,0 MiB) copied, 1,65603 s, 657 kB/s

Myndin er þjöppuð, svo við skulum taka hana upp:

$ unlzma Image.lzma

Nú höfum við Linux kjarna mynd:

$ ls -la Image
-rw-rw-r-- 1 sprado sprado 3164228 Fev  5 10:51 Image

Hvað getum við gert við kjarnamyndina? Við gætum til dæmis gert strengjaleit í myndinni og fundið útgáfuna af Linux kjarnanum og lært um umhverfið sem notað er til að byggja upp kjarnann:

$ strings Image | grep "Linux version"
Linux version 3.3.8 (leo@leo-MS-7529) (gcc version 4.6.3 20120201 (prerelease) (Linaro GCC 4.6-2012.02) ) #1 Mon May 20 18:53:02 CST 2019

Jafnvel þó að fastbúnaðurinn hafi verið gefinn út á síðasta ári (2019), þegar ég skrifa þessa grein notar hann gamla útgáfu af Linux kjarnanum (3.3.8) sem kom út árið 2012, unnin með mjög gamalli útgáfu af GCC (4.6) einnig síðan 2012 !
(u.þ.b. þýðing treystir þú enn beinum þínum á skrifstofunni og heima?)

Með valmöguleika --opcodes við getum líka notað binwalk til að fletta upp vélaleiðbeiningum og ákvarða örgjörvaarkitektúr myndarinnar:

$ binwalk --opcodes Image
DECIMAL       HEXADECIMAL     DESCRIPTION
--------------------------------------------------------------------------------
2400          0x960           MIPS instructions, function epilogue
2572          0xA0C           MIPS instructions, function epilogue
2828          0xB0C           MIPS instructions, function epilogue

Hvað með rót skráarkerfið? Í stað þess að draga myndina út handvirkt skulum við nota valkostinn binwalk --extract:

$ binwalk --extract --quiet archer-c7.bin

Allt rótarskráarkerfið verður dregið út í undirmöppu:

$ cd _archer-c7.bin.extracted/squashfs-root/

$ ls
bin  dev  etc  lib  mnt  overlay  proc  rom  root  sbin  sys  tmp  usr  var  www

$ cat etc/banner
     MM           NM                    MMMMMMM          M       M
   $MMMMM        MMMMM                MMMMMMMMMMM      MMM     MMM
  MMMMMMMM     MM MMMMM.              MMMMM:MMMMMM:   MMMM   MMMMM
MMMM= MMMMMM  MMM   MMMM       MMMMM   MMMM  MMMMMM   MMMM  MMMMM'
MMMM=  MMMMM MMMM    MM       MMMMM    MMMM    MMMM   MMMMNMMMMM
MMMM=   MMMM  MMMMM          MMMMM     MMMM    MMMM   MMMMMMMM
MMMM=   MMMM   MMMMMM       MMMMM      MMMM    MMMM   MMMMMMMMM
MMMM=   MMMM     MMMMM,    NMMMMMMMM   MMMM    MMMM   MMMMMMMMMMM
MMMM=   MMMM      MMMMMM   MMMMMMMM    MMMM    MMMM   MMMM  MMMMMM
MMMM=   MMMM   MM    MMMM    MMMM      MMMM    MMMM   MMMM    MMMM
MMMM$ ,MMMMM  MMMMM  MMMM    MMM       MMMM   MMMMM   MMMM    MMMM
  MMMMMMM:      MMMMMMM     M         MMMMMMMMMMMM  MMMMMMM MMMMMMM
    MMMMMM       MMMMN     M           MMMMMMMMM      MMMM    MMMM
     MMMM          M                    MMMMMMM        M       M
       M
 ---------------------------------------------------------------
   For those about to rock... (%C, %R)
 ---------------------------------------------------------------

Núna getum við gert ýmislegt.

Við getum leitað að stillingarskrám, lykilorðahassum, dulmálslyklum og stafrænum skilríkjum. Við getum greint tvöfaldar skrár fyrir Bilanagreining og varnarleysi.

Með и róta við getum jafnvel keyrt (líkja eftir) keyrslu úr myndinni:

$ ls
bin  dev  etc  lib  mnt  overlay  proc  rom  root  sbin  sys  tmp  usr  var  www

$ cp /usr/bin/qemu-mips-static .

$ sudo chroot . ./qemu-mips-static bin/busybox
BusyBox v1.19.4 (2019-05-20 18:13:49 CST) multi-call binary.
Copyright (C) 1998-2011 Erik Andersen, Rob Landley, Denys Vlasenko
and others. Licensed under GPLv2.
See source distribution for full notice.

Usage: busybox [function] [arguments]...
   or: busybox --list[-full]
   or: function [arguments]...

    BusyBox is a multi-call binary that combines many common Unix
    utilities into a single executable.  Most people will create a
    link to busybox for each function they wish to use and BusyBox
    will act like whatever it was invoked as.

Currently defined functions:
    [, [[, addgroup, adduser, arping, ash, awk, basename, cat, chgrp, chmod, chown, chroot, clear, cmp, cp, crond, crontab, cut, date, dd, delgroup, deluser, dirname, dmesg, echo, egrep, env, expr, false,
    fgrep, find, free, fsync, grep, gunzip, gzip, halt, head, hexdump, hostid, id, ifconfig, init, insmod, kill, killall, klogd, ln, lock, logger, ls, lsmod, mac_addr, md5sum, mkdir, mkfifo, mknod, mktemp,
    mount, mv, nice, passwd, pgrep, pidof, ping, ping6, pivot_root, poweroff, printf, ps, pwd, readlink, reboot, reset, rm, rmdir, rmmod, route, sed, seq, sh, sleep, sort, start-stop-daemon, strings,
    switch_root, sync, sysctl, tail, tar, tee, telnet, test, tftp, time, top, touch, tr, traceroute, true, udhcpc, umount, uname, uniq, uptime, vconfig, vi, watchdog, wc, wget, which, xargs, yes, zcat

Frábært! En vinsamlegast athugaðu að BusyBox útgáfan er 1.19.4. Þetta er mjög gömul útgáfa af BusyBox, gefin út í apríl 2012.

Þannig að TP-Link gefur út vélbúnaðarmynd árið 2019 með því að nota hugbúnað (GCC verkfærakeðju, kjarna, BusyBox, osfrv.) frá 2012!

Nú skilurðu hvers vegna ég set alltaf OpenWRT á routerunum mínum?

Það er ekki allt

Binwalk getur einnig framkvæmt óreiðugreiningu, prentað hrá óreiðugögn og búið til óreiðugraf. Venjulega sést meiri óreiðu þegar bætin í myndinni eru af handahófi. Þetta gæti þýtt að myndin innihaldi dulkóðaða, þjappaða eða óskýrða skrá. Harðkjarna dulkóðunarlykill? Af hverju ekki.

Reverse engineering heimabeini með binwalk. Treystir þú router hugbúnaðinum þínum?

Við getum líka notað færibreytuna --raw til að finna sérsniðna hrábæta röð í mynd eða færibreytu --hexdump til að framkvæma hex dump sem bera saman tvær eða fleiri inntaksskrár.

Sérsniðnar undirskriftir hægt að bæta við binwalk annað hvort í gegnum sérsniðna undirskriftarskrá sem tilgreind er á skipanalínunni með því að nota færibreytuna --magic, eða með því að bæta þeim við möppuna $ HOME / .config / binwalk / magic.

Þú getur fundið frekari upplýsingar um binwalk á opinber skjöl.

binwalk framlenging

There API binwalk, útfært sem Python-eining sem hægt er að nota af hvaða Python-forriti sem er til að framkvæma binwalk-skönnun á forritafræðilegan hátt, og binwalk skipanalínuforritið er nánast hægt að afrita með aðeins tveimur línum af Python-kóða!

import binwalk
binwalk.scan()

Með því að nota Python API geturðu líka búið til Python viðbætur til að stilla og stækka binwalk.

Er líka til IDA viðbót og skýjaútgáfa Binwalk Pro.

Svo af hverju hleðurðu ekki niður vélbúnaðarmyndinni af netinu og prófar binwalk? Ég lofa að þú munt skemmta þér vel :)

Heimild: www.habr.com

Bæta við athugasemd