Inversa inĝenierado de hejma enkursigilo uzante binwalk. Ĉu vi fidas vian enkursigilon?

Inversa inĝenierado de hejma enkursigilo uzante binwalk. Ĉu vi fidas vian enkursigilon?

Antaŭ kelkaj tagoj, mi decidis inversigi la firmvaro de mia enkursigilo per binwalk.

Mi aĉetis min TP-Link Archer C7 hejma enkursigilo. Ne la plej bona enkursigilo, sed sufiĉe sufiĉa por miaj bezonoj.

Ĉiufoje kiam mi aĉetas novan enkursigilon, mi instalas OpenWRT. Por kio? Ĝenerale, fabrikantoj ne multe zorgas pri subteno de siaj enkursigiloj kaj kun la tempo la programaro malaktualas, vundeblecoj aperas, kaj tiel plu, ĝenerale, vi ricevas la ideon. Tial mi preferas la OpenWRT-firmvaro, kiu estas bone subtenata de la malfermfonta komunumo.

Elŝutinte OpenWRT, mi ankaŭ elŝutis la lastan firmvarbildon sub mia nova Archer C7 de la oficiala retejo kaj decidis analizi ĝin. Nur por amuzo kaj paroli pri binwalk.

Kio estas binwalk?

Binwalk estas malfermfonta ilo por analizo, inversa inĝenierado kaj firmvarbildo-ekstraktado.

Kreita en 2010 de Craig Heffner, binwalk povas skani firmware-bildojn kaj trovi dosierojn, identigi kaj eltiri dosiersistembildojn, plenumeblan kodon, kunpremitajn arkivojn, ekŝargilojn kaj kernojn, dosierformatojn kiel JPEG kaj PDF, kaj multe pli.

Vi povas uzi binwalk por inversigi la firmvaro por kompreni kiel ĝi funkcias. Serĉu binarajn dosierojn por vundeblecoj, ĉerpi dosierojn kaj serĉu malantaŭajn pordojn aŭ ciferecajn atestojn. Vi ankaŭ povas trovi opcodes por amaso da malsamaj CPUoj.

Vi povas ĉerpi dosiersistemajn bildojn por serĉi specifajn pasvortajn dosierojn (passwd, shadow, ktp.) kaj provi rompi pasvortajn haŝojn. Vi povas fari binaran analizon inter du aŭ pli da dosieroj. Vi povas fari entropian analizon pri datumoj por trovi kunpremitajn datumojn aŭ kodigitajn ĉifrajn ŝlosilojn. Ĉio ĉi sen neceso aliri la fontkodon.

Ĝenerale, ĉio, kion vi bezonas, estas tie :)

Kiel funkcias binwalk?

La ĉefa trajto de binwalk estas sia subskriba skanado. Binwalk povas skani la firmvarbildon por serĉi diversajn enkonstruitajn dosiertipojn kaj dosiersistemojn.

Ĉu vi konas la komandlinian ilon file?

file /bin/bash
/bin/bash: ELF 64-bit LSB shared object, x86-64, version 1 (SYSV), dynamically linked, interpreter /lib64/l, for GNU/Linux 3.2.0, BuildID[sha1]=12f73d7a8e226c663034529c8dd20efec22dde54, stripped

teamo filerigardas la dosierkapon kaj serĉas subskribon (magia nombro) por determini la dosiertipon. Ekzemple, se la dosiero komenciĝas per la sekvenco de bajtoj 0x89 0x50 0x4E 0x47 0x0D 0x0A 0x1A 0x0A, ĝi scias, ke ĝi estas PNG-dosiero. On Vikipedio Estas listo de komunaj dosiersignaturoj.

Binwalk funkcias same. Sed anstataŭ serĉi subskribojn nur komence de la dosiero, binwalk skanos la tutan dosieron. Aldone, binwalk povas ĉerpi dosierojn trovitajn en la bildo.

Iloj file и binwalk uzu la bibliotekon libmagic identigi dosierojn subskribojn. Sed binwalk aldone subtenas liston de kutimaj magiaj subskriboj por serĉi kunpremitajn/zipitajn dosierojn, firmvarkapojn, Linuksajn kernojn, ekŝargilojn, dosiersistemojn ktp.

Ni iom amuzu?

Instalado de Binwalk

Binwalk estas subtenata en pluraj platformoj inkluzive de Linukso, OSX, FreeBSD kaj Vindozo.

Por instali la lastan version de binwalk vi povas elŝutu fontkodon kaj sekvu instrukcioj pri instaladorapida gvidilo, havebla en la retejo de la projekto.

Binwalk havas multajn malsamajn parametrojn:

$ binwalk

Binwalk v2.2.0
Craig Heffner, ReFirmLabs
https://github.com/ReFirmLabs/binwalk

Usage: binwalk [OPTIONS] [FILE1] [FILE2] [FILE3] ...

Signature Scan Options:
    -B, --signature              Scan target file(s) for common file signatures
    -R, --raw=<str>              Scan target file(s) for the specified sequence of bytes
    -A, --opcodes                Scan target file(s) for common executable opcode signatures
    -m, --magic=<file>           Specify a custom magic file to use
    -b, --dumb                   Disable smart signature keywords
    -I, --invalid                Show results marked as invalid
    -x, --exclude=<str>          Exclude results that match <str>
    -y, --include=<str>          Only show results that match <str>

Extraction Options:
    -e, --extract                Automatically extract known file types
    -D, --dd=<type:ext:cmd>      Extract <type> signatures, give the files an extension of <ext>, and execute <cmd>
    -M, --matryoshka             Recursively scan extracted files
    -d, --depth=<int>            Limit matryoshka recursion depth (default: 8 levels deep)
    -C, --directory=<str>        Extract files/folders to a custom directory (default: current working directory)
    -j, --size=<int>             Limit the size of each extracted file
    -n, --count=<int>            Limit the number of extracted files
    -r, --rm                     Delete carved files after extraction
    -z, --carve                  Carve data from files, but don't execute extraction utilities
    -V, --subdirs                Extract into sub-directories named by the offset

Entropy Options:
    -E, --entropy                Calculate file entropy
    -F, --fast                   Use faster, but less detailed, entropy analysis
    -J, --save                   Save plot as a PNG
    -Q, --nlegend                Omit the legend from the entropy plot graph
    -N, --nplot                  Do not generate an entropy plot graph
    -H, --high=<float>           Set the rising edge entropy trigger threshold (default: 0.95)
    -L, --low=<float>            Set the falling edge entropy trigger threshold (default: 0.85)

Binary Diffing Options:
    -W, --hexdump                Perform a hexdump / diff of a file or files
    -G, --green                  Only show lines containing bytes that are the same among all files
    -i, --red                    Only show lines containing bytes that are different among all files
    -U, --blue                   Only show lines containing bytes that are different among some files
    -u, --similar                Only display lines that are the same between all files
    -w, --terse                  Diff all files, but only display a hex dump of the first file

Raw Compression Options:
    -X, --deflate                Scan for raw deflate compression streams
    -Z, --lzma                   Scan for raw LZMA compression streams
    -P, --partial                Perform a superficial, but faster, scan
    -S, --stop                   Stop after the first result

General Options:
    -l, --length=<int>           Number of bytes to scan
    -o, --offset=<int>           Start scan at this file offset
    -O, --base=<int>             Add a base address to all printed offsets
    -K, --block=<int>            Set file block size
    -g, --swap=<int>             Reverse every n bytes before scanning
    -f, --log=<file>             Log results to file
    -c, --csv                    Log results to file in CSV format
    -t, --term                   Format output to fit the terminal window
    -q, --quiet                  Suppress output to stdout
    -v, --verbose                Enable verbose output
    -h, --help                   Show help output
    -a, --finclude=<str>         Only scan files whose names match this regex
    -p, --fexclude=<str>         Do not scan files whose names match this regex
    -s, --status=<int>           Enable the status server on the specified port

Bilda skanado

Ni komencu serĉante dosierojn ene de la bildo (bildo de la retejo TP-Link).

Kurante binwalk kun la parametro --signature:

$ binwalk --signature --term archer-c7.bin

DECIMAL       HEXADECIMAL     DESCRIPTION
------------------------------------------------------------------------------------------
21876         0x5574          U-Boot version string, "U-Boot 1.1.4-g4480d5f9-dirty (May
                              20 2019 - 18:45:16)"
21940         0x55B4          CRC32 polynomial table, big endian
23232         0x5AC0          uImage header, header size: 64 bytes, header CRC:
                              0x386C2BD5, created: 2019-05-20 10:45:17, image size:
                              41162 bytes, Data Address: 0x80010000, Entry Point:
                              0x80010000, data CRC: 0xC9CD1E38, OS: Linux, CPU: MIPS,
                              image type: Firmware Image, compression type: lzma, image
                              name: "u-boot image"
23296         0x5B00          LZMA compressed data, properties: 0x5D, dictionary size:
                              8388608 bytes, uncompressed size: 97476 bytes
64968         0xFDC8          XML document, version: "1.0"
78448         0x13270         uImage header, header size: 64 bytes, header CRC:
                              0x78A267FF, created: 2019-07-26 07:46:14, image size:
                              1088500 bytes, Data Address: 0x80060000, Entry Point:
                              0x80060000, data CRC: 0xBB9D4F94, OS: Linux, CPU: MIPS,
                              image type: Multi-File Image, compression type: lzma,
                              image name: "MIPS OpenWrt Linux-3.3.8"
78520         0x132B8         LZMA compressed data, properties: 0x6D, dictionary size:
                              8388608 bytes, uncompressed size: 3164228 bytes
1167013       0x11CEA5        Squashfs filesystem, little endian, version 4.0,
                              compression:xz, size: 14388306 bytes, 2541 inodes,
                              blocksize: 65536 bytes, created: 2019-07-26 07:51:38
15555328      0xED5B00        gzip compressed data, from Unix, last modified: 2019-07-26
                              07:51:41

Nun ni havas multajn informojn pri ĉi tiu bildo.

Bildaj uzoj Submarŝipo kiel ekŝargilo (bildkapo ĉe 0x5AC0 kaj kunpremita ekŝargilo bildo ĉe 0x5B00). Surbaze de la kaplinio uImage ĉe 0x13270, ni scias, ke la procesora arkitekturo estas MIPS kaj la Linukso-kerno estas versio 3.3.8. Kaj surbaze de la bildo trovita ĉe la adreso 0x11CEA5, ni povas vidi tion rootfs estas dosiersistemo squashfs.

Ni nun ĉerpu la ekŝargilon (U-Boot) per la komando dd:

$ dd if=archer-c7.bin of=u-boot.bin.lzma bs=1 skip=23296 count=41162
41162+0 records in
41162+0 records out
41162 bytes (41 kB, 40 KiB) copied, 0,0939608 s, 438 kB/s

Ĉar la bildo estas kunpremita per LZMA, ni devas malkunpremi ĝin:

$ unlzma u-boot.bin.lzma

Nun ni havas bildon de U-Boot:

$ ls -l u-boot.bin
-rw-rw-r-- 1 sprado sprado 97476 Fev  5 08:48 u-boot.bin

Kiom pri trovi la defaŭltan valoron por bootargs?

$ strings u-boot.bin | grep bootargs
bootargs
bootargs=console=ttyS0,115200 board=AP152 rootfstype=squashfs init=/etc/preinit mtdparts=spi0.0:128k(factory-uboot),192k(u-boot),64k(ART),1536k(uImage),14464k@0x1e0000(rootfs) mem=128M

U-Boot Media Variablo bootargs uzata por transdoni parametrojn al la Linukso-kerno. Kaj de la supre, ni pli bone komprenas la fulmmemoron de la aparato.

Kiom pri ĉerpi la bildon de Linukso-kerno?

$ dd if=archer-c7.bin of=uImage bs=1 skip=78448 count=1088572
1088572+0 records in
1088572+0 records out
1088572 bytes (1,1 MB, 1,0 MiB) copied, 1,68628 s, 646 kB/s

Ni povas kontroli, ke la bildo estis ĉerpita sukcese per la komando file:

$ file uImage
uImage: u-boot legacy uImage, MIPS OpenWrt Linux-3.3.8, Linux/MIPS, Multi-File Image (lzma), 1088500 bytes, Fri Jul 26 07:46:14 2019, Load Address: 0x80060000, Entry Point: 0x80060000, Header CRC: 0x78A267FF, Data CRC: 0xBB9D4F94

La uImage dosierformato estas esence Linukso-kerna bildo kun plia kaplinio. Ni forigu ĉi tiun kaplinion por ricevi la finan Linuksan kernan bildon:

$ dd if=uImage of=Image.lzma bs=1 skip=72
1088500+0 records in
1088500+0 records out
1088500 bytes (1,1 MB, 1,0 MiB) copied, 1,65603 s, 657 kB/s

La bildo estas kunpremita, do ni malpaku ĝin:

$ unlzma Image.lzma

Nun ni havas Linuksan kernan bildon:

$ ls -la Image
-rw-rw-r-- 1 sprado sprado 3164228 Fev  5 10:51 Image

Kion ni povas fari kun la kernbildo? Ni povus, ekzemple, fari ĉenserĉon en la bildo kaj trovi la version de la Linukso-kerno kaj lerni pri la medio uzata por konstrui la kernon:

$ strings Image | grep "Linux version"
Linux version 3.3.8 (leo@leo-MS-7529) (gcc version 4.6.3 20120201 (prerelease) (Linaro GCC 4.6-2012.02) ) #1 Mon May 20 18:53:02 CST 2019

Kvankam la firmvaro estis publikigita pasintjare (2019), dum mi skribas ĉi tiun artikolon ĝi uzas malnovan version de la Linukso-kerno (3.3.8) publikigita en 2012, kompilita kun tre malnova versio de GCC (4.6) ankaŭ ekde 2012. !
(ĉu vi ankoraŭ fidas viajn enkursigilojn en la oficejo kaj hejme?)

Kun opcio --opcodes ni ankaŭ povas uzi binwalk por serĉi maŝinajn instrukciojn kaj determini la procesoran arkitekturon de la bildo:

$ binwalk --opcodes Image
DECIMAL       HEXADECIMAL     DESCRIPTION
--------------------------------------------------------------------------------
2400          0x960           MIPS instructions, function epilogue
2572          0xA0C           MIPS instructions, function epilogue
2828          0xB0C           MIPS instructions, function epilogue

Kio pri la radika dosiersistemo? Anstataŭ ĉerpi la bildon permane, ni uzu la opcion binwalk --extract:

$ binwalk --extract --quiet archer-c7.bin

La kompleta radika dosiersistemo estos ĉerpita al subdosierujo:

$ cd _archer-c7.bin.extracted/squashfs-root/

$ ls
bin  dev  etc  lib  mnt  overlay  proc  rom  root  sbin  sys  tmp  usr  var  www

$ cat etc/banner
     MM           NM                    MMMMMMM          M       M
   $MMMMM        MMMMM                MMMMMMMMMMM      MMM     MMM
  MMMMMMMM     MM MMMMM.              MMMMM:MMMMMM:   MMMM   MMMMM
MMMM= MMMMMM  MMM   MMMM       MMMMM   MMMM  MMMMMM   MMMM  MMMMM'
MMMM=  MMMMM MMMM    MM       MMMMM    MMMM    MMMM   MMMMNMMMMM
MMMM=   MMMM  MMMMM          MMMMM     MMMM    MMMM   MMMMMMMM
MMMM=   MMMM   MMMMMM       MMMMM      MMMM    MMMM   MMMMMMMMM
MMMM=   MMMM     MMMMM,    NMMMMMMMM   MMMM    MMMM   MMMMMMMMMMM
MMMM=   MMMM      MMMMMM   MMMMMMMM    MMMM    MMMM   MMMM  MMMMMM
MMMM=   MMMM   MM    MMMM    MMMM      MMMM    MMMM   MMMM    MMMM
MMMM$ ,MMMMM  MMMMM  MMMM    MMM       MMMM   MMMMM   MMMM    MMMM
  MMMMMMM:      MMMMMMM     M         MMMMMMMMMMMM  MMMMMMM MMMMMMM
    MMMMMM       MMMMN     M           MMMMMMMMM      MMMM    MMMM
     MMMM          M                    MMMMMMM        M       M
       M
 ---------------------------------------------------------------
   For those about to rock... (%C, %R)
 ---------------------------------------------------------------

Nun ni povas fari multajn malsamajn aferojn.

Ni povas serĉi agordajn dosierojn, pasvortajn haŝojn, kriptografajn ŝlosilojn kaj ciferecajn atestojn. Ni povas analizi binarajn dosierojn por solvi problemojn kaj vundeblecoj.

Kun la helpo de whoa и kroot ni eĉ povas ruli (imuli) plenumeblan de la bildo:

$ ls
bin  dev  etc  lib  mnt  overlay  proc  rom  root  sbin  sys  tmp  usr  var  www

$ cp /usr/bin/qemu-mips-static .

$ sudo chroot . ./qemu-mips-static bin/busybox
BusyBox v1.19.4 (2019-05-20 18:13:49 CST) multi-call binary.
Copyright (C) 1998-2011 Erik Andersen, Rob Landley, Denys Vlasenko
and others. Licensed under GPLv2.
See source distribution for full notice.

Usage: busybox [function] [arguments]...
   or: busybox --list[-full]
   or: function [arguments]...

    BusyBox is a multi-call binary that combines many common Unix
    utilities into a single executable.  Most people will create a
    link to busybox for each function they wish to use and BusyBox
    will act like whatever it was invoked as.

Currently defined functions:
    [, [[, addgroup, adduser, arping, ash, awk, basename, cat, chgrp, chmod, chown, chroot, clear, cmp, cp, crond, crontab, cut, date, dd, delgroup, deluser, dirname, dmesg, echo, egrep, env, expr, false,
    fgrep, find, free, fsync, grep, gunzip, gzip, halt, head, hexdump, hostid, id, ifconfig, init, insmod, kill, killall, klogd, ln, lock, logger, ls, lsmod, mac_addr, md5sum, mkdir, mkfifo, mknod, mktemp,
    mount, mv, nice, passwd, pgrep, pidof, ping, ping6, pivot_root, poweroff, printf, ps, pwd, readlink, reboot, reset, rm, rmdir, rmmod, route, sed, seq, sh, sleep, sort, start-stop-daemon, strings,
    switch_root, sync, sysctl, tail, tar, tee, telnet, test, tftp, time, top, touch, tr, traceroute, true, udhcpc, umount, uname, uniq, uptime, vconfig, vi, watchdog, wc, wget, which, xargs, yes, zcat

Bonege! Sed bonvolu noti, ke BusyBox-versio estas 1.19.4. Ĉi tio estas tre malnova versio de BusyBox, liberigita en aprilo 2012.

Do TP-Link publikigas firmvarbildon en 2019 uzante programaron (GCC-iloĉeno, kerno, BusyBox, ktp.) de 2012!

Nun ĉu vi komprenas, kial mi ĉiam instalas OpenWRT sur miaj enkursigiloj?

Tio ne estas ĉio

Binwalk ankaŭ povas elfari entropian analizon, presi krudajn entropiodatenojn, kaj generi entropiajn grafeojn. Tipe, pli granda entropio estas observita kiam la bajtoj en la bildo estas hazardaj. Ĉi tio povus signifi, ke la bildo enhavas ĉifritan, kunpremitan aŭ malklarigitan dosieron. Malmola ĉifrada ŝlosilo? Kial ne.

Inversa inĝenierado de hejma enkursigilo uzante binwalk. Ĉu vi fidas vian enkursigilon?

Ni ankaŭ povas uzi la parametron --raw por trovi kutiman krudan bajtan sekvencon en bildo aŭ parametro --hexdump fari heks-dump komparante du aŭ pli da enigdosieroj.

Propraj subskriboj povas esti aldonita al binwalk aŭ per kutima subskriba dosiero specifita sur la komandlinio uzante la parametron --magic, aŭ aldonante ilin al la dosierujo $ HOME / .config / binwalk / magic.

Vi povas trovi pliajn informojn pri binwalk ĉe oficiala dokumentaro.

binwalk etendo

Tie API binwalk, efektivigita kiel Python-modulo, kiu povas esti uzata de iu ajn Python-skripto por programe fari binwalk-skanadon, kaj la binwalk komandlinia utileco povas esti preskaŭ tute duobligita per nur du linioj de Python-kodo!

import binwalk
binwalk.scan()

Uzante la Python API vi ankaŭ povas krei Python-aldonaĵoj por agordi kaj vastigi binwalk.

Ankaŭ ekzistas IDA kromaĵo kaj nuba versio Binwalk Pro.

Do kial vi ne elŝutas la firmvarbildon de la Interreto kaj provas binwalk? Mi promesas, ke vi multe amuziĝos :)

fonto: www.habr.com

Aldoni komenton