Há alguns dias, decidi fazer engenharia reversa no firmware do meu roteador usando o binwalk.
eu me comprei
Cada vez que compro um roteador novo, eu instalo
Depois de baixar o OpenWRT, eu também
O que é binwalk?
Criado em 2010 por Craig Heffner, o binwalk pode escanear imagens de firmware e encontrar arquivos, identificar e extrair imagens do sistema de arquivos, código executável, arquivos compactados, bootloaders e kernels, formatos de arquivo como JPEG e PDF e muito mais.
Você pode usar o binwalk para fazer engenharia reversa do firmware e entender como ele funciona. Pesquise vulnerabilidades em arquivos binários, extraia arquivos e procure backdoors ou certificados digitais. Você também pode encontrar opcodes
para um monte de CPUs diferentes.
Você pode extrair imagens do sistema de arquivos para procurar arquivos de senha específicos (passwd, shadow, etc.) e tentar quebrar hashes de senha. Você pode realizar análise binária entre dois ou mais arquivos. Você pode realizar análise de entropia nos dados para procurar dados compactados ou chaves de criptografia codificadas. Tudo isso sem a necessidade de acessar o código-fonte.
Em geral, tudo que você precisa está lá :)
Como funciona o binwalk?
A principal característica do binwalk é a digitalização de assinaturas. Binwalk pode escanear a imagem do firmware para procurar vários tipos de arquivos e sistemas de arquivos integrados.
Você conhece o utilitário de linha de comando file
?
file /bin/bash
/bin/bash: ELF 64-bit LSB shared object, x86-64, version 1 (SYSV), dynamically linked, interpreter /lib64/l, for GNU/Linux 3.2.0, BuildID[sha1]=12f73d7a8e226c663034529c8dd20efec22dde54, stripped
Equipe file
olha o cabeçalho do arquivo e procura uma assinatura (número mágico) para determinar o tipo de arquivo. Por exemplo, se o arquivo começar com a sequência de bytes 0x89 0x50 0x4E 0x47 0x0D 0x0A 0x1A 0x0A
, ele sabe que é um arquivo PNG. Sobre
Binwalk funciona da mesma maneira. Mas em vez de procurar assinaturas apenas no início do arquivo, o binwalk verificará o arquivo inteiro. Além disso, o binwalk pode extrair arquivos encontrados na imagem.
Ferramentas file
и binwalk
usar a biblioteca libmagic
para identificar assinaturas de arquivos. Mas binwalk
adicionalmente suporta uma lista de assinaturas mágicas personalizadas para procurar arquivos compactados/zipados, cabeçalhos de firmware, kernels Linux, bootloaders, sistemas de arquivos e assim por diante.
Vamos nos divertir?
Instalação do binwalk
Binwalk é compatível com múltiplas plataformas, incluindo Linux, OSX, FreeBSD e Windows.
Para instalar a versão mais recente do binwalk você pode
Binwalk tem muitos parâmetros diferentes:
$ binwalk
Binwalk v2.2.0
Craig Heffner, ReFirmLabs
https://github.com/ReFirmLabs/binwalk
Usage: binwalk [OPTIONS] [FILE1] [FILE2] [FILE3] ...
Signature Scan Options:
-B, --signature Scan target file(s) for common file signatures
-R, --raw=<str> Scan target file(s) for the specified sequence of bytes
-A, --opcodes Scan target file(s) for common executable opcode signatures
-m, --magic=<file> Specify a custom magic file to use
-b, --dumb Disable smart signature keywords
-I, --invalid Show results marked as invalid
-x, --exclude=<str> Exclude results that match <str>
-y, --include=<str> Only show results that match <str>
Extraction Options:
-e, --extract Automatically extract known file types
-D, --dd=<type:ext:cmd> Extract <type> signatures, give the files an extension of <ext>, and execute <cmd>
-M, --matryoshka Recursively scan extracted files
-d, --depth=<int> Limit matryoshka recursion depth (default: 8 levels deep)
-C, --directory=<str> Extract files/folders to a custom directory (default: current working directory)
-j, --size=<int> Limit the size of each extracted file
-n, --count=<int> Limit the number of extracted files
-r, --rm Delete carved files after extraction
-z, --carve Carve data from files, but don't execute extraction utilities
-V, --subdirs Extract into sub-directories named by the offset
Entropy Options:
-E, --entropy Calculate file entropy
-F, --fast Use faster, but less detailed, entropy analysis
-J, --save Save plot as a PNG
-Q, --nlegend Omit the legend from the entropy plot graph
-N, --nplot Do not generate an entropy plot graph
-H, --high=<float> Set the rising edge entropy trigger threshold (default: 0.95)
-L, --low=<float> Set the falling edge entropy trigger threshold (default: 0.85)
Binary Diffing Options:
-W, --hexdump Perform a hexdump / diff of a file or files
-G, --green Only show lines containing bytes that are the same among all files
-i, --red Only show lines containing bytes that are different among all files
-U, --blue Only show lines containing bytes that are different among some files
-u, --similar Only display lines that are the same between all files
-w, --terse Diff all files, but only display a hex dump of the first file
Raw Compression Options:
-X, --deflate Scan for raw deflate compression streams
-Z, --lzma Scan for raw LZMA compression streams
-P, --partial Perform a superficial, but faster, scan
-S, --stop Stop after the first result
General Options:
-l, --length=<int> Number of bytes to scan
-o, --offset=<int> Start scan at this file offset
-O, --base=<int> Add a base address to all printed offsets
-K, --block=<int> Set file block size
-g, --swap=<int> Reverse every n bytes before scanning
-f, --log=<file> Log results to file
-c, --csv Log results to file in CSV format
-t, --term Format output to fit the terminal window
-q, --quiet Suppress output to stdout
-v, --verbose Enable verbose output
-h, --help Show help output
-a, --finclude=<str> Only scan files whose names match this regex
-p, --fexclude=<str> Do not scan files whose names match this regex
-s, --status=<int> Enable the status server on the specified port
Digitalização de imagens
Vamos começar procurando assinaturas de arquivos dentro da imagem (imagem do site
Executando binwalk com o parâmetro --signature:
$ binwalk --signature --term archer-c7.bin
DECIMAL HEXADECIMAL DESCRIPTION
------------------------------------------------------------------------------------------
21876 0x5574 U-Boot version string, "U-Boot 1.1.4-g4480d5f9-dirty (May
20 2019 - 18:45:16)"
21940 0x55B4 CRC32 polynomial table, big endian
23232 0x5AC0 uImage header, header size: 64 bytes, header CRC:
0x386C2BD5, created: 2019-05-20 10:45:17, image size:
41162 bytes, Data Address: 0x80010000, Entry Point:
0x80010000, data CRC: 0xC9CD1E38, OS: Linux, CPU: MIPS,
image type: Firmware Image, compression type: lzma, image
name: "u-boot image"
23296 0x5B00 LZMA compressed data, properties: 0x5D, dictionary size:
8388608 bytes, uncompressed size: 97476 bytes
64968 0xFDC8 XML document, version: "1.0"
78448 0x13270 uImage header, header size: 64 bytes, header CRC:
0x78A267FF, created: 2019-07-26 07:46:14, image size:
1088500 bytes, Data Address: 0x80060000, Entry Point:
0x80060000, data CRC: 0xBB9D4F94, OS: Linux, CPU: MIPS,
image type: Multi-File Image, compression type: lzma,
image name: "MIPS OpenWrt Linux-3.3.8"
78520 0x132B8 LZMA compressed data, properties: 0x6D, dictionary size:
8388608 bytes, uncompressed size: 3164228 bytes
1167013 0x11CEA5 Squashfs filesystem, little endian, version 4.0,
compression:xz, size: 14388306 bytes, 2541 inodes,
blocksize: 65536 bytes, created: 2019-07-26 07:51:38
15555328 0xED5B00 gzip compressed data, from Unix, last modified: 2019-07-26
07:51:41
Agora temos muitas informações sobre esta imagem.
Usos de imagem 0x5AC0
e uma imagem compactada do bootloader em 0x5B00
). Com base no cabeçalho uImage em 0x13270, sabemos que a arquitetura do processador é MIPS e o kernel Linux é a versão 3.3.8. E com base na imagem encontrada no endereço 0x11CEA5
, nós podemos ver isso rootfs
é um sistema de arquivos squashfs
.
Vamos agora extrair o bootloader (U-Boot) usando o comando dd
:
$ dd if=archer-c7.bin of=u-boot.bin.lzma bs=1 skip=23296 count=41162
41162+0 records in
41162+0 records out
41162 bytes (41 kB, 40 KiB) copied, 0,0939608 s, 438 kB/s
Como a imagem é compactada usando LZMA, precisamos descompactá-la:
$ unlzma u-boot.bin.lzma
Agora temos uma imagem U-Boot:
$ ls -l u-boot.bin
-rw-rw-r-- 1 sprado sprado 97476 Fev 5 08:48 u-boot.bin
Que tal encontrar o valor padrão para bootargs
?
$ strings u-boot.bin | grep bootargs
bootargs
bootargs=console=ttyS0,115200 board=AP152 rootfstype=squashfs init=/etc/preinit mtdparts=spi0.0:128k(factory-uboot),192k(u-boot),64k(ART),1536k(uImage),14464k@0x1e0000(rootfs) mem=128M
Variável de ambiente U-Boot bootargs
usado para passar parâmetros para o kernel Linux. E pelo exposto, temos um melhor entendimento da memória flash do aparelho.
Que tal extrair a imagem do kernel Linux?
$ dd if=archer-c7.bin of=uImage bs=1 skip=78448 count=1088572
1088572+0 records in
1088572+0 records out
1088572 bytes (1,1 MB, 1,0 MiB) copied, 1,68628 s, 646 kB/s
Podemos verificar se a imagem foi extraída com sucesso usando o comando file
:
$ file uImage
uImage: u-boot legacy uImage, MIPS OpenWrt Linux-3.3.8, Linux/MIPS, Multi-File Image (lzma), 1088500 bytes, Fri Jul 26 07:46:14 2019, Load Address: 0x80060000, Entry Point: 0x80060000, Header CRC: 0x78A267FF, Data CRC: 0xBB9D4F94
O formato de arquivo uImage é basicamente uma imagem do kernel Linux com um cabeçalho adicional. Vamos remover este cabeçalho para obter a imagem final do kernel Linux:
$ dd if=uImage of=Image.lzma bs=1 skip=72
1088500+0 records in
1088500+0 records out
1088500 bytes (1,1 MB, 1,0 MiB) copied, 1,65603 s, 657 kB/s
A imagem está compactada, então vamos descompactá-la:
$ unlzma Image.lzma
Agora temos uma imagem do kernel Linux:
$ ls -la Image
-rw-rw-r-- 1 sprado sprado 3164228 Fev 5 10:51 Image
O que podemos fazer com a imagem do kernel? Poderíamos, por exemplo, fazer uma pesquisa de string na imagem e encontrar a versão do kernel Linux e aprender sobre o ambiente usado para construir o kernel:
$ strings Image | grep "Linux version"
Linux version 3.3.8 (leo@leo-MS-7529) (gcc version 4.6.3 20120201 (prerelease) (Linaro GCC 4.6-2012.02) ) #1 Mon May 20 18:53:02 CST 2019
Embora o firmware tenha sido lançado no ano passado (2019), no momento em que escrevo este artigo ele está usando uma versão antiga do kernel Linux (3.3.8) lançada em 2012, compilada com uma versão muito antiga do GCC (4.6) também desde 2012 !
(tradução aproximada: você ainda confia em seus roteadores no escritório e em casa?)
Com opção --opcodes
também podemos usar o binwalk para procurar instruções de máquina e determinar a arquitetura do processador da imagem:
$ binwalk --opcodes Image
DECIMAL HEXADECIMAL DESCRIPTION
--------------------------------------------------------------------------------
2400 0x960 MIPS instructions, function epilogue
2572 0xA0C MIPS instructions, function epilogue
2828 0xB0C MIPS instructions, function epilogue
E quanto ao sistema de arquivos raiz? Em vez de extrair a imagem manualmente, vamos usar a opção binwalk --extract
:
$ binwalk --extract --quiet archer-c7.bin
O sistema de arquivos raiz completo será extraído para um subdiretório:
$ cd _archer-c7.bin.extracted/squashfs-root/
$ ls
bin dev etc lib mnt overlay proc rom root sbin sys tmp usr var www
$ cat etc/banner
MM NM MMMMMMM M M
$MMMMM MMMMM MMMMMMMMMMM MMM MMM
MMMMMMMM MM MMMMM. MMMMM:MMMMMM: MMMM MMMMM
MMMM= MMMMMM MMM MMMM MMMMM MMMM MMMMMM MMMM MMMMM'
MMMM= MMMMM MMMM MM MMMMM MMMM MMMM MMMMNMMMMM
MMMM= MMMM MMMMM MMMMM MMMM MMMM MMMMMMMM
MMMM= MMMM MMMMMM MMMMM MMMM MMMM MMMMMMMMM
MMMM= MMMM MMMMM, NMMMMMMMM MMMM MMMM MMMMMMMMMMM
MMMM= MMMM MMMMMM MMMMMMMM MMMM MMMM MMMM MMMMMM
MMMM= MMMM MM MMMM MMMM MMMM MMMM MMMM MMMM
MMMM$ ,MMMMM MMMMM MMMM MMM MMMM MMMMM MMMM MMMM
MMMMMMM: MMMMMMM M MMMMMMMMMMMM MMMMMMM MMMMMMM
MMMMMM MMMMN M MMMMMMMMM MMMM MMMM
MMMM M MMMMMMM M M
M
---------------------------------------------------------------
For those about to rock... (%C, %R)
---------------------------------------------------------------
Agora podemos fazer muitas coisas diferentes.
Podemos pesquisar arquivos de configuração, hashes de senhas, chaves criptográficas e certificados digitais. Podemos analisar arquivos binários para
Com
$ ls
bin dev etc lib mnt overlay proc rom root sbin sys tmp usr var www
$ cp /usr/bin/qemu-mips-static .
$ sudo chroot . ./qemu-mips-static bin/busybox
BusyBox v1.19.4 (2019-05-20 18:13:49 CST) multi-call binary.
Copyright (C) 1998-2011 Erik Andersen, Rob Landley, Denys Vlasenko
and others. Licensed under GPLv2.
See source distribution for full notice.
Usage: busybox [function] [arguments]...
or: busybox --list[-full]
or: function [arguments]...
BusyBox is a multi-call binary that combines many common Unix
utilities into a single executable. Most people will create a
link to busybox for each function they wish to use and BusyBox
will act like whatever it was invoked as.
Currently defined functions:
[, [[, addgroup, adduser, arping, ash, awk, basename, cat, chgrp, chmod, chown, chroot, clear, cmp, cp, crond, crontab, cut, date, dd, delgroup, deluser, dirname, dmesg, echo, egrep, env, expr, false,
fgrep, find, free, fsync, grep, gunzip, gzip, halt, head, hexdump, hostid, id, ifconfig, init, insmod, kill, killall, klogd, ln, lock, logger, ls, lsmod, mac_addr, md5sum, mkdir, mkfifo, mknod, mktemp,
mount, mv, nice, passwd, pgrep, pidof, ping, ping6, pivot_root, poweroff, printf, ps, pwd, readlink, reboot, reset, rm, rmdir, rmmod, route, sed, seq, sh, sleep, sort, start-stop-daemon, strings,
switch_root, sync, sysctl, tail, tar, tee, telnet, test, tftp, time, top, touch, tr, traceroute, true, udhcpc, umount, uname, uniq, uptime, vconfig, vi, watchdog, wc, wget, which, xargs, yes, zcat
Ótimo! Mas observe que a versão do BusyBox é 1.19.4. Esta é uma versão muito antiga do BusyBox, lançado em abril de 2012.
Portanto, a TP-Link lança uma imagem de firmware em 2019 usando software (conjunto de ferramentas GCC, kernel, BusyBox, etc.) de 2012!
Agora você entende por que sempre instalo OpenWRT em meus roteadores?
Isso não é tudo
Binwalk também pode realizar análise de entropia, imprimir dados brutos de entropia e gerar gráficos de entropia. Normalmente, maior entropia é observada quando os bytes da imagem são aleatórios. Isso pode significar que a imagem contém um arquivo criptografado, compactado ou ofuscado. Chave de criptografia hardcore? Por que não.
Também podemos usar o parâmetro --raw
para encontrar uma sequência de bytes brutos personalizada em uma imagem ou parâmetro --hexdump
para realizar um dump hexadecimal comparando dois ou mais arquivos de entrada.
--magic
, ou adicionando-os ao diretório $ HOME / .config / binwalk / magic
.
Você pode encontrar mais informações sobre binwalk em
extensão do binwalk
Lá
import binwalk
binwalk.scan()
Usando a API Python você também pode criar
Há também um é
Então, por que você não baixa a imagem do firmware da Internet e tenta o binwalk? Eu prometo que você vai se divertir muito :)
Fonte: habr.com