Aħna nikkalkulaw bots "ħżiena" potenzjali u nibblukkawhom bl-IP

Aħna nikkalkulaw bots "ħżiena" potenzjali u nibblukkawhom bl-IP

Il-ġurnata t-tajba! Fl-artiklu ser ngħidlek kif l-utenti ta 'hosting regolari jistgħu jaqbdu indirizzi IP li jiġġeneraw tagħbija eċċessiva fuq is-sit u mbagħad jimblukkawhom bl-użu ta' għodod ta 'akkoljenza, se jkun hemm "ftit" kodiċi PHP, ftit screenshots.

Data tad-dħul:

  1. Sit maħluq fuq CMS WordPress
  2. Hosting Beget (dan mhux reklamar, iżda l-iskrins tal-amministrazzjoni se jkunu ta 'dan il-fornitur partikolari tal-hosting)
  3. Is-sit ta 'WordPress tnieda f'xi żmien kmieni fl-2000 u għandu numru kbir ta' artikoli u materjali
  4. PHP verżjoni 7.2
  5. WP għandu l-aħħar verżjoni
  6. Għal xi żmien issa, is-sit beda jiġġenera tagħbija għolja fuq MySQL skont l-hosting. Kuljum dan il-valur qabeż il-120% tan-norma għal kull kont
  7. Skond Yandex. Il-websajt ta 'Metrica jżuruha 100-200 persuna kuljum

L-ewwelnett sar:

  1. Imnaddaf tabelli DB minn żibel akkumulat
  2. Plugins bla bżonn diżattivati, sezzjonijiet imneħħija ta 'kodiċi skaduti

Fl-istess ħin, niġbed l-attenzjoni tiegħek għall-fatt li ġew ippruvati għażliet ta 'caching (plugins ta' caching), saru osservazzjonijiet - iżda t-tagħbija ta '120% minn sit wieħed ma nbidlitx u setgħet tikber biss.

X'kienet it-tagħbija approssimattiva fuq il-hosting databases

Aħna nikkalkulaw bots "ħżiena" potenzjali u nibblukkawhom bl-IP
Fil-quċċata hemm is-sit inkwistjoni, ftit aktar baxxi huma siti oħra li għandhom l-istess cms u bejn wieħed u ieħor l-istess traffiku, iżda joħolqu inqas tagħbija.

Analiżi

  • Saru ħafna tentattivi b'għażliet ta 'caching tad-dejta, saru osservazzjonijiet għal diversi ġimgħat (fortunatament, l-hosting qatt ma kitbitli li jien daqshekk ħażin u se jitfuni)
  • Kien hemm analiżi u tfittxija għal mistoqsijiet bil-mod, imbagħad l-istruttura tad-database u t-tip ta 'tabelli nbidlu ftit
  • Għall-analiżi, użajna primarjament l-AWStats integrati (mill-mod, għen biex jiġi kkalkulat l-aktar indirizz IP ħażin skont il-volum tat-traffiku
  • Metrika - metrika tagħti informazzjoni biss dwar in-nies, mhux dwar il-bots
  • Kien hemm tentattivi biex jintużaw plugins għal WP li jistgħu jiffiltraw u jimblukkaw il-viżitaturi anke skont il-pajjiż ta’ residenza u b’diversi kombinazzjonijiet
  • Mod kompletament radikali rriżulta li kien li jagħlaq is-sit għal ġurnata bin-nota "Aħna qegħdin taħt manutenzjoni" - dan sar ukoll bl-użu tal-plugin famuż. F'dan il-każ, nistennew li t-tagħbija tinżel, iżda mhux għal valuri 0-xellug, peress li l-ideoloġija WP hija bbażata fuq ganċijiet u plugins jibdew l-attività tagħhom meta jseħħ "ganċ", u qabel ma jseħħ il-"ganċ", mistoqsijiet lill- database tista' diġà ssir

Idea

  1. Ikkalkula l-indirizzi IP li jagħmlu ħafna talbiet f'perjodu qasir ta 'żmien.
  2. Irreġistra n-numru ta 'hits fis-sit
  3. Imblokka l-aċċess għas-sit ibbażat fuq in-numru ta 'hits
  4. Imblokka bid-dħul "Iċħad minn" fil-fajl .htaccess
  5. Għażliet oħra, bħal iptables u regoli għal Nginx, mhumiex ikkunsidrati, għaliex qed nikteb dwar l-hosting

Dehret idea, għalhekk huwa meħtieġ li tiġi implimentata, kif mingħajrha ...

  • Oħloq tabelli għall-akkumulazzjoni tad-dejta
    CREATE TABLE `wp_visiters_bot` (
    	`id` INT(11) NOT NULL AUTO_INCREMENT,
    	`ip` VARCHAR(300) NULL DEFAULT NULL,
    	`browser` VARCHAR(500) NULL DEFAULT NULL,
    	`cnt` INT(11) NULL DEFAULT NULL,
    	`request` TEXT NULL,
    	`input` TEXT NULL,
    	`data_update` DATETIME NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
    	PRIMARY KEY (`id`),
    	UNIQUE INDEX `ip` (`ip`)
    )
    COMMENT='Кандидаты для блокировки'
    COLLATE='utf8_general_ci'
    ENGINE=InnoDB
    AUTO_INCREMENT=1;
    

    CREATE TABLE `wp_visiters_bot_blocked` (
    	`id` INT(11) NOT NULL AUTO_INCREMENT,
    	`ip` VARCHAR(300) NOT NULL,
    	`data_update` DATETIME NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
    	PRIMARY KEY (`id`),
    	UNIQUE INDEX `ip` (`ip`)
    )
    COMMENT='Список уже заблокированных'
    COLLATE='utf8_general_ci'
    ENGINE=InnoDB
    AUTO_INCREMENT=59;
    

    CREATE TABLE `wp_visiters_bot_history` (
    	`id` INT(11) NOT NULL AUTO_INCREMENT,
    	`ip` VARCHAR(300) NULL DEFAULT NULL,
    	`browser` VARCHAR(500) NULL DEFAULT NULL,
    	`cnt` INT(11) NULL DEFAULT NULL,
    	`data_update` DATETIME NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
    	`data_add` DATETIME NULL DEFAULT CURRENT_TIMESTAMP,
    	PRIMARY KEY (`id`),
    	UNIQUE INDEX `ip` (`ip`)
    )
    COMMENT='История всех запросов для дебага'
    COLLATE='utf8_general_ci'
    ENGINE=InnoDB
    AUTO_INCREMENT=1;
    
  • Ejja noħolqu fajl li fih se npoġġu l-kodiċi. Il-kodiċi se jikteb fit-tabelli tal-kandidati tal-lock u jżomm storja għad-debugging.

    Kodiċi tal-fajl għall-kitba tal-indirizzi IP

    <?php
    
    if (!defined('ABSPATH')) {
        return;
    }
    
    global $wpdb;
    
    /**
     * Вернёт конкретный IP адрес посетителя
     * @return boolean
     */
    function coderun_get_user_ip() {
    
        $client_ip = '';
    
        $address_headers = array(
            'HTTP_CLIENT_IP',
            'HTTP_X_FORWARDED_FOR',
            'HTTP_X_FORWARDED',
            'HTTP_X_CLUSTER_CLIENT_IP',
            'HTTP_FORWARDED_FOR',
            'HTTP_FORWARDED',
            'REMOTE_ADDR',
        );
    
        foreach ($address_headers as $header) {
            if (array_key_exists($header, $_SERVER)) {
    
                $address_chain = explode(',', $_SERVER[$header]);
                $client_ip = trim($address_chain[0]);
    
                break;
            }
        }
    
        if (!$client_ip) {
            return '';
        }
    
    
        if ('0.0.0.0' === $client_ip || '::' === $client_ip || $client_ip == 'unknown') {
            return '';
        }
    
        return $client_ip;
    }
    
    $ip = esc_sql(coderun_get_user_ip()); // IP адрес посетителя
    
    if (empty($ip)) {// Нет IP, ну и идите лесом...
        header('Content-type: application/json;');
        die('Big big bolt....');
    }
    
    $browser = esc_sql($_SERVER['HTTP_USER_AGENT']); //Данные для анализа браузера
    
    $request = esc_sql(wp_json_encode($_REQUEST)); //Последний запрос который был к сайту
    
    $input = esc_sql(file_get_contents('php://input')); //Тело запроса, если было
    
    $cnt = 1;
    
    //Запрос в основную таблицу с временными кондидатами на блокировку
    $query = <<<EOT
        INSERT INTO wp_visiters_bot (`ip`,`browser`,`cnt`,`request`,`input`)
            VALUES  ('{$ip}','{$browser}','{$cnt}','{$request}','$input')
             ON DUPLICATE KEY UPDATE cnt=cnt+1,request=VALUES(request),input=VALUES(input),browser=VALUES(browser)
    EOT;
    
    //Запрос для истории
    $query2 = <<<EOT
        INSERT INTO wp_visiters_bot_history (`ip`,`browser`,`cnt`)
            VALUES  ('{$ip}','{$browser}','{$cnt}')
             ON DUPLICATE KEY UPDATE cnt=cnt+1,browser=VALUES(browser)
    EOT;
    
    
    $wpdb->query($query);
    
    $wpdb->query($query2);
    
    

    L-essenza tal-kodiċi hija li tikseb l-indirizz IP tal-viżitatur u tikteb fuq it-tabella. Jekk ip diġà jinsab fit-tabella, il-qasam cnt (in-numru ta 'talbiet lis-sit) se jiżdied

  • Issa huwa tal-biża'... Issa se jaħarquni għall-azzjonijiet tiegħi 🙂
    Biex tirreġistra kull talba lis-sit, aħna ninkludu l-kodiċi tal-fajl fil-fajl ewlieni ta 'WordPress - wp-load.php. Iva, qed nibdlu l-fajl tal-kernel u huwa wara li l-varjabbli globali $wpdb diġà teżisti

Allura, issa nistgħu naraw kemm-il darba dan jew dak l-indirizz IP huwa mmarkat fit-tabella tagħna u ma 'kikkra kafè inħarsu hemm kull 5 minuti biex nifhmu l-istampa

Aħna nikkalkulaw bots "ħżiena" potenzjali u nibblukkawhom bl-IP

Aktar minn hekk sempliċiment, aħna kkuppjajna l-IP "ta 'ħsara", ftaħna l-fajl .htaccess u żidna fl-aħħar tal-fajl

Order allow,deny
Allow from all
# start_auto_deny_list
Deny from 94.242.55.248
# end_auto_deny_list

Kollox, issa 94.242.55.248 - m'għandux aċċess għas-sit u ma jiġġenerax tagħbija fuq id-database

Imma kull darba li ma jkunx biċċa xogħol tajba ħafna li tikkopjaha b'idejk, u barra minn hekk, il-kodiċi kien maħsub bħala awtonomu

Ejja nżidu fajl li se jiġi esegwit minn CRON kull 30 minuta:

Kodiċi tal-fajl li jimmodifika .htaccess

<?php

/**
 * Файл автоматического задания блокировок по IP адресу
 * Должен запрашиваться через CRON
 */
if (empty($_REQUEST['key'])) {
    die('Hello');
}

require('wp-load.php');

global $wpdb;

$limit_cnt = 70; //Лимит запросов по которым отбирать

$deny_table = $wpdb->get_results("SELECT * FROM wp_visiters_bot WHERE cnt>{$limit_cnt}");

$new_blocked = [];

$exclude_ip = [
    '87.236.16.70'//адрес хостинга
];

foreach ($deny_table as $result) {

    if (in_array($result->ip, $exclude_ip)) {
        continue;
    }

    $wpdb->insert('wp_visiters_bot_blocked', ['ip' => $result->ip], ['%s']);
}

$deny_table_blocked = $wpdb->get_results("SELECT * FROM wp_visiters_bot_blocked");

foreach ($deny_table_blocked as $blocked) {
    $new_blocked[] = $blocked->ip;
}

//Очистка таблицы
$wpdb->query("DELETE FROM wp_visiters_bot");

//echo '<pre>';print_r($new_blocked);echo '</pre>';

$file = '.htaccess';

$start_searche_tag = 'start_auto_deny_list';

$end_searche_tag = 'end_auto_deny_list';

$handle = @fopen($file, "r");
if ($handle) {

    $replace_string = '';//Тест для вставки в файл .htaccess

    $target_content = false; //Флаг нужного нам участка кода

    while (($buffer = fgets($handle, 4096)) !== false) {

        if (stripos($buffer, 'start_auto_deny_list') !== false) {
            $target_content = true;
            continue;
        }

        if (stripos($buffer, 'end_auto_deny_list') !== false) {
            $target_content = false;

            continue;
        }

        if ($target_content) {
            $replace_string .= $buffer;
        }
    }
    if (!feof($handle)) {
        echo "Ошибка: fgets() неожиданно потерпел неудачуn";
    }
    fclose($handle);
}

//Текущий файл .htaccess
$content = file_get_contents($file);

$content = str_replace($replace_string, '', $content);

//Очищаем все блокировки в файле .htaccess
file_put_contents($file, $content);

//Запись новых блокировок
$str = "# {$start_searche_tag}" . PHP_EOL;

foreach ($new_blocked as $key => $value) {
    $str .= "Deny from {$value}" . PHP_EOL;
}

file_put_contents($file, str_replace("# {$start_searche_tag}", $str, file_get_contents($file)));

Il-kodiċi tal-fajl huwa pjuttost sempliċi u primittiv, u l-idea ewlenija tiegħu hija li tieħu kandidati għall-imblukkar u tikteb regoli tal-imblukkar fil-fajl .htaccess bejn il-kummenti
# start_auto_deny_list u # end_auto_deny_list

Issa ips "ta 'ħsara" huma mblukkati minnhom infushom, u l-fajl .htaccess jidher xi ħaġa bħal din:

# BEGIN WordPress
<IfModule mod_rewrite.c>
RewriteEngine On
RewriteBase /
RewriteRule ^index.php$ - [L]
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule . /index.php [L]
</IfModule>

# END WordPress

Order allow,deny
Allow from all

# start_auto_deny_list
Deny from 94.242.55.248
Deny from 207.46.13.122
Deny from 66.249.64.164
Deny from 54.209.162.70
Deny from 40.77.167.86
Deny from 54.146.43.69
Deny from 207.46.13.168
....... ниже другие адреса
# end_auto_deny_list

Bħala riżultat, wara l-bidu tal-azzjoni ta 'tali kodiċi, tista' tara r-riżultat fil-pannell tal-hosting:

Aħna nikkalkulaw bots "ħżiena" potenzjali u nibblukkawhom bl-IP

PS: Il-materjal tal-awtur, għalkemm ippublikajt parti minnu fuq il-websajt tiegħi, Habre irriżulta li kien verżjoni aktar estiża.

Sors: www.habr.com

Żid kumment