మేము సంభావ్య "చెడు" బాట్లను గుర్తించి, IP ద్వారా వాటిని బ్లాక్ చేస్తాము

మేము సంభావ్య "చెడు" బాట్లను గుర్తించి, IP ద్వారా వాటిని బ్లాక్ చేస్తాము

మంచి రోజు! సాధారణ హోస్టింగ్ యొక్క వినియోగదారులు సైట్‌లో అధిక లోడ్‌ను ఉత్పత్తి చేసే IP చిరునామాలను ఎలా పట్టుకోగలరో వ్యాసంలో నేను మీకు చెప్తాను మరియు హోస్టింగ్ సాధనాలను ఉపయోగించి వాటిని బ్లాక్ చేయండి, php కోడ్ యొక్క “కొద్దిగా”, కొన్ని స్క్రీన్‌షాట్‌లు ఉంటాయి.

ఇన్‌పుట్ డేటా:

  1. CMS WordPressలో వెబ్‌సైట్ సృష్టించబడింది
  2. హోస్టింగ్ బెగెట్ (ఇది ప్రకటన కాదు, కానీ అడ్మిన్ ప్యానెల్ స్క్రీన్‌షాట్‌లు ఈ నిర్దిష్ట హోస్టింగ్ ప్రొవైడర్ నుండి ఉంటాయి)
  3. WordPress సైట్ 2000 ప్రారంభంలో ఎక్కడో ప్రారంభించబడింది మరియు పెద్ద సంఖ్యలో కథనాలు మరియు సామగ్రిని కలిగి ఉంది
  4. PHP వెర్షన్ 7.2
  5. WP తాజా వెర్షన్‌ను కలిగి ఉంది
  6. కొంతకాలంగా, సైట్ హోస్టింగ్ డేటా ప్రకారం MySQL పై అధిక లోడ్‌ను ఉత్పత్తి చేయడం ప్రారంభించింది. ప్రతి రోజు ఈ విలువ ఖాతాకు 120% కట్టుబాటును మించిపోయింది
  7. Yandex ప్రకారం. మెట్రికా సైట్‌ను రోజుకు 100-200 మంది సందర్శిస్తారు

అన్నింటిలో మొదటిది, ఇది జరిగింది:

  1. పేరుకుపోయిన చెత్తను డేటాబేస్ టేబుల్స్ క్లియర్ చేశారు
  2. అనవసరమైన ప్లగిన్‌లు నిలిపివేయబడ్డాయి, కాలం చెల్లిన కోడ్ యొక్క విభాగాలు తీసివేయబడ్డాయి

అదే సమయంలో, కాషింగ్ ఎంపికలు (కాషింగ్ ప్లగిన్‌లు) ప్రయత్నించబడ్డాయి, పరిశీలనలు చేయబడ్డాయి - కానీ ఒక సైట్ నుండి 120% లోడ్ మారలేదు మరియు అది మాత్రమే పెరగగలదని నేను మీ దృష్టిని ఆకర్షించాలనుకుంటున్నాను.

హోస్టింగ్ డేటాబేస్‌లపై సుమారుగా లోడ్ ఎలా ఉంది

మేము సంభావ్య "చెడు" బాట్లను గుర్తించి, IP ద్వారా వాటిని బ్లాక్ చేస్తాము
ఎగువన సందేహాస్పద సైట్ ఉంది, దిగువన అదే సెం.మీ.లు మరియు దాదాపు ఒకే ట్రాఫిక్ ఉన్న ఇతర సైట్‌లు ఉన్నాయి, కానీ తక్కువ లోడ్‌ను సృష్టిస్తాయి.

Анализ

  • డేటా కాషింగ్ ఎంపికలతో అనేక ప్రయత్నాలు జరిగాయి, అనేక వారాల పాటు పరిశీలనలు జరిగాయి (అదృష్టవశాత్తూ, ఈ సమయంలో హోస్టింగ్ నేను చాలా చెడ్డవాడినని మరియు డిస్‌కనెక్ట్ చేయబడతానని నాకు ఎప్పుడూ వ్రాయలేదు)
  • నెమ్మదిగా ప్రశ్నల కోసం విశ్లేషణ మరియు శోధన ఉంది, ఆపై డేటాబేస్ నిర్మాణం మరియు పట్టిక రకం కొద్దిగా మార్చబడ్డాయి
  • విశ్లేషణ కోసం, మేము ప్రాథమికంగా అంతర్నిర్మిత AWStatsని ఉపయోగించాము (మార్గం ద్వారా, ఇది ట్రాఫిక్ వాల్యూమ్ ఆధారంగా చెత్త IP చిరునామాను లెక్కించడంలో సహాయపడింది
  • మెట్రిక్ - మెట్రిక్ వ్యక్తుల గురించి మాత్రమే సమాచారాన్ని అందిస్తుంది, బాట్‌ల గురించి కాదు
  • WP కోసం ప్లగిన్‌లను ఉపయోగించే ప్రయత్నాలు జరిగాయి, ఇవి లొకేషన్ దేశం మరియు వివిధ కలయికల ద్వారా కూడా సందర్శకులను ఫిల్టర్ చేయగలవు మరియు బ్లాక్ చేయగలవు
  • "మేము నిర్వహణలో ఉన్నాము" అనే గమనికతో సైట్‌ను ఒక రోజు మూసివేయడం పూర్తిగా రాడికల్ మార్గంగా మారింది - ఇది ప్రసిద్ధ ప్లగ్ఇన్‌ను ఉపయోగించి కూడా జరిగింది. ఈ సందర్భంలో, లోడ్ తగ్గుతుందని మేము ఆశిస్తున్నాము, కానీ సున్నా విలువలకు కాదు, WP భావజాలం హుక్స్‌పై ఆధారపడి ఉంటుంది మరియు ప్లగిన్‌లు “హుక్” సంభవించినప్పుడు వాటి కార్యాచరణను ప్రారంభిస్తాయి మరియు “హుక్” సంభవించే ముందు, డేటాబేస్‌కు అభ్యర్థనలు చేయవచ్చు ఇప్పటికే తయారు చేయబడింది

ఆలోచన

  1. తక్కువ వ్యవధిలో చాలా అభ్యర్థనలు చేసే IP చిరునామాలను లెక్కించండి.
  2. సైట్‌కు హిట్‌ల సంఖ్యను రికార్డ్ చేయండి
  3. హిట్‌ల సంఖ్య ఆధారంగా సైట్‌కి యాక్సెస్‌ని బ్లాక్ చేయండి
  4. .htaccess ఫైల్‌లో “నుండి తిరస్కరించు” ఎంట్రీని ఉపయోగించి బ్లాక్ చేయండి
  5. నేను iptables మరియు Nginx కోసం నియమాలు వంటి ఇతర ఎంపికలను పరిగణించలేదు, ఎందుకంటే నేను హోస్టింగ్ గురించి వ్రాస్తున్నాను

ఒక ఆలోచన కనిపించింది, కాబట్టి ఇది లేకుండా అమలు చేయాలి ...

  • డేటాను కూడబెట్టడానికి పట్టికలను సృష్టిస్తోంది
    CREATE TABLE `wp_visiters_bot` (
    	`id` INT(11) NOT NULL AUTO_INCREMENT,
    	`ip` VARCHAR(300) NULL DEFAULT NULL,
    	`browser` VARCHAR(500) NULL DEFAULT NULL,
    	`cnt` INT(11) NULL DEFAULT NULL,
    	`request` TEXT NULL,
    	`input` TEXT NULL,
    	`data_update` DATETIME NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
    	PRIMARY KEY (`id`),
    	UNIQUE INDEX `ip` (`ip`)
    )
    COMMENT='Кандидаты для блокировки'
    COLLATE='utf8_general_ci'
    ENGINE=InnoDB
    AUTO_INCREMENT=1;
    

    CREATE TABLE `wp_visiters_bot_blocked` (
    	`id` INT(11) NOT NULL AUTO_INCREMENT,
    	`ip` VARCHAR(300) NOT NULL,
    	`data_update` DATETIME NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
    	PRIMARY KEY (`id`),
    	UNIQUE INDEX `ip` (`ip`)
    )
    COMMENT='Список уже заблокированных'
    COLLATE='utf8_general_ci'
    ENGINE=InnoDB
    AUTO_INCREMENT=59;
    

    CREATE TABLE `wp_visiters_bot_history` (
    	`id` INT(11) NOT NULL AUTO_INCREMENT,
    	`ip` VARCHAR(300) NULL DEFAULT NULL,
    	`browser` VARCHAR(500) NULL DEFAULT NULL,
    	`cnt` INT(11) NULL DEFAULT NULL,
    	`data_update` DATETIME NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
    	`data_add` DATETIME NULL DEFAULT CURRENT_TIMESTAMP,
    	PRIMARY KEY (`id`),
    	UNIQUE INDEX `ip` (`ip`)
    )
    COMMENT='История всех запросов для дебага'
    COLLATE='utf8_general_ci'
    ENGINE=InnoDB
    AUTO_INCREMENT=1;
    
  • మనం కోడ్‌ను ఉంచే ఫైల్‌ను క్రియేట్ చేద్దాం. కోడ్ నిరోధించే అభ్యర్థి పట్టికలలో రికార్డ్ చేస్తుంది మరియు డీబగ్గింగ్ కోసం చరిత్రను ఉంచుతుంది.

    IP చిరునామాలను రికార్డ్ చేయడానికి ఫైల్ కోడ్

    <?php
    
    if (!defined('ABSPATH')) {
        return;
    }
    
    global $wpdb;
    
    /**
     * Вернёт конкретный IP адрес посетителя
     * @return boolean
     */
    function coderun_get_user_ip() {
    
        $client_ip = '';
    
        $address_headers = array(
            'HTTP_CLIENT_IP',
            'HTTP_X_FORWARDED_FOR',
            'HTTP_X_FORWARDED',
            'HTTP_X_CLUSTER_CLIENT_IP',
            'HTTP_FORWARDED_FOR',
            'HTTP_FORWARDED',
            'REMOTE_ADDR',
        );
    
        foreach ($address_headers as $header) {
            if (array_key_exists($header, $_SERVER)) {
    
                $address_chain = explode(',', $_SERVER[$header]);
                $client_ip = trim($address_chain[0]);
    
                break;
            }
        }
    
        if (!$client_ip) {
            return '';
        }
    
    
        if ('0.0.0.0' === $client_ip || '::' === $client_ip || $client_ip == 'unknown') {
            return '';
        }
    
        return $client_ip;
    }
    
    $ip = esc_sql(coderun_get_user_ip()); // IP адрес посетителя
    
    if (empty($ip)) {// Нет IP, ну и идите лесом...
        header('Content-type: application/json;');
        die('Big big bolt....');
    }
    
    $browser = esc_sql($_SERVER['HTTP_USER_AGENT']); //Данные для анализа браузера
    
    $request = esc_sql(wp_json_encode($_REQUEST)); //Последний запрос который был к сайту
    
    $input = esc_sql(file_get_contents('php://input')); //Тело запроса, если было
    
    $cnt = 1;
    
    //Запрос в основную таблицу с временными кондидатами на блокировку
    $query = <<<EOT
        INSERT INTO wp_visiters_bot (`ip`,`browser`,`cnt`,`request`,`input`)
            VALUES  ('{$ip}','{$browser}','{$cnt}','{$request}','$input')
             ON DUPLICATE KEY UPDATE cnt=cnt+1,request=VALUES(request),input=VALUES(input),browser=VALUES(browser)
    EOT;
    
    //Запрос для истории
    $query2 = <<<EOT
        INSERT INTO wp_visiters_bot_history (`ip`,`browser`,`cnt`)
            VALUES  ('{$ip}','{$browser}','{$cnt}')
             ON DUPLICATE KEY UPDATE cnt=cnt+1,browser=VALUES(browser)
    EOT;
    
    
    $wpdb->query($query);
    
    $wpdb->query($query2);
    
    

    సందర్శకుల IP చిరునామాను పొందడం మరియు దానిని పట్టికలో వ్రాయడం కోడ్ యొక్క సారాంశం. ip ఇప్పటికే పట్టికలో ఉంటే, cnt ఫీల్డ్ పెరుగుతుంది (సైట్‌కి అభ్యర్థనల సంఖ్య)

  • ఇప్పుడు భయంకరమైన విషయం ఏమిటంటే, ఇప్పుడు వారు నా చర్యలకు నన్ను కాల్చేస్తారు :)
    సైట్‌కు ప్రతి అభ్యర్థనను రికార్డ్ చేయడానికి, మేము ఫైల్ కోడ్‌ను ప్రధాన WordPress ఫైల్‌కి కనెక్ట్ చేస్తాము - wp-load.php. అవును, మేము కెర్నల్ ఫైల్‌ను మారుస్తాము మరియు గ్లోబల్ వేరియబుల్ $wpdb ఇప్పటికే ఉనికిలో ఉన్న తర్వాత ఖచ్చితంగా

కాబట్టి, ఇప్పుడు మన టేబుల్‌లో ఈ లేదా ఆ IP చిరునామా ఎంత తరచుగా గుర్తించబడిందో చూడవచ్చు మరియు చిత్రాన్ని అర్థం చేసుకోవడానికి ప్రతి 5 నిమిషాలకు ఒకసారి కాఫీ కప్పుతో చూస్తాము.

మేము సంభావ్య "చెడు" బాట్లను గుర్తించి, IP ద్వారా వాటిని బ్లాక్ చేస్తాము

ఆపై కేవలం "హానికరమైన" IPని కాపీ చేసి, .htaccess ఫైల్‌ని తెరిచి, దానిని ఫైల్ చివరకి జోడించండి

Order allow,deny
Allow from all
# start_auto_deny_list
Deny from 94.242.55.248
# end_auto_deny_list

అంతే, ఇప్పుడు 94.242.55.248 - సైట్‌కు ప్రాప్యత లేదు మరియు డేటాబేస్‌లో లోడ్‌ను ఉత్పత్తి చేయదు

కానీ ప్రతిసారీ ఇలా చేతితో కాపీ చేయడం చాలా ధర్మబద్ధమైన పని కాదు, అంతేకాకుండా, కోడ్ స్వయంప్రతిపత్తిగా ఉండాలనే ఉద్దేశ్యంతో ఉంటుంది.

ప్రతి 30 నిమిషాలకు CRON ద్వారా అమలు చేయబడే ఫైల్‌ని జోడిద్దాం:

ఫైల్ కోడ్ సవరించడం .htaccess

<?php

/**
 * Файл автоматического задания блокировок по IP адресу
 * Должен запрашиваться через CRON
 */
if (empty($_REQUEST['key'])) {
    die('Hello');
}

require('wp-load.php');

global $wpdb;

$limit_cnt = 70; //Лимит запросов по которым отбирать

$deny_table = $wpdb->get_results("SELECT * FROM wp_visiters_bot WHERE cnt>{$limit_cnt}");

$new_blocked = [];

$exclude_ip = [
    '87.236.16.70'//адрес хостинга
];

foreach ($deny_table as $result) {

    if (in_array($result->ip, $exclude_ip)) {
        continue;
    }

    $wpdb->insert('wp_visiters_bot_blocked', ['ip' => $result->ip], ['%s']);
}

$deny_table_blocked = $wpdb->get_results("SELECT * FROM wp_visiters_bot_blocked");

foreach ($deny_table_blocked as $blocked) {
    $new_blocked[] = $blocked->ip;
}

//Очистка таблицы
$wpdb->query("DELETE FROM wp_visiters_bot");

//echo '<pre>';print_r($new_blocked);echo '</pre>';

$file = '.htaccess';

$start_searche_tag = 'start_auto_deny_list';

$end_searche_tag = 'end_auto_deny_list';

$handle = @fopen($file, "r");
if ($handle) {

    $replace_string = '';//Тест для вставки в файл .htaccess

    $target_content = false; //Флаг нужного нам участка кода

    while (($buffer = fgets($handle, 4096)) !== false) {

        if (stripos($buffer, 'start_auto_deny_list') !== false) {
            $target_content = true;
            continue;
        }

        if (stripos($buffer, 'end_auto_deny_list') !== false) {
            $target_content = false;

            continue;
        }

        if ($target_content) {
            $replace_string .= $buffer;
        }
    }
    if (!feof($handle)) {
        echo "Ошибка: fgets() неожиданно потерпел неудачуn";
    }
    fclose($handle);
}

//Текущий файл .htaccess
$content = file_get_contents($file);

$content = str_replace($replace_string, '', $content);

//Очищаем все блокировки в файле .htaccess
file_put_contents($file, $content);

//Запись новых блокировок
$str = "# {$start_searche_tag}" . PHP_EOL;

foreach ($new_blocked as $key => $value) {
    $str .= "Deny from {$value}" . PHP_EOL;
}

file_put_contents($file, str_replace("# {$start_searche_tag}", $str, file_get_contents($file)));

ఫైల్ కోడ్ చాలా సరళమైనది మరియు ప్రాచీనమైనది మరియు దీని ప్రధాన ఆలోచన ఏమిటంటే, బ్లాకింగ్ కోసం అభ్యర్థులను తీసుకోవడం మరియు వ్యాఖ్యల మధ్య .htaccess ఫైల్‌లో నిరోధించే నియమాలను నమోదు చేయడం.
# ప్రారంభం_ఆటో_నిరాకరణ_జాబితా మరియు # స్వయంచాలక_నిరాకరణ_జాబితా ముగింపు

ఇప్పుడు “హానికరమైన” IPలు వాటి ద్వారానే బ్లాక్ చేయబడ్డాయి మరియు .htaccess ఫైల్ ఇలా కనిపిస్తుంది:

# BEGIN WordPress
<IfModule mod_rewrite.c>
RewriteEngine On
RewriteBase /
RewriteRule ^index.php$ - [L]
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule . /index.php [L]
</IfModule>

# END WordPress

Order allow,deny
Allow from all

# start_auto_deny_list
Deny from 94.242.55.248
Deny from 207.46.13.122
Deny from 66.249.64.164
Deny from 54.209.162.70
Deny from 40.77.167.86
Deny from 54.146.43.69
Deny from 207.46.13.168
....... ниже другие адреса
# end_auto_deny_list

ఫలితంగా, ఈ కోడ్ పని చేయడం ప్రారంభించిన తర్వాత, మీరు హోస్టింగ్ ప్యానెల్‌లో ఫలితాన్ని చూడవచ్చు:

మేము సంభావ్య "చెడు" బాట్లను గుర్తించి, IP ద్వారా వాటిని బ్లాక్ చేస్తాము

PS: మెటీరియల్ రచయితది, నేను నా వెబ్‌సైట్‌లో కొంత భాగాన్ని ప్రచురించినప్పటికీ, నేను హబ్రేలో మరింత విస్తరించిన సంస్కరణను పొందాను.

మూలం: www.habr.com

ఒక వ్యాఖ్యను జోడించండి