VACUUM தோல்வியுற்றால், மேசையை கைமுறையாக சுத்தம் செய்கிறோம்

வெற்றிட PostgreSQL இல் உள்ள அட்டவணையில் இருந்து "சுத்தம்" செய்ய முடியும் யாரும் பார்க்க முடியாது - அதாவது, இந்தப் பதிவுகள் மாற்றப்படுவதற்கு முன் தொடங்கப்பட்ட ஒரு செயலில் உள்ள கோரிக்கையும் இல்லை.

ஆனால் அத்தகைய விரும்பத்தகாத வகை (OLTP தரவுத்தளத்தில் நீண்ட கால OLAP சுமை) இன்னும் இருந்தால் என்ன செய்வது? எப்படி சுறுசுறுப்பாக மாறும் அட்டவணையை சுத்தம் செய்யவும் நீண்ட வினவல்களால் சூழப்பட்டிருக்கிறதா?

VACUUM தோல்வியுற்றால், மேசையை கைமுறையாக சுத்தம் செய்கிறோம்

ரேக் வெளியே போடுதல்

முதலில், நாம் தீர்க்க விரும்பும் பிரச்சனை என்ன, அது எவ்வாறு எழுகிறது என்பதைத் தீர்மானிப்போம்.

பொதுவாக இந்த நிலை ஏற்படும் ஒப்பீட்டளவில் சிறிய மேஜையில், ஆனால் இதில் நிகழ்கிறது நிறைய மாற்றங்கள். பொதுவாக இது அல்லது வேறுபட்டது மீட்டர்/மொத்தம்/மதிப்பீடுகள், இதில் UPDATE அடிக்கடி செயல்படுத்தப்படுகிறது, அல்லது தாங்கல்-வரிசை தொடர்ந்து நடந்துகொண்டிருக்கும் சில நிகழ்வுகளை செயலாக்க, அவற்றின் பதிவுகள் தொடர்ந்து செருகப்படும்/நீக்கப்படும்.

மதிப்பீடுகளுடன் விருப்பத்தை மீண்டும் உருவாக்க முயற்சிப்போம்:

CREATE TABLE tbl(k text PRIMARY KEY, v integer);
CREATE INDEX ON tbl(v DESC); -- по этому индексу будем строить рейтинг

INSERT INTO
  tbl
SELECT
  chr(ascii('a'::text) + i) k
, 0 v
FROM
  generate_series(0, 25) i;

மற்றும் இணையாக, மற்றொரு இணைப்பில், ஒரு நீண்ட, நீண்ட கோரிக்கை தொடங்குகிறது, சில சிக்கலான புள்ளிவிவரங்களை சேகரிக்கிறது, ஆனால் எங்கள் அட்டவணையை பாதிக்காது:

SELECT pg_sleep(10000);

இப்போது நாம் கவுண்டர்களில் ஒன்றின் மதிப்பை பல முறை புதுப்பிக்கிறோம். பரிசோதனையின் தூய்மைக்காக, இதைச் செய்வோம் dblink ஐப் பயன்படுத்தி தனி பரிவர்த்தனைகளில்நிஜத்தில் எப்படி நடக்கும்:

DO $$
DECLARE
  i integer;
  tsb timestamp;
  tse timestamp;
  d double precision;
BEGIN
  PERFORM dblink_connect('dbname=' || current_database() || ' port=' || current_setting('port'));
  FOR i IN 1..10000 LOOP
    tsb = clock_timestamp();
    PERFORM dblink($e$UPDATE tbl SET v = v + 1 WHERE k = 'a';$e$);
    tse = clock_timestamp();
    IF i % 1000 = 0 THEN
      d = (extract('epoch' from tse) - extract('epoch' from tsb)) * 1000;
      RAISE NOTICE 'i = %, exectime = %', lpad(i::text, 5), lpad(d::text, 5);
    END IF;
  END LOOP;
  PERFORM dblink_disconnect();
END;
$$ LANGUAGE plpgsql;

NOTICE:  i =  1000, exectime = 0.524
NOTICE:  i =  2000, exectime = 0.739
NOTICE:  i =  3000, exectime = 1.188
NOTICE:  i =  4000, exectime = 2.508
NOTICE:  i =  5000, exectime = 1.791
NOTICE:  i =  6000, exectime = 2.658
NOTICE:  i =  7000, exectime = 2.318
NOTICE:  i =  8000, exectime = 2.572
NOTICE:  i =  9000, exectime = 2.929
NOTICE:  i = 10000, exectime = 3.808

என்ன நடந்தது? ஏன் ஒரு பதிவின் எளிமையான புதுப்பிப்புக்கு கூட செயல்படுத்தும் நேரம் 7 மடங்கு குறைக்கப்பட்டது - 0.524ms முதல் 3.808ms வரை? மேலும் எங்கள் மதிப்பீடு மேலும் மேலும் மெதுவாக வளர்ந்து வருகிறது.

இது எல்லாம் எம்விசிசியின் தவறு.

இது பற்றியது MVCC பொறிமுறை, இது நுழைவின் அனைத்து முந்தைய பதிப்புகளையும் பார்க்க வினவலை ஏற்படுத்துகிறது. எனவே "இறந்த" பதிப்புகளிலிருந்து எங்கள் அட்டவணையை சுத்தம் செய்வோம்:

VACUUM VERBOSE tbl;

INFO:  vacuuming "public.tbl"
INFO:  "tbl": found 0 removable, 10026 nonremovable row versions in 45 out of 45 pages
DETAIL:  10000 dead row versions cannot be removed yet, oldest xmin: 597439602

ஓ, சுத்தம் செய்ய எதுவும் இல்லை! இணை இயங்கும் கோரிக்கை எங்களுக்கு இடையூறாக உள்ளது - எல்லாவற்றிற்கும் மேலாக, அவர் ஒருநாள் இந்த பதிப்புகளுக்கு மாற விரும்பலாம் (என்ன என்றால்?), அவை அவருக்குக் கிடைக்க வேண்டும். எனவே VACUUM FULL கூட நமக்கு உதவாது.

மேசையை "இடிக்கிறது"

ஆனால் அந்த வினவலுக்கு எங்கள் அட்டவணை தேவையில்லை என்பது எங்களுக்குத் தெரியும். எனவே, அட்டவணையில் இருந்து தேவையற்ற அனைத்தையும் நீக்குவதன் மூலம் கணினி செயல்திறனை போதுமான வரம்புகளுக்குத் திருப்ப முயற்சிப்போம் - குறைந்தபட்சம் "கைமுறையாக", ஏனெனில் VACUUM கொடுக்கிறது.

அதை மேலும் தெளிவுபடுத்த, இடையக அட்டவணையின் உதாரணத்தைப் பார்ப்போம். அதாவது, INSERT/DELETE இன் பெரிய ஓட்டம் உள்ளது, சில சமயங்களில் அட்டவணை முற்றிலும் காலியாக இருக்கும். ஆனால் அது காலியாக இல்லை என்றால், நாம் வேண்டும் அதன் தற்போதைய உள்ளடக்கங்களை சேமிக்கவும்.

#0: நிலைமையை மதிப்பிடுதல்

ஒவ்வொரு செயல்பாட்டிற்குப் பிறகும் நீங்கள் அட்டவணையில் ஏதாவது செய்ய முயற்சி செய்யலாம் என்பது தெளிவாகிறது, ஆனால் இது மிகவும் அர்த்தமுள்ளதாக இல்லை - இலக்கு வினவல்களின் செயல்திறனை விட பராமரிப்பு மேல்நிலை தெளிவாக இருக்கும்.

அளவுகோல்களை உருவாக்குவோம் - "இது செயல்பட வேண்டிய நேரம்" என்றால்:

  • VACUUM மிக நீண்ட காலத்திற்கு முன்பு தொடங்கப்பட்டது
    நாங்கள் அதிக சுமைகளை எதிர்பார்க்கிறோம், அது இருக்கட்டும் 60 வினாடிகள் கடைசி [தானியங்கு] வெற்றிடத்திலிருந்து.
  • உடல் அட்டவணை அளவு இலக்கை விட பெரியது
    குறைந்தபட்ச அளவுடன் ஒப்பிடும்போது பக்கங்களின் எண்ணிக்கையை (8KB தொகுதிகள்) இருமடங்காக வரையறுக்கலாம் - குவியலுக்கு 1 blk + ஒவ்வொரு குறியீட்டிற்கும் 1 blk - சாத்தியமான காலி அட்டவணைக்கு. ஒரு குறிப்பிட்ட அளவு தரவு எப்பொழுதும் "சாதாரணமாக" இடையகத்தில் இருக்கும் என்று நாங்கள் எதிர்பார்த்தால், இந்த சூத்திரத்தை மாற்றுவது நியாயமானது.

சரிபார்ப்பு கோரிக்கை

SELECT
  relpages
, ((
    SELECT
      count(*)
    FROM
      pg_index
    WHERE
      indrelid = cl.oid
  ) + 1) << 13 size_norm -- тут правильнее делать * current_setting('block_size')::bigint, но кто меняет размер блока?..
, pg_total_relation_size(oid) size
, coalesce(extract('epoch' from (now() - greatest(
    pg_stat_get_last_vacuum_time(oid)
  , pg_stat_get_last_autovacuum_time(oid)
  ))), 1 << 30) vaclag
FROM
  pg_class cl
WHERE
  oid = $1::regclass -- tbl
LIMIT 1;

relpages | size_norm | size    | vaclag
-------------------------------------------
       0 |     24576 | 1105920 | 3392.484835

#1: இன்னும் வெற்றிடம்

ஒரு இணையான வினவல் எங்களுடன் குறிப்பிடத்தக்க வகையில் குறுக்கிடுகிறதா என்பதை எங்களால் முன்கூட்டியே அறிய முடியாது - அது தொடங்கியதிலிருந்து எத்தனை பதிவுகள் "காலாவதியாகிவிட்டன". எனவே, அட்டவணையை எப்படியாவது செயலாக்க முடிவு செய்தால், எப்படியிருந்தாலும், முதலில் அதை இயக்க வேண்டும் வெற்றிட - VACUUM FULL போலல்லாமல், படிக்க-எழுதும் தரவுகளுடன் பணிபுரியும் இணையான செயல்முறைகளில் இது தலையிடாது.

அதே நேரத்தில், நாம் அகற்ற விரும்பும் பெரும்பாலானவற்றை உடனடியாக சுத்தம் செய்யலாம். ஆம், இந்த அட்டவணையில் உள்ள அடுத்தடுத்த கேள்விகள் எங்களிடம் செல்லும் "ஹாட் கேச்" மூலம், இது அவர்களின் கால அளவைக் குறைக்கும் - எனவே, எங்கள் சேவை பரிவர்த்தனை மூலம் மற்றவர்களைத் தடுப்பதற்கான மொத்த நேரம்.

#2: வீட்டில் யாராவது இருக்கிறார்களா?

அட்டவணையில் ஏதாவது இருக்கிறதா என்று பார்ப்போம்:

TABLE tbl LIMIT 1;

ஒரு பதிவு கூட மீதம் இல்லை என்றால், வெறுமனே செய்வதன் மூலம் செயலாக்கத்தில் நிறைய சேமிக்க முடியும் துண்டிக்கவும்:

இது ஒவ்வொரு அட்டவணைக்கும் நிபந்தனையற்ற DELETE கட்டளையைப் போலவே செயல்படுகிறது, ஆனால் இது உண்மையில் அட்டவணைகளை ஸ்கேன் செய்யாததால் மிக வேகமாக இருக்கும். மேலும், இது உடனடியாக வட்டு இடத்தை விடுவிக்கிறது, எனவே பின்னர் ஒரு VACUUM செயல்பாட்டைச் செய்ய வேண்டிய அவசியமில்லை.

அட்டவணை வரிசை கவுண்டரை (RESTART IDENTITY) மீட்டமைக்க வேண்டுமா என்பதை நீங்கள் தீர்மானிக்க வேண்டும்.

#3: அனைவரும் - மாறி மாறி எடுங்கள்!

நாங்கள் மிகவும் போட்டி நிறைந்த சூழலில் பணிபுரிவதால், அட்டவணையில் உள்ளீடுகள் எதுவும் இல்லை என்பதை நாங்கள் சரிபார்க்கும்போது, ​​யாராவது ஏற்கனவே அங்கு ஏதாவது எழுதியிருக்கலாம். இந்த தகவலை நாம் இழக்கக்கூடாது, அதனால் என்ன? அது சரி, யாராலும் உறுதியாக எழுத முடியாது என்பதை உறுதி செய்ய வேண்டும்.

இதைச் செய்ய, நாம் இயக்க வேண்டும் சீரியலிசபிள்எங்கள் பரிவர்த்தனைக்கான தனிமைப்படுத்தல் (ஆம், இங்கே நாங்கள் ஒரு பரிவர்த்தனையைத் தொடங்குகிறோம்) மற்றும் அட்டவணையை "இறுக்கமாக" பூட்டுகிறோம்:

BEGIN TRANSACTION ISOLATION LEVEL SERIALIZABLE;
LOCK TABLE tbl IN ACCESS EXCLUSIVE MODE;

தடுப்பின் இந்த நிலை நாம் செய்ய விரும்பும் செயல்பாடுகளால் தீர்மானிக்கப்படுகிறது.

#4: வட்டி மோதல்

நாங்கள் இங்கு வந்து அடையாளத்தை "பூட்ட" விரும்புகிறோம் - அந்த நேரத்தில் யாராவது அதில் செயலில் இருந்தால், எடுத்துக்காட்டாக, அதிலிருந்து படித்தால் என்ன செய்வது? இந்த தொகுதி வெளியிடப்படும் வரை நாங்கள் "தொங்குவோம்", மேலும் படிக்க விரும்பும் மற்றவர்கள் எங்களிடம் ஓடுவார்கள்...

இது நிகழாமல் தடுக்க, "நம்மை தியாகம் செய்வோம்" - ஒரு குறிப்பிட்ட (ஏற்றுக்கொள்ளக்கூடிய குறுகிய) நேரத்திற்குள் ஒரு பூட்டைப் பெற முடியாவிட்டால், அடிப்படையிலிருந்து விதிவிலக்கு பெறுவோம், ஆனால் குறைந்தபட்சம் நாங்கள் அதிகமாக தலையிட மாட்டோம். மற்றவைகள்.

இதைச் செய்ய, அமர்வு மாறியை அமைக்கவும் பூட்டு_நேரம் முடிந்தது (பதிப்புகளுக்கு 9.3+) அல்லது/மற்றும் அறிக்கை_நேரம் முடிந்தது. நினைவில் கொள்ள வேண்டிய முக்கிய விஷயம் என்னவென்றால், statement_timeout மதிப்பு அடுத்த அறிக்கையிலிருந்து மட்டுமே பொருந்தும். அதாவது, ஒட்டுவதில் இப்படி - வேலை செய்யாது:

SET statement_timeout = ...;LOCK TABLE ...;

பின்னர் மாறியின் "பழைய" மதிப்பை மீட்டெடுப்பதைச் சமாளிக்க வேண்டியதில்லை, நாங்கள் படிவத்தைப் பயன்படுத்துகிறோம் உள்ளூரில் அமைக்கவும், இது தற்போதைய பரிவர்த்தனைக்கு அமைப்பின் நோக்கத்தை கட்டுப்படுத்துகிறது.

ஸ்டேட்மென்ட்_டைம்அவுட் அனைத்து அடுத்தடுத்த கோரிக்கைகளுக்கும் பொருந்தும் என்பதை நாங்கள் நினைவில் கொள்கிறோம், இதனால் அட்டவணையில் நிறைய தரவு இருந்தால் பரிவர்த்தனை ஏற்றுக்கொள்ள முடியாத மதிப்புகளுக்கு நீட்டிக்க முடியாது.

#5: தரவை நகலெடுக்கவும்

அட்டவணை முற்றிலும் காலியாக இல்லாவிட்டால், துணை தற்காலிக அட்டவணையைப் பயன்படுத்தி தரவை மீண்டும் சேமிக்க வேண்டும்:

CREATE TEMPORARY TABLE _tmp_swap ON COMMIT DROP AS TABLE tbl;

கையெழுத்து கமிட் டிராப்பில் பரிவர்த்தனை முடிவடையும் தருணத்தில், தற்காலிக அட்டவணை நிறுத்தப்படும், மேலும் இணைப்பு சூழலில் அதை கைமுறையாக நீக்க வேண்டிய அவசியமில்லை.

நிறைய "நேரடி" தரவு இல்லை என்று நாங்கள் கருதுவதால், இந்த செயல்பாடு மிக விரைவாக நடக்க வேண்டும்.

சரி, அவ்வளவுதான்! பரிவர்த்தனையை முடித்த பிறகு மறந்துவிடாதீர்கள் பகுப்பாய்வு இயக்கவும் தேவைப்பட்டால் அட்டவணை புள்ளிவிவரங்களை இயல்பாக்குவதற்கு.

இறுதி ஸ்கிரிப்டை ஒன்றாக இணைத்தல்

நாங்கள் இந்த "போலி-பைத்தான்" பயன்படுத்துகிறோம்:

# собираем статистику с таблицы
stat <-
  SELECT
    relpages
  , ((
      SELECT
        count(*)
      FROM
        pg_index
      WHERE
        indrelid = cl.oid
    ) + 1) << 13 size_norm
  , pg_total_relation_size(oid) size
  , coalesce(extract('epoch' from (now() - greatest(
      pg_stat_get_last_vacuum_time(oid)
    , pg_stat_get_last_autovacuum_time(oid)
    ))), 1 << 30) vaclag
  FROM
    pg_class cl
  WHERE
    oid = $1::regclass -- table_name
  LIMIT 1;

# таблица больше целевого размера и VACUUM был давно
if stat.size > 2 * stat.size_norm and stat.vaclag is None or stat.vaclag > 60:
  -> VACUUM %table;
  try:
    -> BEGIN TRANSACTION ISOLATION LEVEL SERIALIZABLE;
    # пытаемся захватить монопольную блокировку с предельным временем ожидания 1s
    -> SET LOCAL statement_timeout = '1s'; SET LOCAL lock_timeout = '1s';
    -> LOCK TABLE %table IN ACCESS EXCLUSIVE MODE;
    # надо убедиться в пустоте таблицы внутри транзакции с блокировкой
    row <- TABLE %table LIMIT 1;
    # если в таблице нет ни одной "живой" записи - очищаем ее полностью, в противном случае - "перевставляем" все записи через временную таблицу
    if row is None:
      -> TRUNCATE TABLE %table RESTART IDENTITY;
    else:
      # создаем временную таблицу с данными таблицы-оригинала
      -> CREATE TEMPORARY TABLE _tmp_swap ON COMMIT DROP AS TABLE %table;
      # очищаем оригинал без сброса последовательности
      -> TRUNCATE TABLE %table;
      # вставляем все сохраненные во временной таблице данные обратно
      -> INSERT INTO %table TABLE _tmp_swap;
    -> COMMIT;
  except Exception as e:
    # если мы получили ошибку, но соединение все еще "живо" - словили таймаут
    if not isinstance(e, InterfaceError):
      -> ROLLBACK;

இரண்டாவது முறையாக தரவை நகலெடுக்காமல் இருக்க முடியுமா?கொள்கையளவில், அட்டவணையின் oid ஆனது BL பக்கத்திலிருந்தோ அல்லது DB பக்கத்திலிருந்து FK மூலமாகவோ வேறு எந்த நடவடிக்கைகளுடனும் இணைக்கப்படவில்லை என்றால் அது சாத்தியமாகும்:

CREATE TABLE _swap_%table(LIKE %table INCLUDING ALL);
INSERT INTO _swap_%table TABLE %table;
DROP TABLE %table;
ALTER TABLE _swap_%table RENAME TO %table;

மூல அட்டவணையில் ஸ்கிரிப்டை இயக்கி, அளவீடுகளைச் சரிபார்ப்போம்:

VACUUM tbl;
BEGIN TRANSACTION ISOLATION LEVEL SERIALIZABLE;
  SET LOCAL statement_timeout = '1s'; SET LOCAL lock_timeout = '1s';
  LOCK TABLE tbl IN ACCESS EXCLUSIVE MODE;
  CREATE TEMPORARY TABLE _tmp_swap ON COMMIT DROP AS TABLE tbl;
  TRUNCATE TABLE tbl;
  INSERT INTO tbl TABLE _tmp_swap;
COMMIT;

relpages | size_norm | size   | vaclag
-------------------------------------------
       0 |     24576 |  49152 | 32.705771

எல்லாம் வேலை செய்தது! அட்டவணை 50 மடங்கு சுருங்கிவிட்டது, எல்லா புதுப்பிப்புகளும் மீண்டும் வேகமாக இயங்குகின்றன.

ஆதாரம்: www.habr.com

கருத்தைச் சேர்