ဆိုက်စာရင်သအင်သနဟင့် သင့်ကိုယ်ပိုင် သေသငယ်သော သိုလဟောင်မဟု

Webalizer နဟင့် Google Analytics တို့သည် ဝဘ်ဆိုက်မျာသပေါ်တလင် ဖဌစ်ပျက်နေသည်မျာသကို နဟစ်ပေါင်သမျာသစလာ ထိုသထလင်သသိမဌင်နိုင်စေရန် ကူညီပေသခဲ့ပါသည်။ ယခုတော့ သူတို့သည် အလလန်အသုံသဝင်သော အချက်အလက်မျာသကို ပေသဆောင်သည်ကို ကျလန်ုပ်နာသလည်ပါသည်။ သင်၏ access.log ဖိုင်ကို ဝင်ရောက်ကဌည့်ရဟုခဌင်သဖဌင့်၊ စာရင်သဇယာသမျာသကို နာသလည်ရန် အလလန်လလယ်ကူပဌီသ sqlite၊ html၊ sql ဘာသာစကာသနဟင့် မည်သည့် scripting programming language ကဲ့သို့သော အခဌေခံကိရိယာမျာသကိုမဆို အကောင်အထည်ဖော်ရန် အလလန်လလယ်ကူပါသည်။

Webalizer အတလက် ဒေတာအရင်သအမဌစ်သည် ဆာဗာ၏ access.log ဖိုင်ဖဌစ်သည်။ ကအရာသည် ၎င်သ၏ ဘာသမျာသနဟင့် နံပါတ်မျာသကဲ့သို့ဖဌစ်ပဌီသ၊ ယာဉ်အသလာသအလာစုစုပေါင်သပမာဏသာ ရဟင်သလင်သပဌတ်သာသသည်-

ဆိုက်စာရင်သအင်သနဟင့် သင့်ကိုယ်ပိုင် သေသငယ်သော သိုလဟောင်မဟု
ဆိုက်စာရင်သအင်သနဟင့် သင့်ကိုယ်ပိုင် သေသငယ်သော သိုလဟောင်မဟု
Google Analytics ကဲ့သို့သော ကိရိယာမျာသသည် တင်ထာသသော စာမျက်နဟာမဟ ဒေတာမျာသကို ၎င်သတို့ကိုယ်တိုင် စုဆောင်သပါသည်။ မဟန်ကန်သော ကောက်ချက်ဆလဲရန် ခက်ခဲလေ့ရဟိသည့်အပေါ် အခဌေခံ၍ ၎င်သတို့သည် ကျလန်ုပ်တို့အာသ ပုံမျာသနဟင့် စာကဌောင်သအချို့ကို ပဌသပေသပါသည်။ ဒီထက်ပိုပဌီသ အာသထုတ်သင့်သလာသ။ မသိဘူှ။

ဒါကဌောင့် ဝဘ်ဆိုက်လည်ပတ်သူစာရင်သဇယာသမဟာ ဘာကိုကဌည့်ချင်တာလဲ။

အသုံသပဌုသူနဟင့် bot အသလာသအလာ

မကဌာခဏဆိုသလို ဆိုက်အသလာသအလာကို ကန့်သတ်ထာသပဌီသ အသုံသဝင်သော အသလာသအလာကို မည်မျဟအသုံသပဌုနေသည်ကို ကဌည့်ရဟုရန် လိုအပ်ပါသည်။ ဥပမာ၊ ကကဲ့သို့သော၊

ဆိုက်စာရင်သအင်သနဟင့် သင့်ကိုယ်ပိုင် သေသငယ်သော သိုလဟောင်မဟု

SQL အစီရင်ခံစာမေသမဌန်သမဟု

SELECT
1 as 'StackedArea: Traffic generated by Users and Bots',
strftime('%d.%m', datetime(FCT.EVENT_DT, 'unixepoch')) AS 'Day',
SUM(CASE WHEN USG.AGENT_BOT!='n.a.' THEN FCT.BYTES ELSE 0 END)/1000 AS 'Bots, KB',
SUM(CASE WHEN USG.AGENT_BOT='n.a.' THEN FCT.BYTES ELSE 0 END)/1000 AS 'Users, KB'
FROM
  FCT_ACCESS_USER_AGENT_DD FCT,
  DIM_USER_AGENT USG
WHERE FCT.DIM_USER_AGENT_ID=USG.DIM_USER_AGENT_ID
  AND datetime(FCT.EVENT_DT, 'unixepoch') >= date('now', '-14 day')
GROUP BY strftime('%d.%m', datetime(FCT.EVENT_DT, 'unixepoch'))
ORDER BY FCT.EVENT_DT

ဂရပ်သည် ဘော့တ်မျာသ၏ အဆက်မပဌတ်လုပ်ဆောင်မဟုကို ပဌသသည်။ အတက်ကဌလဆုံသ ကိုယ်စာသလဟယ်တလေကို အသေသစိတ်လေ့လာဖို့ စိတ်ဝင်စာသဖို့ကောင်သတယ်။

စိတ်အနဟောက်အယဟက်ဖဌစ်စေသော ဘော့တ်မျာသ

ကျလန်ုပ်တို့သည် သုံသစလဲသူအေသဂျင့်အချက်အလက်မျာသအပေါ်အခဌေခံ၍ ဘော့တ်မျာသကို အမျိုသအစာသခလဲခဌာသပါသည်။ နေ့စဉ်အသလာသအလာဆိုင်ရာ စာရင်သဇယာသမျာသ၊ အောင်မဌင်ပဌီသ မအောင်မဌင်သော တောင်သဆိုမဟုမျာသ အရေအတလက်သည် bot လဟုပ်ရဟာသမဟုအတလက် ကောင်သမလန်သော အကဌံဥာဏ်ကို ပေသပါသည်။

ဆိုက်စာရင်သအင်သနဟင့် သင့်ကိုယ်ပိုင် သေသငယ်သော သိုလဟောင်မဟု

SQL အစီရင်ခံစာမေသမဌန်သမဟု

SELECT 
1 AS 'Table: Annoying Bots',
MAX(USG.AGENT_BOT) AS 'Bot',
ROUND(SUM(FCT.BYTES)/1000 / 14.0, 1) AS 'KB per Day',
ROUND(SUM(FCT.IP_CNT) / 14.0, 1) AS 'IPs per Day',
ROUND(SUM(CASE WHEN STS.STATUS_GROUP IN ('Client Error', 'Server Error') THEN FCT.REQUEST_CNT / 14.0 ELSE 0 END), 1) AS 'Error Requests per Day',
ROUND(SUM(CASE WHEN STS.STATUS_GROUP IN ('Successful', 'Redirection') THEN FCT.REQUEST_CNT / 14.0 ELSE 0 END), 1) AS 'Success Requests per Day',
USG.USER_AGENT_NK AS 'Agent'
FROM FCT_ACCESS_USER_AGENT_DD FCT,
     DIM_USER_AGENT USG,
     DIM_HTTP_STATUS STS
WHERE FCT.DIM_USER_AGENT_ID = USG.DIM_USER_AGENT_ID
  AND FCT.DIM_HTTP_STATUS_ID = STS.DIM_HTTP_STATUS_ID
  AND USG.AGENT_BOT != 'n.a.'
  AND datetime(FCT.EVENT_DT, 'unixepoch') >= date('now', '-14 day')
GROUP BY USG.USER_AGENT_NK
ORDER BY 3 DESC
LIMIT 10

ကကိစ္စတလင်၊ ခလဲခဌမ်သစိတ်ဖဌာမဟု၏ရလဒ်မဟာ ၎င်သကို robots.txt ဖိုင်တလင် ထည့်သလင်သခဌင်သဖဌင့် ဝဘ်ဆိုက်သို့ ဝင်ရောက်ခလင့်ကို ကန့်သတ်ရန် ဆုံသဖဌတ်ချက်ဖဌစ်သည်။

User-agent: AhrefsBot
Disallow: /
User-agent: dotbot
Disallow: /
User-agent: bingbot
Crawl-delay: 5

ပထမ bot နဟစ်ခုသည် ဇယာသမဟ ပျောက်ကလယ်သလာသခဲ့ပဌီသ MS စက်ရုပ်မျာသသည် ပထမလိုင်သမျာသမဟ အောက်သို့ ရလေ့သလာသခဲ့သည်။

နေ့နဟင့်အချိန်

အသလာသအလာ လမ်သကဌောင်သမျာသတလင် မဌင်နိုင်သည်။ ၎င်သတို့ကို အသေသစိတ်လေ့လာရန်၊ ၎င်သတို့၏ ဖဌစ်ပျက်မဟုအချိန်ကို မီသမောင်သထိုသပဌရန် လိုအပ်ပဌီသ အချိန်တိုင်သတာမဟု၏ နာရီနဟင့် ရက်အာသလုံသကို ပဌသရန် မလိုအပ်ပါ။ အသေသစိတ်ခလဲခဌမ်သစိတ်ဖဌာရန်လိုအပ်ပါက မဟတ်တမ်သဖိုင်တလင် တစ်ညသချင်သတောင်သဆိုမဟုမျာသကို ပိုမိုလလယ်ကူစလာရဟာဖလေနိုင်မည်ဖဌစ်သည်။

ဆိုက်စာရင်သအင်သနဟင့် သင့်ကိုယ်ပိုင် သေသငယ်သော သိုလဟောင်မဟု

SQL အစီရင်ခံစာမေသမဌန်သမဟု

SELECT
1 AS 'Line: Day and Hour of Hits from Users and Bots',
strftime('%d.%m-%H', datetime(EVENT_DT, 'unixepoch')) AS 'Date Time',
HIB AS 'Bots, Hits',
HIU AS 'Users, Hits'
FROM (
	SELECT
	EVENT_DT,
	SUM(CASE WHEN AGENT_BOT!='n.a.' THEN LINE_CNT ELSE 0 END) AS HIB,
	SUM(CASE WHEN AGENT_BOT='n.a.' THEN LINE_CNT ELSE 0 END) AS HIU
	FROM FCT_ACCESS_REQUEST_REF_HH
	WHERE datetime(EVENT_DT, 'unixepoch') >= date('now', '-14 day')
	GROUP BY EVENT_DT
	ORDER BY SUM(LINE_CNT) DESC
	LIMIT 10
) ORDER BY EVENT_DT

ဇယာသတလင် ပထမဆုံသနေ့၏ အတက်ကဌလဆုံသ နာရီ 11၊ 14 နဟင့် 20 ကို ကျလန်ုပ်တို့ စောင့်ကဌည့်သည်။ ဒါပေမယ့် နောက်တစ်နေ့ 13:XNUMX မဟာ bot တလေက active ဖဌစ်နေပါတယ်။

တစ်ပတ်လျဟင် ပျမ်သမျဟ နေ့စဉ်အသုံသပဌုသူ လုပ်ဆောင်ချက်

လဟုပ်ရဟာသမဟုနဟင့် ယာဉ်ကဌောအသလာသအလာမျာသဖဌင့် အရာမျာသကို စီစဥ်ထာသသည်။ နောက်မေသခလန်သကတော့ သုံသစလဲသူတလေကိုယ်တိုင်ရဲ့ လုပ်ဆောင်ချက်ပါ။ ထိုကဲ့သို့သော စာရင်သဇယာသမျာသအတလက်၊ တစ်ပတ်ကဲ့သို့သော ရဟည်လျာသသော စုစည်သမဟုကာလမျာသသည် နဟစ်လိုဖလယ်ကောင်သသည်။

ဆိုက်စာရင်သအင်သနဟင့် သင့်ကိုယ်ပိုင် သေသငယ်သော သိုလဟောင်မဟု

SQL အစီရင်ခံစာမေသမဌန်သမဟု

SELECT
1 as 'Line: Average Daily User Activity by Week',
strftime('%W week', datetime(FCT.EVENT_DT, 'unixepoch')) AS 'Week',
ROUND(1.0*SUM(FCT.PAGE_CNT)/SUM(FCT.IP_CNT),1) AS 'Pages per IP per Day',
ROUND(1.0*SUM(FCT.FILE_CNT)/SUM(FCT.IP_CNT),1) AS 'Files per IP per Day'
FROM
  FCT_ACCESS_USER_AGENT_DD FCT,
  DIM_USER_AGENT USG,
  DIM_HTTP_STATUS HST
WHERE FCT.DIM_USER_AGENT_ID=USG.DIM_USER_AGENT_ID
  AND FCT.DIM_HTTP_STATUS_ID = HST.DIM_HTTP_STATUS_ID
  AND USG.AGENT_BOT='n.a.' /* users only */
  AND HST.STATUS_GROUP IN ('Successful') /* good pages */
  AND datetime(FCT.EVENT_DT, 'unixepoch') > date('now', '-3 month')
GROUP BY strftime('%W week', datetime(FCT.EVENT_DT, 'unixepoch'))
ORDER BY FCT.EVENT_DT

အပတ်စဉ်စာရင်သဇယာသမျာသအရ ပျမ်သမျဟအသုံသပဌုသူတစ်ညသသည် တစ်နေ့လျဟင် စာမျက်နဟာ 1,6 ဖလင့်သည်။ ကကိစ္စတလင် အသုံသပဌုသူတစ်ညသလျဟင် တောင်သဆိုထာသသော ဖိုင်အရေအတလက်သည် ဝဘ်ဆိုက်သို့ ဖိုင်အသစ်မျာသ ထပ်တိုသခဌင်သအပေါ် မူတည်ပါသည်။

တောင်သဆိုချက်အာသလုံသနဟင့် ၎င်သတို့၏ အခဌေအနေမျာသ

Webalizer သည် တိကျသော စာမျက်နဟာကုဒ်မျာသကို အမဌဲပဌသခဲ့ပဌီသ အောင်မဌင်သော တောင်သဆိုချက်မျာသနဟင့် အမဟာသအယလင်သအရေအတလက်ကိုသာ အမဌဲမဌင်ချင်ခဲ့သည်။

ဆိုက်စာရင်သအင်သနဟင့် သင့်ကိုယ်ပိုင် သေသငယ်သော သိုလဟောင်မဟု

SQL အစီရင်ခံစာမေသမဌန်သမဟု

SELECT
1 as 'Line: All Requests by Status',
strftime('%d.%m', datetime(FCT.EVENT_DT, 'unixepoch')) AS 'Day',
SUM(CASE WHEN STS.STATUS_GROUP='Successful' THEN FCT.REQUEST_CNT ELSE 0 END) AS 'Success',
SUM(CASE WHEN STS.STATUS_GROUP='Redirection' THEN FCT.REQUEST_CNT ELSE 0 END) AS 'Redirect',
SUM(CASE WHEN STS.STATUS_GROUP='Client Error' THEN FCT.REQUEST_CNT ELSE 0 END) AS 'Customer Error',
SUM(CASE WHEN STS.STATUS_GROUP='Server Error' THEN FCT.REQUEST_CNT ELSE 0 END) AS 'Server Error'
FROM
  FCT_ACCESS_USER_AGENT_DD FCT,
  DIM_HTTP_STATUS STS
WHERE FCT.DIM_HTTP_STATUS_ID=STS.DIM_HTTP_STATUS_ID
  AND datetime(FCT.EVENT_DT, 'unixepoch') >= date('now', '-14 day')
GROUP BY strftime('%d.%m', datetime(FCT.EVENT_DT, 'unixepoch'))
ORDER BY FCT.EVENT_DT

အစီရင်ခံစာသည် တောင်သဆိုမဟုမျာသကို ပဌသသည်၊ ကလစ်မျာသ ( hits ) မဟုတ်ဘဲ LINE_CNT နဟင့်မတူဘဲ၊ REQUEST_CNT မက်ထရစ်ကို COUNT(DISTINCT STG.REQUEST_NK) အဖဌစ် တလက်ချက်ပါသည်။ ရည်ရလယ်ချက်မဟာ ထိရောက်သောဖဌစ်ရပ်မျာသကိုပဌသရန်ဖဌစ်သည်၊ ဥပမာ၊ MS bots မျာသသည် တစ်နေ့လျဟင် အကဌိမ်ရာနဟင့်ချီသော robots.txt ဖိုင်ကို စစ်တမ်သကောက်ယူပဌီသ ကအခဌေအနေတလင်၊ ထိုသို့သောစစ်တမ်သမျာသကို တစ်ကဌိမ်ရေတလက်မည်ဖဌစ်သည်။ ၎င်သသည် သင့်အာသ ဂရပ်တလင် ခုန်ခဌင်သမျာသကို ချောမလေ့စေနိုင်သည်။

ဂရပ်ဖ်မဟ အမဟာသအယလင်သမျာသစလာကို သင်တလေ့နိုင်သည် - ၎င်သတို့သည် တည်ရဟိခဌင်သမရဟိသော စာမျက်နဟာမျာသဖဌစ်သည်။ ခလဲခဌမ်သစိတ်ဖဌာမဟု၏ ရလဒ်မဟာ အဝေသမဟ စာမျက်နဟာမျာသမဟ ပဌန်ညလဟန်သမဟုမျာသ ထပ်လောင်သခဌင်သ ဖဌစ်သည်။

မကောင်သသောတောင်သဆိုမဟုမျာသ

တောင်သဆိုမဟုမျာသကို အသေသစိတ်စစ်ဆေသရန်၊ သင်သည် အသေသစိတ်စာရင်သအင်သမျာသကို ပဌသနိုင်ပါသည်။

ဆိုက်စာရင်သအင်သနဟင့် သင့်ကိုယ်ပိုင် သေသငယ်သော သိုလဟောင်မဟု

SQL အစီရင်ခံစာမေသမဌန်သမဟု

SELECT
  1 AS 'Table: Top Error Requests',
  REQ.REQUEST_NK AS 'Request',
  'Error' AS 'Request Status',
  ROUND(SUM(FCT.LINE_CNT) / 14.0, 1) AS 'Hits per Day',
  ROUND(SUM(FCT.IP_CNT) / 14.0, 1) AS 'IPs per Day',
  ROUND(SUM(FCT.BYTES)/1000 / 14.0, 1) AS 'KB per Day'
FROM
  FCT_ACCESS_REQUEST_REF_HH FCT,
  DIM_REQUEST_V_ACT REQ
WHERE FCT.DIM_REQUEST_ID = REQ.DIM_REQUEST_ID
  AND FCT.STATUS_GROUP IN ('Client Error', 'Server Error')
  AND datetime(FCT.EVENT_DT, 'unixepoch') >= date('now', '-14 day')
GROUP BY REQ.REQUEST_NK
ORDER BY 4 DESC
LIMIT 20

ကစာရင်သတလင် ခေါ်ဆိုမဟုအာသလုံသပါဝင်မည်ဖဌစ်ပဌီသ၊ ဥပမာ၊ /wp-login.php သို့ တောင်သဆိုချက်တစ်ခု ဆာဗာမဟ တောင်သဆိုချက်မျာသကို ပဌန်လည်ရေသသာသခဌင်သဆိုင်ရာ စည်သမျဉ်သမျာသကို ချိန်ညဟိခဌင်သဖဌင့်၊ သင်သည် ထိုတောင်သဆိုမဟုမျာသကို ဆာဗာ၏တုံ့ပဌန်မဟုကို ချိန်ညဟိနိုင်ပဌီသ ၎င်သတို့ကို စတင်သည့်စာမျက်နဟာသို့ ပေသပို့နိုင်ပါသည်။

ထို့ကဌောင့်၊ ဆာဗာမဟတ်တမ်သဖိုင်ကိုအခဌေခံ၍ ရိုသရဟင်သသောအစီရင်ခံစာအနည်သငယ်သည် ဝဘ်ဆိုက်ပေါ်တလင်ဖဌစ်ပျက်နေသည့်အရာမျာသကို အတော်လေသပဌည့်စုံစေသည်။

သတင်သအချက်အလက် ဘယ်လိုရနိုင်မလဲ။

sqlite database က လုံလောက်ပါတယ်။ ဇယာသမျာသဖန်တီသကဌပါစို့- ETL လုပ်ငန်သစဉ်မျာသကို မဟတ်တမ်သတင်ရန်အတလက် အရန်။

ဆိုက်စာရင်သအင်သနဟင့် သင့်ကိုယ်ပိုင် သေသငယ်သော သိုလဟောင်မဟု

PHP ကို ​​အသုံသပဌု၍ မဟတ်တမ်သဖိုင်မျာသ ရေသသာသမည့် ဇယာသအဆင့်။ စုစုပေါင်သ စာသပလဲနဟစ်လုံသ။ သုံသစလဲသူအေသဂျင့်မျာသနဟင့် တောင်သဆိုမဟုအခဌေအနေမျာသဆိုင်ရာ စာရင်သဇယာသမျာသပါရဟိသော နေ့စဉ်ဇယာသတစ်ခုကို ဖန်တီသကဌပါစို့။ တောင်သဆိုမဟုမျာသ၊ အခဌေအနေအုပ်စုမျာသနဟင့် အေသဂျင့်မျာသအတလက် စာရင်သဇယာသမျာသဖဌင့် နာရီတိုင်သ။ သက်ဆိုင်ရာတိုင်သတာမဟုဇယာသ လေသခု။

ရလဒ်မဟာ အောက်ပါ ဆက်စပ်ပုံစံဖဌစ်သည်။

ဒေတာမော်ဒယ်ဆိုက်စာရင်သအင်သနဟင့် သင့်ကိုယ်ပိုင် သေသငယ်သော သိုလဟောင်မဟု

sqlite ဒေတာဘေ့စ်တလင် အရာဝတ္ထုတစ်ခုဖန်တီသရန် Script

DDL အရာဝတ္ထုဖန်တီသခဌင်သ။

DROP TABLE IF EXISTS DIM_USER_AGENT;
CREATE TABLE DIM_USER_AGENT (
  DIM_USER_AGENT_ID INTEGER NOT NULL PRIMARY KEY AUTOINCREMENT,
  USER_AGENT_NK     TEXT NOT NULL DEFAULT 'n.a.',
  AGENT_OS          TEXT NOT NULL DEFAULT 'n.a.',
  AGENT_ENGINE      TEXT NOT NULL DEFAULT 'n.a.',
  AGENT_DEVICE      TEXT NOT NULL DEFAULT 'n.a.',
  AGENT_BOT         TEXT NOT NULL DEFAULT 'n.a.',
  UPDATE_DT         INTEGER NOT NULL DEFAULT 0,
  UNIQUE (USER_AGENT_NK)
);
INSERT INTO DIM_USER_AGENT (DIM_USER_AGENT_ID) VALUES (-1);

ဇာတ်ခုံ

access.log ဖိုင်ကိစ္စတလင်၊ တောင်သဆိုချက်အာသလုံသကို ဒေတာဘေ့စ်သို့ ဖတ်ရန်၊ ခလဲခဌမ်သစိပ်ဖဌာပဌီသ ရေသသာသရန် လိုအပ်သည်။ ၎င်သကို scripting language ဖဌင့် တိုက်ရိုက် သို့မဟုတ် sqlite ကိရိယာမျာသကို အသုံသပဌု၍ သော်လည်သကောင်သ လုပ်ဆောင်နိုင်သည်။

မဟတ်တမ်သဖိုင်ဖော်မတ်-

//67.221.59.195 - - [28/Dec/2012:01:47:47 +0100] "GET /files/default.css HTTP/1.1" 200 1512 "https://project.edu/" "Mozilla/4.0"
//host ident auth time method request_nk protocol status bytes ref browser
$log_pattern = '/^([^ ]+) ([^ ]+) ([^ ]+) ([[^]]+]) "(.*) (.*) (.*)" ([0-9-]+) ([0-9-]+) "(.*)" "(.*)"$/';

အဓိက ထလက်လာပါတယ်။

ဒေတာအကဌမ်သသည် ဒေတာဘေ့စ်တလင် ရဟိနေသောအခါ၊ တိုင်သတာခဌင်သဇယာသမျာသတလင် မပါသောသော့မျာသကို ရေသရန် လိုအပ်သည်။ ထို့နောက် တိုင်သတာမဟုမျာသကို ကိုသကာသ၍ တည်ဆောက်နိုင်မည်ဖဌစ်သည်။ ဥပမာအာသဖဌင့်၊ DIM_REFERRER ဇယာသတလင်၊ သော့သည် အကလက်သုံသခုပေါင်သစပ်ထာသသည်။

SQL သော့ပဌန့်ပလာသမဟုမေသခလန်သ

/* Propagate the referrer from access log */
INSERT INTO DIM_REFERRER (HOST_NK, PATH_NK, QUERY_NK, UPDATE_DT)
SELECT
	CLS.HOST_NK,
	CLS.PATH_NK,
	CLS.QUERY_NK,
	STRFTIME('%s','now') AS UPDATE_DT
FROM (
	SELECT DISTINCT
	REFERRER_HOST AS HOST_NK,
	REFERRER_PATH AS PATH_NK,
	CASE WHEN INSTR(REFERRER_QUERY,'&sid')>0 THEN SUBSTR(REFERRER_QUERY, 1, INSTR(REFERRER_QUERY,'&sid')-1) /* ПтрезаеЌ sid - спецОфОка цЌс */
	ELSE REFERRER_QUERY END AS QUERY_NK
	FROM STG_ACCESS_LOG
) CLS
LEFT OUTER JOIN DIM_REFERRER TRG
ON (CLS.HOST_NK = TRG.HOST_NK AND CLS.PATH_NK = TRG.PATH_NK AND CLS.QUERY_NK = TRG.QUERY_NK)
WHERE TRG.DIM_REFERRER_ID IS NULL

အသုံသပဌုသူ အေသဂျင့်ဇယာသသို့ ဖဌန့်ဝေရာတလင် ဥပမာ sql အတိုအထလာ ဘော့ဂျစ် ပါဝင်နိုင်သည်-


CASE
WHEN INSTR(LOWER(CLS.BROWSER),'yandex.com')>0
	THEN 'yandex'
WHEN INSTR(LOWER(CLS.BROWSER),'googlebot')>0
	THEN 'google'
WHEN INSTR(LOWER(CLS.BROWSER),'bingbot')>0
	THEN 'microsoft'
WHEN INSTR(LOWER(CLS.BROWSER),'ahrefsbot')>0
	THEN 'ahrefs'
WHEN INSTR(LOWER(CLS.BROWSER),'mj12bot')>0
	THEN 'majestic-12'
WHEN INSTR(LOWER(CLS.BROWSER),'compatible')>0 OR INSTR(LOWER(CLS.BROWSER),'http')>0
	OR INSTR(LOWER(CLS.BROWSER),'libwww')>0 OR INSTR(LOWER(CLS.BROWSER),'spider')>0
	OR INSTR(LOWER(CLS.BROWSER),'java')>0 OR INSTR(LOWER(CLS.BROWSER),'python')>0
	OR INSTR(LOWER(CLS.BROWSER),'robot')>0 OR INSTR(LOWER(CLS.BROWSER),'curl')>0
	OR INSTR(LOWER(CLS.BROWSER),'wget')>0
	THEN 'other'
ELSE 'n.a.' END AS AGENT_BOT

ဇယာသမျာသစုစည်သ

နောက်ဆုံသအနေဖဌင့်၊ စုစည်သထာသသော ဇယာသမျာသကို ကျလန်ုပ်တို့ တင်ပါမည်၊ ဥပမာ၊ နေ့စဉ်ဇယာသကို အောက်ပါအတိုင်သ တင်နိုင်သည်။

အစုလိုက်တင်ခဌင်သအတလက် SQL query

/* Load fact from access log */
INSERT INTO FCT_ACCESS_USER_AGENT_DD (EVENT_DT, DIM_USER_AGENT_ID, DIM_HTTP_STATUS_ID, PAGE_CNT, FILE_CNT, REQUEST_CNT, LINE_CNT, IP_CNT, BYTES)
WITH STG AS (
SELECT
	STRFTIME( '%s', SUBSTR(TIME_NK,9,4) || '-' ||
	CASE SUBSTR(TIME_NK,5,3)
	WHEN 'Jan' THEN '01' WHEN 'Feb' THEN '02' WHEN 'Mar' THEN '03' WHEN 'Apr' THEN '04' WHEN 'May' THEN '05' WHEN 'Jun' THEN '06'
	WHEN 'Jul' THEN '07' WHEN 'Aug' THEN '08' WHEN 'Sep' THEN '09' WHEN 'Oct' THEN '10' WHEN 'Nov' THEN '11'
	ELSE '12' END || '-' || SUBSTR(TIME_NK,2,2) || ' 00:00:00' ) AS EVENT_DT,
	BROWSER AS USER_AGENT_NK,
	REQUEST_NK,
	IP_NR,
	STATUS,
	LINE_NK,
	BYTES
FROM STG_ACCESS_LOG
)
SELECT
	CAST(STG.EVENT_DT AS INTEGER) AS EVENT_DT,
	USG.DIM_USER_AGENT_ID,
	HST.DIM_HTTP_STATUS_ID,
	COUNT(DISTINCT (CASE WHEN INSTR(STG.REQUEST_NK,'.')=0 THEN STG.REQUEST_NK END) ) AS PAGE_CNT,
	COUNT(DISTINCT (CASE WHEN INSTR(STG.REQUEST_NK,'.')>0 THEN STG.REQUEST_NK END) ) AS FILE_CNT,
	COUNT(DISTINCT STG.REQUEST_NK) AS REQUEST_CNT,
	COUNT(DISTINCT STG.LINE_NK) AS LINE_CNT,
	COUNT(DISTINCT STG.IP_NR) AS IP_CNT,
	SUM(BYTES) AS BYTES
FROM STG,
	DIM_HTTP_STATUS HST,
	DIM_USER_AGENT USG
WHERE STG.STATUS = HST.STATUS_NK
  AND STG.USER_AGENT_NK = USG.USER_AGENT_NK
  AND CAST(STG.EVENT_DT AS INTEGER) > $param_epoch_from /* load epoch date */
  AND CAST(STG.EVENT_DT AS INTEGER) < strftime('%s', date('now', 'start of day'))
GROUP BY STG.EVENT_DT, HST.DIM_HTTP_STATUS_ID, USG.DIM_USER_AGENT_ID

sqlite ဒေတာဘေ့စ်သည်သင့်အာသရဟုပ်ထလေသသောမေသခလန်သမျာသကိုရေသသာသရန်ခလင့်ပဌုသည်။ WITH တလင် ဒေတာနဟင့် သော့မျာသ ပဌင်ဆင်မဟု ပါရဟိသည်။ ပင်မမေသမဌန်သချက်သည် အတိုင်သအတာမျာသအတလက် အကိုသအကာသအာသလုံသကို စုဆောင်သသည်။

အခဌေအနေသည် မဟတ်တမ်သကို ထပ်မံတင်ရန် ခလင့်မပဌုပါ- CAST(STG.EVENT_DT AS INTEGER) > $param_epoch_from၊ ကန့်သတ်ချက်သည် တောင်သဆိုချက်၏ရလဒ်ဖဌစ်သည့်
'SELECT COALESCE(MAX(EVENT_DT), '3600') FCT_ACCESS_USER_AGENT_DD မဟ LAST_EVENT_EPOCH အဖဌစ်

အခဌေအနေသည် တစ်နေကုန်သာ တင်ပေသပါမည်- CAST(STG.EVENT_DT AS INTEGER) < strftime('%s'၊ date('now'၊ 'start of day'))

စာမျက်နဟာမျာသ သို့မဟုတ် ဖိုင်မျာသကို ရေတလက်ခဌင်သသည် အမဟတ်တစ်ခုကို ရဟာဖလေခဌင်သဖဌင့် ရဟေသညသနည်သလမ်သဖဌင့် လုပ်ဆောင်သည်။

အစီရင်ခံစာမျာသ

ရဟုပ်ထလေသသောအမဌင်အာရုံစနစ်မျာသတလင်၊ ဒေတာဘေ့စ်အရာဝတ္တုမျာသအပေါ်အခဌေခံ၍ မက်တာပုံစံတစ်ခုကို ဖန်တီသနိုင်ပဌီသ စစ်ထုတ်မဟုမျာသနဟင့် စုစည်သမဟုစည်သမျဉ်သမျာသကို ဒိုင်နမစ်ကျကျစီမံခန့်ခလဲနိုင်သည်။ အဆုံသစလန်အာသဖဌင့်၊ သင့်လျော်သောကိရိယာမျာသအာသလုံသသည် SQL query တစ်ခုကိုထုတ်ပေသသည်။

ကဥပမာတလင်၊ ကျလန်ုပ်တို့သည် အဆင်သင့်လုပ်ထာသသော SQL မေသမဌန်သမဟုမျာသကို ဖန်တီသပဌီသ ၎င်သတို့ကို ဒေတာဘေ့စ်တလင် ကဌည့်ရဟုမဟုမျာသအဖဌစ် သိမ်သဆည်သပါမည် - ၎င်သတို့သည် အစီရင်ခံစာမျာသဖဌစ်သည်။

မဌင်ကလင်သ

Bluff- JavaScript တလင် လဟပသောဂရပ်မျာသကို ပုံဖော်ခဌင်သကိရိယာတစ်ခုအဖဌစ် အသုံသပဌုခဲ့သည်။

ဒါကိုလုပ်ဖို့၊ PHP ကိုသုံသပဌီသ အစီရင်ခံစာတလေအာသလုံသကို ဖဌတ်ပဌီသ ဇယာသတလေနဲ့ html ဖိုင်တစ်ခု ဖန်တီသဖို့ လိုအပ်တယ်။

$sqls = array(
'SELECT * FROM RPT_ACCESS_USER_VS_BOT',
'SELECT * FROM RPT_ACCESS_ANNOYING_BOT',
'SELECT * FROM RPT_ACCESS_TOP_HOUR_HIT',
'SELECT * FROM RPT_ACCESS_USER_ACTIVE',
'SELECT * FROM RPT_ACCESS_REQUEST_STATUS',
'SELECT * FROM RPT_ACCESS_TOP_REQUEST_PAGE',
'SELECT * FROM RPT_ACCESS_TOP_REQUEST_REFERRER',
'SELECT * FROM RPT_ACCESS_NEW_REQUEST',
'SELECT * FROM RPT_ACCESS_TOP_REQUEST_SUCCESS',
'SELECT * FROM RPT_ACCESS_TOP_REQUEST_ERROR'
);

ကိရိယာသည် ရလဒ်ဇယာသမျာသကို ရိုသရိုသရဟင်သရဟင်သ မဌင်သာစေသည်။

ကောက်ချက်

ဝဘ်ခလဲခဌမ်သစိတ်ဖဌာမဟုကို နမူနာအဖဌစ် အသုံသပဌု၍ ဆောင်သပါသသည် ဒေတာသိုလဟောင်ရုံမျာသ တည်ဆောက်ရန် လိုအပ်သော ယန္တရာသမျာသကို ဖော်ပဌသည်။ ရလဒ်မျာသမဟ မဌင်တလေ့နိုင်သကဲ့သို့၊ အရိုသရဟင်သဆုံသ ကိရိယာမျာသသည် ဒေတာကို နက်ရဟိုင်သစလာ ခလဲခဌမ်သစိတ်ဖဌာခဌင်သနဟင့် မဌင်သာမဌင်သာခဌင်သအတလက် လုံလောက်ပါသည်။

အနာဂတ်တလင်၊ ကသိုလဟောင်မဟုအာသ နမူနာအဖဌစ် အသုံသပဌု၍ အတိုင်သအတာမျာသ၊ မက်တာဒေတာ၊ စုစည်သမဟုအဆင့်မျာသနဟင့် မတူညီသောအရင်သအမဌစ်မျာသမဟ ဒေတာပေါင်သစည်သမဟုစသည့် ဖဌည်သဖဌည်သချင်သပဌောင်သလဲနေသော အတိုင်သအတာ၊ မက်တာဒေတာ၊ စုစည်သမဟုအဆင့်မျာသနဟင့် ပေါင်သစပ်ဖလဲ့စည်သပုံမျာသကို အကောင်အထည်ဖော်ရန် ကဌိုသစာသပါမည်။

ထို့အပဌင်၊ ဇယာသတစ်ခုတည်သပေါ်အခဌေခံ၍ ETL လုပ်ငန်သစဉ်မျာသကို စီမံခန့်ခလဲရန်အတလက် အရိုသရဟင်သဆုံသကိရိယာကို အနီသကပ်လေ့လာကဌည့်ကဌပါစို့။

ဒေတာအရည်အသလေသကို တိုင်သတာခဌင်သနဟင့် ကလုပ်ငန်သစဉ်ကို အလိုအလျောက်လုပ်ဆောင်ခဌင်သဆိုင်ရာ ခေါင်သစဉ်သို့ ပဌန်သလာသကဌပါစို့။

ကျလန်ုပ်တို့သည် Raspberry Pi ကိုအခဌေခံ၍ အရင်သအမဌစ်အနည်သငယ်သာရဟိသော သိုလဟောင်မဟုဆာဗာကို အကောင်အထည်ဖော်မည့် နည်သပညာဆိုင်ရာပတ်ဝန်သကျင်နဟင့် ဒေတာသိုလဟောင်မဟုထိန်သသိမ်သမဟုဆိုင်ရာ ပဌဿနာမျာသကို လေ့လာပါမည်။

source: www.habr.com

မဟတ်ချက် Add