ಹ್ಯಾಬ್ರಸ್ಟ್ಯಾಟಿಸ್ಟಿಕ್ಸ್: ಹ್ಯಾಬ್ರ್ ಗೀಕ್ಟೈಮ್ಸ್ ಇಲ್ಲದೆ ಹೇಗೆ ವಾಸಿಸುತ್ತಾನೆ
ಹೇ ಹಬ್ರ್.
ಈ ಲೇಖನವು ರೇಟಿಂಗ್ನ ತಾರ್ಕಿಕ ಮುಂದುವರಿಕೆಯಾಗಿದೆ 2018 ರ ಹಬರ್ನ ಅತ್ಯುತ್ತಮ ಲೇಖನಗಳು. ಮತ್ತು ವರ್ಷವು ಇನ್ನೂ ಮುಗಿದಿಲ್ಲವಾದರೂ, ಆದರೆ ನಿಮಗೆ ತಿಳಿದಿರುವಂತೆ, ಬೇಸಿಗೆಯಲ್ಲಿ ನಿಯಮಗಳಲ್ಲಿ ಬದಲಾವಣೆಗಳಿವೆ, ಆದ್ದರಿಂದ ಅದು ಏನಾದರೂ ಪರಿಣಾಮ ಬೀರುತ್ತದೆಯೇ ಎಂದು ನೋಡಲು ಆಸಕ್ತಿದಾಯಕವಾಯಿತು.
ನಿಜವಾದ ಅಂಕಿಅಂಶಗಳ ಜೊತೆಗೆ, ಲೇಖನಗಳ ನವೀಕರಿಸಿದ ರೇಟಿಂಗ್ ಕೂಡ ಇರುತ್ತದೆ, ಹಾಗೆಯೇ ಅದು ಹೇಗೆ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ ಎಂಬುದರ ಕುರಿತು ಆಸಕ್ತಿ ಹೊಂದಿರುವವರಿಗೆ ಕೆಲವು ಮೂಲಗಳು.
ಏನಾಯಿತು ಎಂಬುದರ ಬಗ್ಗೆ ಆಸಕ್ತಿ ಹೊಂದಿರುವವರಿಗೆ, ಕಟ್ ಅಡಿಯಲ್ಲಿ ಮುಂದುವರೆಯಿತು. ಸೈಟ್ನ ವಿಭಾಗಗಳ ಹೆಚ್ಚು ವಿವರವಾದ ವಿಶ್ಲೇಷಣೆಯಲ್ಲಿ ಆಸಕ್ತಿ ಹೊಂದಿರುವವರು ಸಹ ನೋಡಬಹುದು ಮುಂದಿನ ಭಾಗ.
ಕಚ್ಚಾ ಡೇಟಾ
ಈ ರೇಟಿಂಗ್ ಅನಧಿಕೃತವಾಗಿದೆ ಮತ್ತು ನನ್ನ ಬಳಿ ಯಾವುದೇ ಆಂತರಿಕ ಡೇಟಾ ಇಲ್ಲ. ಬ್ರೌಸರ್ನ ವಿಳಾಸ ಪಟ್ಟಿಯನ್ನು ನೋಡುವ ಮೂಲಕ ನೋಡಲು ಸುಲಭವಾಗುವಂತೆ, ಹಬ್ರೆಯಲ್ಲಿನ ಎಲ್ಲಾ ಲೇಖನಗಳು ನಿರಂತರ ಸಂಖ್ಯೆಯನ್ನು ಹೊಂದಿವೆ. ನಂತರ ಇದು ತಂತ್ರದ ವಿಷಯವಾಗಿದೆ, ಕೇವಲ ಒಂದು ಚಕ್ರದಲ್ಲಿ ನಾವು ಎಲ್ಲಾ ಲೇಖನಗಳನ್ನು ಸತತವಾಗಿ ಓದುತ್ತೇವೆ (ಸರ್ವರ್ ಅನ್ನು ಲೋಡ್ ಮಾಡದಂತೆ ಒಂದು ಥ್ರೆಡ್ನಲ್ಲಿ ಮತ್ತು ವಿರಾಮಗಳೊಂದಿಗೆ). ಮೌಲ್ಯಗಳನ್ನು ಸರಳ ಪೈಥಾನ್ ಪಾರ್ಸರ್ ಮೂಲಕ ಪಡೆಯಲಾಗಿದೆ (ಮೂಲಗಳಿವೆ ಇಲ್ಲಿ) ಮತ್ತು ಈ ರೀತಿಯ csv ಫೈಲ್ನಲ್ಲಿ ಉಳಿಸಲಾಗಿದೆ:
2019-08-11T22:36Z,https://habr.com/ru/post/463197/,"Blazor + MVVM = Silverlight наносит ответный удар, потому что древнее зло непобедимо",votes:11,votesplus:17,votesmin:6,bookmarks:40,views:5300,comments:73
2019-08-11T05:26Z,https://habr.com/ru/news/t/463199/,"В NASA испытали систему автономного управления одного микроспутника другим",votes:15,votesplus:15,votesmin:0,bookmarks:2,views:1700,comments:7
ಪ್ರಕ್ರಿಯೆಗೊಳಿಸಲಾಗುತ್ತಿದೆ
ಪಾರ್ಸಿಂಗ್ ಮಾಡಲು, ನಾವು ಪೈಥಾನ್, ಪಾಂಡಾಗಳು ಮತ್ತು ಮ್ಯಾಟ್ಪ್ಲಾಟ್ಲಿಬ್ ಅನ್ನು ಬಳಸುತ್ತೇವೆ. ಅಂಕಿಅಂಶಗಳಲ್ಲಿ ಆಸಕ್ತಿಯಿಲ್ಲದವರು ಈ ಭಾಗವನ್ನು ಬಿಟ್ಟು ನೇರವಾಗಿ ಲೇಖನಗಳಿಗೆ ಹೋಗಬಹುದು.
ಮೊದಲು ನೀವು ಡೇಟಾಸೆಟ್ ಅನ್ನು ಮೆಮೊರಿಗೆ ಲೋಡ್ ಮಾಡಬೇಕಾಗುತ್ತದೆ ಮತ್ತು ಬಯಸಿದ ವರ್ಷಕ್ಕೆ ಡೇಟಾವನ್ನು ಆಯ್ಕೆ ಮಾಡಿ.
import pandas as pd
import datetime
import matplotlib.dates as mdates
from matplotlib.ticker import FormatStrFormatter
from pandas.plotting import register_matplotlib_converters
df = pd.read_csv("habr.csv", sep=',', encoding='utf-8', error_bad_lines=True, quotechar='"', comment='#')
dates = pd.to_datetime(df['datetime'], format='%Y-%m-%dT%H:%MZ')
df['datetime'] = dates
year = 2019
df = df[(df['datetime'] >= pd.Timestamp(datetime.date(year, 1, 1))) & (df['datetime'] < pd.Timestamp(datetime.date(year+1, 1, 1)))]
print(df.shape)
ಈ ವರ್ಷ (ಇದು ಇನ್ನೂ ಮುಗಿದಿಲ್ಲವಾದರೂ) ಬರೆಯುವ ಸಮಯದಲ್ಲಿ, 12715 ಲೇಖನಗಳನ್ನು ಪ್ರಕಟಿಸಲಾಗಿದೆ ಎಂದು ಅದು ತಿರುಗುತ್ತದೆ. ಹೋಲಿಕೆಗಾಗಿ, 2018 ರ ಇಡೀ - 15904. ಸಾಮಾನ್ಯವಾಗಿ, ಬಹಳಷ್ಟು - ಇದು ದಿನಕ್ಕೆ ಸುಮಾರು 43 ಲೇಖನಗಳು (ಮತ್ತು ಇದು ಧನಾತ್ಮಕ ರೇಟಿಂಗ್ನೊಂದಿಗೆ ಮಾತ್ರ, ಒಟ್ಟು ಎಷ್ಟು ಲೇಖನಗಳನ್ನು ಲೋಡ್ ಮಾಡಲಾಗಿದೆ ಅದು ನಕಾರಾತ್ಮಕವಾಗಿದೆ ಅಥವಾ ಅಳಿಸಲಾಗಿದೆ, ಗುರುತಿಸುವಿಕೆಗಳಲ್ಲಿನ ಲೋಪಗಳ ಮೂಲಕ ಮಾತ್ರ ಒಬ್ಬರು ಊಹಿಸಬಹುದು ಅಥವಾ ಸ್ಥೂಲವಾಗಿ ಅಂದಾಜು ಮಾಡಬಹುದು).
ಡೇಟಾಸೆಟ್ನಿಂದ ಅಗತ್ಯವಿರುವ ಕ್ಷೇತ್ರಗಳನ್ನು ಆಯ್ಕೆಮಾಡಿ. ಮೆಟ್ರಿಕ್ಗಳಂತೆ, ನಾವು ವೀಕ್ಷಣೆಗಳ ಸಂಖ್ಯೆ, ಕಾಮೆಂಟ್ಗಳು, ರೇಟಿಂಗ್ ಮೌಲ್ಯಗಳು ಮತ್ತು ಬುಕ್ಮಾರ್ಕ್ಗಳ ಸಂಖ್ಯೆಯನ್ನು ಬಳಸುತ್ತೇವೆ.
def to_float(s):
# "bookmarks:22" => 22.0
num = ''.join(i for i in s if i.isdigit())
return float(num)
def to_int(s):
# "bookmarks:22" => 22
num = ''.join(i for i in s if i.isdigit())
return int(num)
def to_date(dt):
return dt.date()
date = dates.map(to_date, na_action=None)
views = df["views"].map(to_int, na_action=None)
bookmarks = df["bookmarks"].map(to_int, na_action=None)
votes = df["votes"].map(to_float, na_action=None)
votes_up = df["up"].map(to_float, na_action=None)
votes_down = df["down"].map(to_float, na_action=None)
comments = df["comments"].map(to_int, na_action=None)
df['date'] = date
df['views'] = views
df['votes'] = votes
df['bookmarks'] = bookmarks
df['up'] = votes_up
df['down'] = votes_down
ಈಗ ಡೇಟಾವನ್ನು ಡೇಟಾಸೆಟ್ಗೆ ಸೇರಿಸಲಾಗಿದೆ ಮತ್ತು ನಾವು ಅದನ್ನು ಬಳಸಬಹುದು. ದಿನಗಳಿಂದ ಡೇಟಾವನ್ನು ಗುಂಪು ಮಾಡೋಣ ಮತ್ತು ಸರಾಸರಿ ಮೌಲ್ಯಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳೋಣ.
ಫಲಿತಾಂಶವು ಆಸಕ್ತಿದಾಯಕವಾಗಿದೆ. ನೀವು ನೋಡುವಂತೆ, ಹಬ್ರ್ ವರ್ಷದಲ್ಲಿ ಸ್ವಲ್ಪ "ಸಾಸೇಜ್" ಆಗಿತ್ತು. ಕಾರಣ ನನಗೆ ಗೊತ್ತಿಲ್ಲ.
ಹೋಲಿಕೆಗಾಗಿ, 2018 ಸ್ವಲ್ಪ "ನಯವಾದ" ಕಾಣುತ್ತದೆ:
ಸಾಮಾನ್ಯವಾಗಿ, ಚಾರ್ಟ್ನಲ್ಲಿ 2019 ರಲ್ಲಿ ಪ್ರಕಟವಾದ ಲೇಖನಗಳ ಸಂಖ್ಯೆಯಲ್ಲಿ ಯಾವುದೇ ತೀವ್ರ ಇಳಿಕೆಯನ್ನು ನಾನು ನೋಡಲಿಲ್ಲ. ಇದಲ್ಲದೆ, ಇದಕ್ಕೆ ವಿರುದ್ಧವಾಗಿ, ಇದು ಬೇಸಿಗೆಯಿಂದಲೂ ಸ್ವಲ್ಪ ಬೆಳೆದಿದೆ ಎಂದು ತೋರುತ್ತದೆ.
ಆದರೆ ಮುಂದಿನ ಎರಡು ಗ್ರಾಫ್ಗಳು ನನ್ನನ್ನು ಸ್ವಲ್ಪ ಹೆಚ್ಚು ಖಿನ್ನತೆಗೆ ಒಳಪಡಿಸುತ್ತವೆ.
ಪ್ರತಿ ಲೇಖನಕ್ಕೆ ಸರಾಸರಿ ವೀಕ್ಷಣೆಗಳು:
ಪ್ರತಿ ಲೇಖನಕ್ಕೆ ಸರಾಸರಿ ರೇಟಿಂಗ್:
ನೀವು ನೋಡುವಂತೆ, ವರ್ಷದಲ್ಲಿ ಸರಾಸರಿ ವೀಕ್ಷಣೆಗಳ ಸಂಖ್ಯೆ ಸ್ವಲ್ಪ ಕಡಿಮೆಯಾಗಿದೆ. ಹೊಸ ಲೇಖನಗಳನ್ನು ಇನ್ನೂ ಸರ್ಚ್ ಇಂಜಿನ್ಗಳಿಂದ ಇಂಡೆಕ್ಸ್ ಮಾಡಲಾಗಿಲ್ಲ ಮತ್ತು ಅವುಗಳು ಹೆಚ್ಚಾಗಿ ಕಂಡುಬರುವುದಿಲ್ಲ ಎಂಬ ಅಂಶದಿಂದ ಇದನ್ನು ವಿವರಿಸಬಹುದು. ಆದರೆ ಪ್ರತಿ ಲೇಖನದ ಸರಾಸರಿ ರೇಟಿಂಗ್ನಲ್ಲಿನ ಇಳಿಕೆ ಹೆಚ್ಚು ಅಗ್ರಾಹ್ಯವಾಗಿದೆ. ಓದುಗರಿಗೆ ಇಷ್ಟು ಲೇಖನಗಳನ್ನು ವೀಕ್ಷಿಸಲು ಸಮಯವಿಲ್ಲ ಅಥವಾ ರೇಟಿಂಗ್ಗಳಿಗೆ ಗಮನ ಕೊಡುವುದಿಲ್ಲ ಎಂಬ ಭಾವನೆ. ಲೇಖಕರ ಪ್ರೋತ್ಸಾಹ ಕಾರ್ಯಕ್ರಮದ ದೃಷ್ಟಿಕೋನದಿಂದ, ಈ ಪ್ರವೃತ್ತಿಯು ತುಂಬಾ ಅಹಿತಕರವಾಗಿದೆ.
ಅಂದಹಾಗೆ, ಇದು 2018 ರಲ್ಲಿ ಇರಲಿಲ್ಲ, ಮತ್ತು ವೇಳಾಪಟ್ಟಿ ಹೆಚ್ಚು ಅಥವಾ ಕಡಿಮೆ ಸಹ.
ಸಾಮಾನ್ಯವಾಗಿ, ಸಂಪನ್ಮೂಲ ಮಾಲೀಕರು ಯೋಚಿಸಲು ಏನನ್ನಾದರೂ ಹೊಂದಿರುತ್ತಾರೆ.
ಆದರೆ ದುಃಖದ ವಿಷಯಗಳ ಬಗ್ಗೆ ಮಾತನಾಡಬಾರದು. ಸಾಮಾನ್ಯವಾಗಿ, ಹಬ್ರ್ ಬೇಸಿಗೆಯಲ್ಲಿ "ಬದುಕುಳಿದಿದ್ದಾರೆ" ಎಂದು ಹೇಳಬಹುದು ಸಾಕಷ್ಟು ಯಶಸ್ವಿಯಾಗಿ ಬದಲಾಗುತ್ತದೆ, ಮತ್ತು ಸೈಟ್ನಲ್ಲಿನ ಲೇಖನಗಳ ಸಂಖ್ಯೆಯು ಕಡಿಮೆಯಾಗಿಲ್ಲ.
ರೇಟಿಂಗ್
ಈಗ ವಾಸ್ತವವಾಗಿ, ರೇಟಿಂಗ್. ಅದರಲ್ಲಿ ತೊಡಗಿದವರಿಗೆ ಅಭಿನಂದನೆಗಳು. ರೇಟಿಂಗ್ ಅನಧಿಕೃತವಾಗಿದೆ ಎಂದು ಮತ್ತೊಮ್ಮೆ ನಿಮಗೆ ನೆನಪಿಸುತ್ತೇನೆ, ಬಹುಶಃ ನಾನು ಏನನ್ನಾದರೂ ಕಳೆದುಕೊಂಡಿದ್ದೇನೆ ಮತ್ತು ಕೆಲವು ಲೇಖನಗಳು ಖಂಡಿತವಾಗಿಯೂ ಇಲ್ಲಿ ಇರಬೇಕು, ಆದರೆ ಅದು ಅಲ್ಲ, ಬರೆಯಿರಿ, ನಾನು ಅದನ್ನು ಹಸ್ತಚಾಲಿತವಾಗಿ ಸೇರಿಸುತ್ತೇನೆ. ರೇಟಿಂಗ್ ಆಗಿ, ನಾನು ಲೆಕ್ಕಾಚಾರ ಮಾಡಿದ ಮೆಟ್ರಿಕ್ಗಳನ್ನು ಬಳಸುತ್ತೇನೆ, ಅದು ಸಾಕಷ್ಟು ಆಸಕ್ತಿದಾಯಕವಾಗಿದೆ ಎಂದು ನಾನು ಭಾವಿಸುತ್ತೇನೆ.
ಉಫ್. ನನ್ನ ಬಳಿ ಇನ್ನೂ ಕೆಲವು ಆಸಕ್ತಿದಾಯಕ ಆಯ್ಕೆಗಳಿವೆ, ಆದರೆ ನಾನು ಓದುಗರಿಗೆ ಬೇಸರವಾಗುವುದಿಲ್ಲ.
ತೀರ್ಮಾನಕ್ಕೆ
ರೇಟಿಂಗ್ ಅನ್ನು ನಿರ್ಮಿಸುವಾಗ, ಆಸಕ್ತಿದಾಯಕವೆಂದು ತೋರುವ ಎರಡು ಅಂಶಗಳಿಗೆ ನಾನು ಗಮನ ಹರಿಸಿದೆ.
ಮೊದಲನೆಯದಾಗಿ, ಎಲ್ಲಾ ನಂತರ, 60% ರಷ್ಟು ಮೇಲ್ಭಾಗವು "geektimes" ಪ್ರಕಾರದ ಲೇಖನಗಳಾಗಿವೆ. ಮುಂದಿನ ವರ್ಷ ಅವುಗಳಲ್ಲಿ ಕಡಿಮೆ ಇರುತ್ತದೆಯೇ ಮತ್ತು ಬಿಯರ್, ಬಾಹ್ಯಾಕಾಶ, ಔಷಧ ಮತ್ತು ಮುಂತಾದವುಗಳ ಬಗ್ಗೆ ಲೇಖನಗಳಿಲ್ಲದೆ ಹಬರ್ ಹೇಗೆ ಕಾಣುತ್ತದೆ - ನನಗೆ ಗೊತ್ತಿಲ್ಲ. ಖಂಡಿತವಾಗಿ, ಓದುಗರು ಏನನ್ನಾದರೂ ಕಳೆದುಕೊಳ್ಳುತ್ತಾರೆ. ನೋಡೋಣ.
ಎರಡನೆಯದಾಗಿ, ಬುಕ್ಮಾರ್ಕ್ ಟಾಪ್ ಅನಿರೀಕ್ಷಿತವಾಗಿ ಉತ್ತಮ ಗುಣಮಟ್ಟದ್ದಾಗಿದೆ. ಇದು ಮಾನಸಿಕವಾಗಿ ಅರ್ಥವಾಗುವಂತಹದ್ದಾಗಿದೆ, ಓದುಗರು ರೇಟಿಂಗ್ಗೆ ಗಮನ ಕೊಡದಿರಬಹುದು ಮತ್ತು ಲೇಖನದ ವೇಳೆ ಅಗತ್ಯವಿದೆ, ನಂತರ ಅದನ್ನು ಬುಕ್ಮಾರ್ಕ್ಗಳಿಗೆ ಸೇರಿಸಲಾಗುತ್ತದೆ. ಮತ್ತು ಉಪಯುಕ್ತ ಮತ್ತು ಗಂಭೀರ ಲೇಖನಗಳ ದೊಡ್ಡ ಸಾಂದ್ರತೆಯು ಇಲ್ಲಿದೆ. ಸೈಟ್ ಮಾಲೀಕರು ಹ್ಯಾಬ್ರೆಯಲ್ಲಿ ಈ ನಿರ್ದಿಷ್ಟ ವರ್ಗದ ಲೇಖನಗಳನ್ನು ಹೆಚ್ಚಿಸಲು ಬಯಸಿದರೆ ಬುಕ್ಮಾರ್ಕ್ಗಳ ಸಂಖ್ಯೆ ಮತ್ತು ರಿವಾರ್ಡ್ ಪ್ರೋಗ್ರಾಂ ನಡುವಿನ ಸಂಪರ್ಕದ ಬಗ್ಗೆ ಹೇಗಾದರೂ ಯೋಚಿಸಬೇಕು ಎಂದು ನಾನು ಭಾವಿಸುತ್ತೇನೆ.
ಈ ರೀತಿಯ. ಇದು ಮಾಹಿತಿಯುಕ್ತವಾಗಿದೆ ಎಂದು ಭಾವಿಸುತ್ತೇವೆ.
ಲೇಖನಗಳ ಪಟ್ಟಿ ಉದ್ದವಾಗಿದೆ, ಅಲ್ಲದೆ, ಇದು ಬಹುಶಃ ಅತ್ಯುತ್ತಮವಾಗಿದೆ. ಎಲ್ಲರಿಗೂ ಓದುವ ಸಂತೋಷ.