āĻĒāĻžāĻ‡āĻĨāĻ¨ā§‡ āĻ—ā§āĻ°ā§āĻĒāĻŋāĻ‚ āĻāĻŦāĻ‚ āĻĄā§‡āĻŸāĻž āĻ­āĻŋāĻœā§āĻ¯ā§āĻ¯āĻŧāĻžāĻ˛āĻžāĻ‡āĻœā§‡āĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ°ā§‡āĻ° āĻĻāĻ•ā§āĻˇāĻ¤āĻž āĻ¨āĻŋāĻ¯āĻŧā§‡ āĻ•āĻžāĻœ āĻ•āĻ°āĻž

āĻĒāĻžāĻ‡āĻĨāĻ¨ā§‡ āĻ—ā§āĻ°ā§āĻĒāĻŋāĻ‚ āĻāĻŦāĻ‚ āĻĄā§‡āĻŸāĻž āĻ­āĻŋāĻœā§āĻ¯ā§āĻ¯āĻŧāĻžāĻ˛āĻžāĻ‡āĻœā§‡āĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ°ā§‡āĻ° āĻĻāĻ•ā§āĻˇāĻ¤āĻž āĻ¨āĻŋāĻ¯āĻŧā§‡ āĻ•āĻžāĻœ āĻ•āĻ°āĻž

āĻšā§‡ āĻšāĻžāĻŦāĻ°!

āĻ†āĻœ āĻ†āĻŽāĻ°āĻž āĻĒāĻžāĻ‡āĻĨāĻ¨ā§‡ āĻĄā§‡āĻŸāĻž āĻ—ā§āĻ°ā§āĻĒāĻŋāĻ‚ āĻāĻŦāĻ‚ āĻ­āĻŋāĻœā§āĻ¯ā§āĻ¯āĻŧāĻžāĻ˛āĻžāĻ‡āĻœ āĻ•āĻ°āĻžāĻ° āĻœāĻ¨ā§āĻ¯ āĻŸā§āĻ˛ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻ•āĻ°āĻžāĻ° āĻĻāĻ•ā§āĻˇāĻ¤āĻž āĻ¨āĻŋāĻ¯āĻŧā§‡ āĻ•āĻžāĻœ āĻ•āĻ°āĻŦāĨ¤ āĻĒā§āĻ°āĻĻāĻ¤ā§āĻ¤ āĻŽāĻ§ā§āĻ¯ā§‡ Github āĻ āĻĄā§‡āĻŸāĻžāĻ¸ā§‡āĻŸ āĻ†āĻ¸ā§āĻ¨ āĻŦā§‡āĻļ āĻ•āĻ¯āĻŧā§‡āĻ•āĻŸāĻŋ āĻŦā§ˆāĻļāĻŋāĻˇā§āĻŸā§āĻ¯ āĻŦāĻŋāĻļā§āĻ˛ā§‡āĻˇāĻŖ āĻ•āĻ°āĻŋ āĻāĻŦāĻ‚ āĻ­āĻŋāĻœā§āĻ¯ā§āĻ¯āĻŧāĻžāĻ˛āĻžāĻ‡āĻœā§‡āĻļāĻ¨ā§‡āĻ° āĻāĻ•āĻŸāĻŋ āĻ¸ā§‡āĻŸ āĻ¤ā§ˆāĻ°āĻŋ āĻ•āĻ°āĻŋāĨ¤

āĻāĻ¤āĻŋāĻšā§āĻ¯ āĻ…āĻ¨ā§āĻ¸āĻžāĻ°ā§‡, āĻļā§āĻ°ā§āĻ¤ā§‡, āĻ˛āĻ•ā§āĻˇā§āĻ¯āĻ—ā§āĻ˛āĻŋ āĻ¸āĻ‚āĻœā§āĻžāĻžāĻ¯āĻŧāĻŋāĻ¤ āĻ•āĻ°āĻž āĻ¯āĻžāĻ•:

  • āĻ˛āĻŋāĻ™ā§āĻ— āĻāĻŦāĻ‚ āĻŦāĻ›āĻ° āĻ…āĻ¨ā§āĻ¸āĻžāĻ°ā§‡ āĻĄā§‡āĻŸāĻž āĻ—ā§āĻ°ā§āĻĒ āĻ•āĻ°ā§āĻ¨ āĻāĻŦāĻ‚ āĻ‰āĻ­āĻ¯āĻŧ āĻ˛āĻŋāĻ™ā§āĻ—ā§‡āĻ° āĻœāĻ¨ā§āĻŽāĻšāĻžāĻ°ā§‡āĻ° āĻ¸āĻžāĻŽāĻ—ā§āĻ°āĻŋāĻ• āĻ—āĻ¤āĻŋāĻļā§€āĻ˛āĻ¤āĻž āĻ•āĻ˛ā§āĻĒāĻ¨āĻž āĻ•āĻ°ā§āĻ¨;
  • āĻ¸āĻ°ā§āĻŦāĻ•āĻžāĻ˛ā§‡āĻ° āĻ¸āĻŦāĻšā§‡āĻ¯āĻŧā§‡ āĻœāĻ¨āĻĒā§āĻ°āĻŋāĻ¯āĻŧ āĻ¨āĻžāĻŽ āĻ–ā§āĻāĻœā§āĻ¨;
  • āĻĄā§‡āĻŸāĻžāĻ° āĻĒā§āĻ°ā§‹ āĻ¸āĻŽāĻ¯āĻŧāĻ•āĻžāĻ˛āĻ•ā§‡ 10āĻŸāĻŋ āĻ…āĻ‚āĻļā§‡ āĻ­āĻžāĻ— āĻ•āĻ°ā§āĻ¨ āĻāĻŦāĻ‚ āĻĒā§āĻ°āĻ¤āĻŋāĻŸāĻŋāĻ° āĻœāĻ¨ā§āĻ¯, āĻĒā§āĻ°āĻ¤āĻŋāĻŸāĻŋ āĻ˛āĻŋāĻ™ā§āĻ—ā§‡āĻ° āĻ¸āĻ°ā§āĻŦāĻžāĻ§āĻŋāĻ• āĻœāĻ¨āĻĒā§āĻ°āĻŋāĻ¯āĻŧ āĻ¨āĻžāĻŽ āĻ–ā§āĻāĻœā§āĻ¨āĨ¤ āĻĒāĻžāĻ“āĻ¯āĻŧāĻž āĻĒā§āĻ°āĻ¤āĻŋāĻŸāĻŋ āĻ¨āĻžāĻŽā§‡āĻ° āĻœāĻ¨ā§āĻ¯, āĻ¸āĻŦ āĻ¸āĻŽāĻ¯āĻŧ āĻāĻ° āĻ—āĻ¤āĻŋāĻļā§€āĻ˛āĻ¤āĻž āĻ•āĻ˛ā§āĻĒāĻ¨āĻž āĻ•āĻ°ā§āĻ¨;
  • āĻĒā§āĻ°āĻ¤āĻŋ āĻŦāĻ›āĻ°ā§‡āĻ° āĻœāĻ¨ā§āĻ¯, āĻ•āĻ¤āĻ—ā§āĻ˛āĻŋ āĻ¨āĻžāĻŽ 50% āĻ˛ā§‹āĻ•āĻ•ā§‡ āĻ•āĻ­āĻžāĻ° āĻ•āĻ°ā§‡ āĻ¤āĻž āĻ—āĻŖāĻ¨āĻž āĻ•āĻ°ā§āĻ¨ āĻāĻŦāĻ‚ āĻ•āĻ˛ā§āĻĒāĻ¨āĻž āĻ•āĻ°ā§āĻ¨ (āĻ†āĻŽāĻ°āĻž āĻĒā§āĻ°āĻ¤āĻŋ āĻŦāĻ›āĻ°ā§‡āĻ° āĻœāĻ¨ā§āĻ¯ āĻŦāĻŋāĻ­āĻŋāĻ¨ā§āĻ¨ āĻ¨āĻžāĻŽ āĻĻā§‡āĻ–āĻ¤ā§‡ āĻĒāĻžāĻŦ);
  • āĻĒā§āĻ°ā§‹ āĻŦā§āĻ¯āĻŦāĻ§āĻžāĻ¨ āĻĨā§‡āĻ•ā§‡ 4 āĻŦāĻ›āĻ° āĻ¨āĻŋāĻ°ā§āĻŦāĻžāĻšāĻ¨ āĻ•āĻ°ā§āĻ¨ āĻāĻŦāĻ‚ āĻĒā§āĻ°āĻ¤āĻŋāĻŸāĻŋ āĻŦāĻ›āĻ°ā§‡āĻ° āĻœāĻ¨ā§āĻ¯ āĻ¨āĻžāĻŽā§‡āĻ° āĻĒā§āĻ°āĻĨāĻŽ āĻ…āĻ•ā§āĻˇāĻ° āĻāĻŦāĻ‚ āĻ¨āĻžāĻŽā§‡āĻ° āĻļā§‡āĻˇ āĻ…āĻ•ā§āĻˇāĻ° āĻĻā§āĻŦāĻžāĻ°āĻž āĻŦāĻŋāĻ¤āĻ°āĻŖ āĻĒā§āĻ°āĻĻāĻ°ā§āĻļāĻ¨ āĻ•āĻ°ā§āĻ¨;
  • āĻŦā§‡āĻļ āĻ•āĻ¯āĻŧā§‡āĻ•āĻŸāĻŋ āĻŦāĻŋāĻ–ā§āĻ¯āĻžāĻ¤ āĻŦā§āĻ¯āĻ•ā§āĻ¤āĻŋāĻĻā§‡āĻ° (āĻ°āĻžāĻˇā§āĻŸā§āĻ°āĻĒāĻ¤āĻŋ, āĻ—āĻžāĻ¯āĻŧāĻ•, āĻ…āĻ­āĻŋāĻ¨ā§‡āĻ¤āĻž, āĻšāĻ˛āĻšā§āĻšāĻŋāĻ¤ā§āĻ°ā§‡āĻ° āĻšāĻ°āĻŋāĻ¤ā§āĻ°) āĻāĻ•āĻŸāĻŋ āĻ¤āĻžāĻ˛āĻŋāĻ•āĻž āĻ¤ā§ˆāĻ°āĻŋ āĻ•āĻ°ā§āĻ¨ āĻāĻŦāĻ‚ āĻ¨āĻžāĻŽā§‡āĻ° āĻ—āĻ¤āĻŋāĻļā§€āĻ˛āĻ¤āĻžāĻ° āĻ‰āĻĒāĻ° āĻ¤āĻžāĻĻā§‡āĻ° āĻĒā§āĻ°āĻ­āĻžāĻŦ āĻŽā§‚āĻ˛ā§āĻ¯āĻžāĻ¯āĻŧāĻ¨ āĻ•āĻ°ā§āĻ¨āĨ¤ āĻāĻ•āĻŸāĻŋ āĻ­āĻŋāĻœā§āĻ¯ā§āĻ¯āĻŧāĻžāĻ˛āĻžāĻ‡āĻœā§‡āĻļāĻ¨ āĻ¤ā§ˆāĻ°āĻŋ āĻ•āĻ°ā§āĻ¨āĨ¤

āĻ•āĻŽ āĻļāĻŦā§āĻĻ, āĻ†āĻ°ā§‹ āĻ•ā§‹āĻĄ!

āĻāĻŦāĻ‚, āĻšāĻ˛ā§āĻ¨.

āĻ†āĻ¸ā§āĻ¨ āĻ˛āĻŋāĻ™ā§āĻ— āĻāĻŦāĻ‚ āĻŦāĻ›āĻ° āĻ…āĻ¨ā§āĻ¸āĻžāĻ°ā§‡ āĻĄā§‡āĻŸāĻž āĻ—ā§‹āĻˇā§āĻ ā§€āĻŦāĻĻā§āĻ§ āĻ•āĻ°āĻŋ āĻāĻŦāĻ‚ āĻ‰āĻ­āĻ¯āĻŧ āĻ˛āĻŋāĻ™ā§āĻ—ā§‡āĻ° āĻœāĻ¨ā§āĻŽāĻšāĻžāĻ°ā§‡āĻ° āĻ¸āĻžāĻŽāĻ—ā§āĻ°āĻŋāĻ• āĻ—āĻ¤āĻŋāĻļā§€āĻ˛āĻ¤āĻž āĻ•āĻ˛ā§āĻĒāĻ¨āĻž āĻ•āĻ°āĻŋ:

import numpy as np
import pandas as pd 
import matplotlib.pyplot as plt

years = np.arange(1880, 2011, 3)
datalist = 'https://raw.githubusercontent.com/wesm/pydata-book/2nd-edition/datasets/babynames/yob{year}.txt'
dataframes = []
for year in years:
    dataset = datalist.format(year=year)
    dataframe = pd.read_csv(dataset, names=['name', 'sex', 'count'])
    dataframes.append(dataframe.assign(year=year))

result = pd.concat(dataframes)
sex = result.groupby('sex')
births_men = sex.get_group('M').groupby('year', as_index=False)
births_women = sex.get_group('F').groupby('year', as_index=False)
births_men_list = births_men.aggregate(np.sum)['count'].tolist()
births_women_list = births_women.aggregate(np.sum)['count'].tolist()

fig, ax = plt.subplots()
fig.set_size_inches(25,15)

index = np.arange(len(years))
stolb1 = ax.bar(index, births_men_list, 0.4, color='c', label='МŅƒĐļŅ‡Đ¸ĐŊŅ‹')
stolb2 = ax.bar(index + 0.4, births_women_list, 0.4, alpha=0.8, color='r', label='ЖĐĩĐŊŅ‰Đ¸ĐŊŅ‹')

ax.set_title('Đ ĐžĐļĐ´Đ°ĐĩĐŧĐžŅŅ‚ŅŒ ĐŋĐž ĐŋĐžĐģŅƒ и ĐŗОдаĐŧ')
ax.set_xlabel('Года')
ax.set_ylabel('Đ ĐžĐļĐ´Đ°ĐĩĐŧĐžŅŅ‚ŅŒ')
ax.set_xticklabels(years)
ax.set_xticks(index + 0.4)
ax.legend(loc=9)

fig.tight_layout()
plt.show()

āĻĒāĻžāĻ‡āĻĨāĻ¨ā§‡ āĻ—ā§āĻ°ā§āĻĒāĻŋāĻ‚ āĻāĻŦāĻ‚ āĻĄā§‡āĻŸāĻž āĻ­āĻŋāĻœā§āĻ¯ā§āĻ¯āĻŧāĻžāĻ˛āĻžāĻ‡āĻœā§‡āĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ°ā§‡āĻ° āĻĻāĻ•ā§āĻˇāĻ¤āĻž āĻ¨āĻŋāĻ¯āĻŧā§‡ āĻ•āĻžāĻœ āĻ•āĻ°āĻž

āĻ†āĻ¸ā§āĻ¨ āĻ‡āĻ¤āĻŋāĻšāĻžāĻ¸ā§‡āĻ° āĻ¸āĻŦāĻšā§‡āĻ¯āĻŧā§‡ āĻœāĻ¨āĻĒā§āĻ°āĻŋāĻ¯āĻŧ āĻ¨āĻžāĻŽāĻ—ā§āĻ˛āĻŋ āĻ–ā§āĻāĻœā§‡ āĻŦā§‡āĻ° āĻ•āĻ°āĻž āĻ¯āĻžāĻ•:

years = np.arange(1880, 2011)

dataframes = []
for year in years:
    dataset = datalist.format(year=year)
    dataframe = pd.read_csv(dataset, names=['name', 'sex', 'count'])
    dataframes.append(dataframe)

result = pd.concat(dataframes)
names = result.groupby('name', as_index=False).sum().sort_values('count', ascending=False)
names.head(10)

āĻĒāĻžāĻ‡āĻĨāĻ¨ā§‡ āĻ—ā§āĻ°ā§āĻĒāĻŋāĻ‚ āĻāĻŦāĻ‚ āĻĄā§‡āĻŸāĻž āĻ­āĻŋāĻœā§āĻ¯ā§āĻ¯āĻŧāĻžāĻ˛āĻžāĻ‡āĻœā§‡āĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ°ā§‡āĻ° āĻĻāĻ•ā§āĻˇāĻ¤āĻž āĻ¨āĻŋāĻ¯āĻŧā§‡ āĻ•āĻžāĻœ āĻ•āĻ°āĻž

āĻ†āĻ¸ā§āĻ¨ āĻĄā§‡āĻŸāĻžāĻ° āĻĒā§āĻ°ā§‹ āĻ¸āĻŽāĻ¯āĻŧāĻ•āĻžāĻ˛āĻŸāĻŋāĻ•ā§‡ 10āĻŸāĻŋ āĻ…āĻ‚āĻļā§‡ āĻ­āĻžāĻ— āĻ•āĻ°āĻŋ āĻāĻŦāĻ‚ āĻĒā§āĻ°āĻ¤āĻŋāĻŸāĻŋāĻ° āĻœāĻ¨ā§āĻ¯ āĻ†āĻŽāĻ°āĻž āĻĒā§āĻ°āĻ¤āĻŋāĻŸāĻŋ āĻ˛āĻŋāĻ™ā§āĻ—ā§‡āĻ° āĻ¸āĻŦāĻšā§‡āĻ¯āĻŧā§‡ āĻœāĻ¨āĻĒā§āĻ°āĻŋāĻ¯āĻŧ āĻ¨āĻžāĻŽāĻŸāĻŋ āĻ–ā§āĻāĻœā§‡ āĻĒāĻžāĻŦāĨ¤ āĻĒāĻžāĻ“āĻ¯āĻŧāĻž āĻĒā§āĻ°āĻ¤āĻŋāĻŸāĻŋ āĻ¨āĻžāĻŽā§‡āĻ° āĻœāĻ¨ā§āĻ¯, āĻ†āĻŽāĻ°āĻž āĻ¸āĻŦ āĻ¸āĻŽāĻ¯āĻŧ āĻāĻ° āĻ—āĻ¤āĻŋāĻļā§€āĻ˛āĻ¤āĻž āĻ•āĻ˛ā§āĻĒāĻ¨āĻž āĻ•āĻ°āĻŋ:

years = np.arange(1880, 2011)
part_size = int((years[years.size - 1] - years[0]) / 10) + 1
parts = {}
def GetPart(year):
    return int((year - years[0]) / part_size)
for year in years:
    index = GetPart(year)
    r = years[0] + part_size * index, min(years[years.size - 1], years[0] + part_size * (index + 1))
    parts[index] = str(r[0]) + '-' + str(r[1])

dataframe_parts = []
dataframes = []
for year in years:
    dataset = datalist.format(year=year)
    dataframe = pd.read_csv(dataset, names=['name', 'sex', 'count'])
    dataframe_parts.append(dataframe.assign(years=parts[GetPart(year)]))
    dataframes.append(dataframe.assign(year=year))
    
result_parts = pd.concat(dataframe_parts)
result = pd.concat(dataframes)

result_parts_sums = result_parts.groupby(['years', 'sex', 'name'], as_index=False).sum()
result_parts_names = result_parts_sums.iloc[result_parts_sums.groupby(['years', 'sex'], as_index=False).apply(lambda x: x['count'].idxmax())]
result_sums = result.groupby(['year', 'sex', 'name'], as_index=False).sum()

for groupName, groupLabels in result_parts_names.groupby(['name', 'sex']).groups.items():
    group = result_sums.groupby(['name', 'sex']).get_group(groupName)
    fig, ax = plt.subplots(1, 1, figsize=(18,10))

    ax.set_xlabel('Года')
    ax.set_ylabel('Đ ĐžĐļĐ´Đ°ĐĩĐŧĐžŅŅ‚ŅŒ')
    label = group['name']
    ax.plot(group['year'], group['count'], label=label.aggregate(np.max), color='b', ls='-')
    ax.legend(loc=9, fontsize=11)

    plt.show()

āĻĒāĻžāĻ‡āĻĨāĻ¨ā§‡ āĻ—ā§āĻ°ā§āĻĒāĻŋāĻ‚ āĻāĻŦāĻ‚ āĻĄā§‡āĻŸāĻž āĻ­āĻŋāĻœā§āĻ¯ā§āĻ¯āĻŧāĻžāĻ˛āĻžāĻ‡āĻœā§‡āĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ°ā§‡āĻ° āĻĻāĻ•ā§āĻˇāĻ¤āĻž āĻ¨āĻŋāĻ¯āĻŧā§‡ āĻ•āĻžāĻœ āĻ•āĻ°āĻž

āĻĒāĻžāĻ‡āĻĨāĻ¨ā§‡ āĻ—ā§āĻ°ā§āĻĒāĻŋāĻ‚ āĻāĻŦāĻ‚ āĻĄā§‡āĻŸāĻž āĻ­āĻŋāĻœā§āĻ¯ā§āĻ¯āĻŧāĻžāĻ˛āĻžāĻ‡āĻœā§‡āĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ°ā§‡āĻ° āĻĻāĻ•ā§āĻˇāĻ¤āĻž āĻ¨āĻŋāĻ¯āĻŧā§‡ āĻ•āĻžāĻœ āĻ•āĻ°āĻž

āĻĒāĻžāĻ‡āĻĨāĻ¨ā§‡ āĻ—ā§āĻ°ā§āĻĒāĻŋāĻ‚ āĻāĻŦāĻ‚ āĻĄā§‡āĻŸāĻž āĻ­āĻŋāĻœā§āĻ¯ā§āĻ¯āĻŧāĻžāĻ˛āĻžāĻ‡āĻœā§‡āĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ°ā§‡āĻ° āĻĻāĻ•ā§āĻˇāĻ¤āĻž āĻ¨āĻŋāĻ¯āĻŧā§‡ āĻ•āĻžāĻœ āĻ•āĻ°āĻž

āĻĒāĻžāĻ‡āĻĨāĻ¨ā§‡ āĻ—ā§āĻ°ā§āĻĒāĻŋāĻ‚ āĻāĻŦāĻ‚ āĻĄā§‡āĻŸāĻž āĻ­āĻŋāĻœā§āĻ¯ā§āĻ¯āĻŧāĻžāĻ˛āĻžāĻ‡āĻœā§‡āĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ°ā§‡āĻ° āĻĻāĻ•ā§āĻˇāĻ¤āĻž āĻ¨āĻŋāĻ¯āĻŧā§‡ āĻ•āĻžāĻœ āĻ•āĻ°āĻž

āĻĒāĻžāĻ‡āĻĨāĻ¨ā§‡ āĻ—ā§āĻ°ā§āĻĒāĻŋāĻ‚ āĻāĻŦāĻ‚ āĻĄā§‡āĻŸāĻž āĻ­āĻŋāĻœā§āĻ¯ā§āĻ¯āĻŧāĻžāĻ˛āĻžāĻ‡āĻœā§‡āĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ°ā§‡āĻ° āĻĻāĻ•ā§āĻˇāĻ¤āĻž āĻ¨āĻŋāĻ¯āĻŧā§‡ āĻ•āĻžāĻœ āĻ•āĻ°āĻž

āĻĒāĻžāĻ‡āĻĨāĻ¨ā§‡ āĻ—ā§āĻ°ā§āĻĒāĻŋāĻ‚ āĻāĻŦāĻ‚ āĻĄā§‡āĻŸāĻž āĻ­āĻŋāĻœā§āĻ¯ā§āĻ¯āĻŧāĻžāĻ˛āĻžāĻ‡āĻœā§‡āĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ°ā§‡āĻ° āĻĻāĻ•ā§āĻˇāĻ¤āĻž āĻ¨āĻŋāĻ¯āĻŧā§‡ āĻ•āĻžāĻœ āĻ•āĻ°āĻž

āĻĒāĻžāĻ‡āĻĨāĻ¨ā§‡ āĻ—ā§āĻ°ā§āĻĒāĻŋāĻ‚ āĻāĻŦāĻ‚ āĻĄā§‡āĻŸāĻž āĻ­āĻŋāĻœā§āĻ¯ā§āĻ¯āĻŧāĻžāĻ˛āĻžāĻ‡āĻœā§‡āĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ°ā§‡āĻ° āĻĻāĻ•ā§āĻˇāĻ¤āĻž āĻ¨āĻŋāĻ¯āĻŧā§‡ āĻ•āĻžāĻœ āĻ•āĻ°āĻž

āĻĒāĻžāĻ‡āĻĨāĻ¨ā§‡ āĻ—ā§āĻ°ā§āĻĒāĻŋāĻ‚ āĻāĻŦāĻ‚ āĻĄā§‡āĻŸāĻž āĻ­āĻŋāĻœā§āĻ¯ā§āĻ¯āĻŧāĻžāĻ˛āĻžāĻ‡āĻœā§‡āĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ°ā§‡āĻ° āĻĻāĻ•ā§āĻˇāĻ¤āĻž āĻ¨āĻŋāĻ¯āĻŧā§‡ āĻ•āĻžāĻœ āĻ•āĻ°āĻž

āĻĒāĻžāĻ‡āĻĨāĻ¨ā§‡ āĻ—ā§āĻ°ā§āĻĒāĻŋāĻ‚ āĻāĻŦāĻ‚ āĻĄā§‡āĻŸāĻž āĻ­āĻŋāĻœā§āĻ¯ā§āĻ¯āĻŧāĻžāĻ˛āĻžāĻ‡āĻœā§‡āĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ°ā§‡āĻ° āĻĻāĻ•ā§āĻˇāĻ¤āĻž āĻ¨āĻŋāĻ¯āĻŧā§‡ āĻ•āĻžāĻœ āĻ•āĻ°āĻž

āĻĒāĻžāĻ‡āĻĨāĻ¨ā§‡ āĻ—ā§āĻ°ā§āĻĒāĻŋāĻ‚ āĻāĻŦāĻ‚ āĻĄā§‡āĻŸāĻž āĻ­āĻŋāĻœā§āĻ¯ā§āĻ¯āĻŧāĻžāĻ˛āĻžāĻ‡āĻœā§‡āĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ°ā§‡āĻ° āĻĻāĻ•ā§āĻˇāĻ¤āĻž āĻ¨āĻŋāĻ¯āĻŧā§‡ āĻ•āĻžāĻœ āĻ•āĻ°āĻž

āĻĒā§āĻ°āĻ¤āĻŋ āĻŦāĻ›āĻ°ā§‡āĻ° āĻœāĻ¨ā§āĻ¯, āĻ†āĻŽāĻ°āĻž āĻ—āĻŖāĻ¨āĻž āĻ•āĻ°āĻŋ āĻ•āĻ¤āĻ—ā§āĻ˛āĻŋ āĻ¨āĻžāĻŽ 50% āĻ˛ā§‹āĻ•āĻ•ā§‡ āĻ•āĻ­āĻžāĻ° āĻ•āĻ°ā§‡ āĻāĻŦāĻ‚ āĻāĻ‡ āĻĄā§‡āĻŸāĻžāĻŸāĻŋ āĻ•āĻ˛ā§āĻĒāĻ¨āĻž āĻ•āĻ°āĻŋ:

dataframe = pd.DataFrame({'year': [], 'count': []})
years = np.arange(1880, 2011)
for year in years:
    dataset = datalist.format(year=year)
    csv = pd.read_csv(dataset, names=['name', 'sex', 'count'])
    names = csv.groupby('name', as_index=False).aggregate(np.sum)
    names['sum'] = names.sum()['count']
    names['percent'] = names['count'] / names['sum'] * 100
    names = names.sort_values(['percent'], ascending=False)
    names['cum_perc'] = names['percent'].cumsum()
    names_filtered = names[names['cum_perc'] <= 50]
    dataframe = dataframe.append(pd.DataFrame({'year': [year], 'count': [names_filtered.shape[0]]}))

fig, ax1 = plt.subplots(1, 1, figsize=(22,13))
ax1.set_xlabel('Года', fontsize = 12)
ax1.set_ylabel('РаСĐŊООйŅ€Đ°ĐˇĐ¸Đĩ иĐŧĐĩĐŊ', fontsize = 12)
ax1.plot(dataframe['year'], dataframe['count'], color='r', ls='-')
ax1.legend(loc=9, fontsize=12)

plt.show()

āĻĒāĻžāĻ‡āĻĨāĻ¨ā§‡ āĻ—ā§āĻ°ā§āĻĒāĻŋāĻ‚ āĻāĻŦāĻ‚ āĻĄā§‡āĻŸāĻž āĻ­āĻŋāĻœā§āĻ¯ā§āĻ¯āĻŧāĻžāĻ˛āĻžāĻ‡āĻœā§‡āĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ°ā§‡āĻ° āĻĻāĻ•ā§āĻˇāĻ¤āĻž āĻ¨āĻŋāĻ¯āĻŧā§‡ āĻ•āĻžāĻœ āĻ•āĻ°āĻž

āĻ†āĻ¸ā§āĻ¨ āĻĒā§āĻ°ā§‹ āĻŦā§āĻ¯āĻŦāĻ§āĻžāĻ¨ āĻĨā§‡āĻ•ā§‡ 4 āĻŦāĻ›āĻ° āĻ¨āĻŋāĻ°ā§āĻŦāĻžāĻšāĻ¨ āĻ•āĻ°āĻŋ āĻāĻŦāĻ‚ āĻĒā§āĻ°āĻ¤āĻŋāĻŸāĻŋ āĻŦāĻ›āĻ°ā§‡āĻ° āĻœāĻ¨ā§āĻ¯ āĻ¨āĻžāĻŽā§‡āĻ° āĻĒā§āĻ°āĻĨāĻŽ āĻ…āĻ•ā§āĻˇāĻ° āĻāĻŦāĻ‚ āĻ¨āĻžāĻŽā§‡āĻ° āĻļā§‡āĻˇ āĻ…āĻ•ā§āĻˇāĻ° āĻĻā§āĻŦāĻžāĻ°āĻž āĻŦāĻŋāĻ¤āĻ°āĻŖ āĻĒā§āĻ°āĻĻāĻ°ā§āĻļāĻ¨ āĻ•āĻ°ā§āĻ¨:

from string import ascii_lowercase, ascii_uppercase

fig_first, ax_first = plt.subplots(1, 1, figsize=(14,10))
fig_last, ax_last = plt.subplots(1, 1, figsize=(14,10))

index = np.arange(len(ascii_uppercase))
years = [1944, 1978, 1991, 2003]
colors = ['r', 'g', 'b', 'y']
n = 0
for year in years:
    dataset = datalist.format(year=year)
    csv = pd.read_csv(dataset, names=['name', 'sex', 'count'])
    names = csv.groupby('name', as_index=False).aggregate(np.sum)
    count = names.shape[0]

    dataframe = pd.DataFrame({'letter': [], 'frequency_first': [], 'frequency_last': []})
    for letter in ascii_uppercase:
        countFirst = (names[names.name.str.startswith(letter)].count()['count'])
        countLast = (names[names.name.str.endswith(letter.lower())].count()['count'])

        dataframe = dataframe.append(pd.DataFrame({
            'letter': [letter],
            'frequency_first': [countFirst / count * 100],
            'frequency_last': [countLast / count * 100]}))

    ax_first.bar(index + 0.3 * n, dataframe['frequency_first'], 0.3, alpha=0.5, color=colors[n], label=year)
    ax_last.bar(index + bar_width * n, dataframe['frequency_last'], 0.3, alpha=0.5, color=colors[n], label=year)
    n += 1

ax_first.set_xlabel('БŅƒĐēва Đ°ĐģŅ„авиŅ‚Đ°')
ax_first.set_ylabel('ЧаŅŅ‚ĐžŅ‚Đ°, %')
ax_first.set_title('ПĐĩŅ€Đ˛Đ°Ņ ĐąŅƒĐēва в иĐŧĐĩĐŊи')
ax_first.set_xticks(index)
ax_first.set_xticklabels(ascii_uppercase)
ax_first.legend()

ax_last.set_xlabel('БŅƒĐēва Đ°ĐģŅ„авиŅ‚Đ°')
ax_last.set_ylabel('ЧаŅŅ‚ĐžŅ‚Đ°, %')
ax_last.set_title('ПоŅĐģĐĩĐ´ĐŊŅŅ ĐąŅƒĐēва в иĐŧĐĩĐŊи')
ax_last.set_xticks(index)
ax_last.set_xticklabels(ascii_uppercase)
ax_last.legend()

fig_first.tight_layout()
fig_last.tight_layout()

plt.show()

āĻĒāĻžāĻ‡āĻĨāĻ¨ā§‡ āĻ—ā§āĻ°ā§āĻĒāĻŋāĻ‚ āĻāĻŦāĻ‚ āĻĄā§‡āĻŸāĻž āĻ­āĻŋāĻœā§āĻ¯ā§āĻ¯āĻŧāĻžāĻ˛āĻžāĻ‡āĻœā§‡āĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ°ā§‡āĻ° āĻĻāĻ•ā§āĻˇāĻ¤āĻž āĻ¨āĻŋāĻ¯āĻŧā§‡ āĻ•āĻžāĻœ āĻ•āĻ°āĻž

āĻĒāĻžāĻ‡āĻĨāĻ¨ā§‡ āĻ—ā§āĻ°ā§āĻĒāĻŋāĻ‚ āĻāĻŦāĻ‚ āĻĄā§‡āĻŸāĻž āĻ­āĻŋāĻœā§āĻ¯ā§āĻ¯āĻŧāĻžāĻ˛āĻžāĻ‡āĻœā§‡āĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ°ā§‡āĻ° āĻĻāĻ•ā§āĻˇāĻ¤āĻž āĻ¨āĻŋāĻ¯āĻŧā§‡ āĻ•āĻžāĻœ āĻ•āĻ°āĻž

āĻ†āĻ¸ā§āĻ¨ āĻŦā§‡āĻļ āĻ•āĻ¯āĻŧā§‡āĻ•āĻŸāĻŋ āĻŦāĻŋāĻ–ā§āĻ¯āĻžāĻ¤ āĻŦā§āĻ¯āĻ•ā§āĻ¤āĻŋāĻĻā§‡āĻ° (āĻ°āĻžāĻˇā§āĻŸā§āĻ°āĻĒāĻ¤āĻŋ, āĻ—āĻžāĻ¯āĻŧāĻ•, āĻ…āĻ­āĻŋāĻ¨ā§‡āĻ¤āĻž, āĻšāĻ˛āĻšā§āĻšāĻŋāĻ¤ā§āĻ°ā§‡āĻ° āĻšāĻ°āĻŋāĻ¤ā§āĻ°) āĻāĻ•āĻŸāĻŋ āĻ¤āĻžāĻ˛āĻŋāĻ•āĻž āĻ¤ā§ˆāĻ°āĻŋ āĻ•āĻ°āĻŋ āĻāĻŦāĻ‚ āĻ¨āĻžāĻŽā§‡āĻ° āĻ—āĻ¤āĻŋāĻļā§€āĻ˛āĻ¤āĻžāĻ° āĻ‰āĻĒāĻ° āĻ¤āĻžāĻĻā§‡āĻ° āĻĒā§āĻ°āĻ­āĻžāĻŦ āĻŽā§‚āĻ˛ā§āĻ¯āĻžāĻ¯āĻŧāĻ¨ āĻ•āĻ°āĻŋ:

celebrities = {'Frank': 'M', 'Britney': 'F', 'Madonna': 'F', 'Bob': 'M'}
dataframes = []
for year in years:
    dataset = datalist.format(year=year)
    dataframe = pd.read_csv(dataset, names=['name', 'sex', 'count'])
    dataframes.append(dataframe.assign(year=year))

result = pd.concat(dataframes)

for celebrity, sex in celebrities.items():
    names = result[result.name == celebrity]
    dataframe = names[names.sex == sex]
    fig, ax = plt.subplots(1, 1, figsize=(16,8))

    ax.set_xlabel('Года', fontsize = 10)
    ax.set_ylabel('Đ ĐžĐļĐ´Đ°ĐĩĐŧĐžŅŅ‚ŅŒ', fontsize = 10)
    ax.plot(dataframe['year'], dataframe['count'], label=celebrity, color='r', ls='-')
    ax.legend(loc=9, fontsize=12)
        
    plt.show()

āĻĒāĻžāĻ‡āĻĨāĻ¨ā§‡ āĻ—ā§āĻ°ā§āĻĒāĻŋāĻ‚ āĻāĻŦāĻ‚ āĻĄā§‡āĻŸāĻž āĻ­āĻŋāĻœā§āĻ¯ā§āĻ¯āĻŧāĻžāĻ˛āĻžāĻ‡āĻœā§‡āĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ°ā§‡āĻ° āĻĻāĻ•ā§āĻˇāĻ¤āĻž āĻ¨āĻŋāĻ¯āĻŧā§‡ āĻ•āĻžāĻœ āĻ•āĻ°āĻž

āĻĒāĻžāĻ‡āĻĨāĻ¨ā§‡ āĻ—ā§āĻ°ā§āĻĒāĻŋāĻ‚ āĻāĻŦāĻ‚ āĻĄā§‡āĻŸāĻž āĻ­āĻŋāĻœā§āĻ¯ā§āĻ¯āĻŧāĻžāĻ˛āĻžāĻ‡āĻœā§‡āĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ°ā§‡āĻ° āĻĻāĻ•ā§āĻˇāĻ¤āĻž āĻ¨āĻŋāĻ¯āĻŧā§‡ āĻ•āĻžāĻœ āĻ•āĻ°āĻž

āĻĒāĻžāĻ‡āĻĨāĻ¨ā§‡ āĻ—ā§āĻ°ā§āĻĒāĻŋāĻ‚ āĻāĻŦāĻ‚ āĻĄā§‡āĻŸāĻž āĻ­āĻŋāĻœā§āĻ¯ā§āĻ¯āĻŧāĻžāĻ˛āĻžāĻ‡āĻœā§‡āĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ°ā§‡āĻ° āĻĻāĻ•ā§āĻˇāĻ¤āĻž āĻ¨āĻŋāĻ¯āĻŧā§‡ āĻ•āĻžāĻœ āĻ•āĻ°āĻž

āĻĒāĻžāĻ‡āĻĨāĻ¨ā§‡ āĻ—ā§āĻ°ā§āĻĒāĻŋāĻ‚ āĻāĻŦāĻ‚ āĻĄā§‡āĻŸāĻž āĻ­āĻŋāĻœā§āĻ¯ā§āĻ¯āĻŧāĻžāĻ˛āĻžāĻ‡āĻœā§‡āĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ°ā§‡āĻ° āĻĻāĻ•ā§āĻˇāĻ¤āĻž āĻ¨āĻŋāĻ¯āĻŧā§‡ āĻ•āĻžāĻœ āĻ•āĻ°āĻž

āĻĒā§āĻ°āĻļāĻŋāĻ•ā§āĻˇāĻŖā§‡āĻ° āĻœāĻ¨ā§āĻ¯, āĻ¨āĻžāĻŽāĻ—ā§āĻ˛āĻŋāĻ° āĻ—āĻ¤āĻŋāĻļā§€āĻ˛āĻ¤āĻžāĻ° āĻ‰āĻĒāĻ° āĻ¤āĻžāĻĻā§‡āĻ° āĻĒā§āĻ°āĻ­āĻžāĻŦ āĻ¸ā§āĻĒāĻˇā§āĻŸāĻ­āĻžāĻŦā§‡ āĻŽā§‚āĻ˛ā§āĻ¯āĻžāĻ¯āĻŧāĻ¨ āĻ•āĻ°āĻžāĻ° āĻœāĻ¨ā§āĻ¯ āĻ†āĻĒāĻ¨āĻŋ āĻļā§‡āĻˇ āĻ‰āĻĻāĻžāĻšāĻ°āĻŖ āĻĨā§‡āĻ•ā§‡ āĻ­āĻŋāĻœā§āĻ¯ā§āĻ¯āĻŧāĻžāĻ˛āĻžāĻ‡āĻœā§‡āĻļāĻ¨ā§‡ āĻ¸ā§‡āĻ˛āĻŋāĻŦā§āĻ°āĻŋāĻŸāĻŋāĻ° āĻœā§€āĻŦāĻ¨āĻ•āĻžāĻ˛ āĻ¯ā§āĻ•ā§āĻ¤ āĻ•āĻ°āĻ¤ā§‡ āĻĒāĻžāĻ°ā§‡āĻ¨āĨ¤

āĻāĻ° āĻŽāĻžāĻ§ā§āĻ¯āĻŽā§‡ āĻ†āĻŽāĻžāĻĻā§‡āĻ° āĻ¸āĻ•āĻ˛ āĻ˛āĻ•ā§āĻˇā§āĻ¯ āĻ…āĻ°ā§āĻœāĻŋāĻ¤ āĻ“ āĻĒā§‚āĻ°ā§āĻŖ āĻšāĻ¯āĻŧā§‡āĻ›ā§‡āĨ¤ āĻ†āĻŽāĻ°āĻž āĻĒāĻžāĻ‡āĻĨāĻ¨ā§‡ āĻĄā§‡āĻŸāĻž āĻ—ā§āĻ°ā§āĻĒāĻŋāĻ‚ āĻāĻŦāĻ‚ āĻ­āĻŋāĻœā§āĻ¯ā§āĻ¯āĻŧāĻžāĻ˛āĻžāĻ‡āĻœ āĻ•āĻ°āĻžāĻ° āĻœāĻ¨ā§āĻ¯ āĻ¸āĻ°āĻžā§āĻœāĻžāĻŽāĻ—ā§āĻ˛āĻŋ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻ•āĻ°āĻžāĻ° āĻĻāĻ•ā§āĻˇāĻ¤āĻž āĻ¤ā§ˆāĻ°āĻŋ āĻ•āĻ°ā§‡āĻ›āĻŋ āĻāĻŦāĻ‚ āĻ†āĻŽāĻ°āĻž āĻĄā§‡āĻŸāĻž āĻ¨āĻŋāĻ¯āĻŧā§‡ āĻ•āĻžāĻœ āĻšāĻžāĻ˛āĻŋāĻ¯āĻŧā§‡ āĻ¯āĻžāĻŦāĨ¤ āĻĒā§āĻ°āĻ¤ā§āĻ¯ā§‡āĻ•ā§‡āĻ‡ āĻĒā§āĻ°āĻ¸ā§āĻ¤ā§āĻ¤āĻ•ā§ƒāĻ¤, āĻ­āĻŋāĻœā§āĻ¯ā§āĻ¯āĻŧāĻžāĻ˛āĻžāĻ‡āĻœāĻĄ āĻĄā§‡āĻŸāĻžāĻ° āĻ‰āĻĒāĻ° āĻ­āĻŋāĻ¤ā§āĻ¤āĻŋ āĻ•āĻ°ā§‡ āĻ¸āĻŋāĻĻā§āĻ§āĻžāĻ¨ā§āĻ¤ āĻ¨āĻŋāĻ¤ā§‡ āĻĒāĻžāĻ°ā§‡āĨ¤

āĻ¸āĻŦāĻžāĻ° āĻ•āĻžāĻ›ā§‡ āĻœā§āĻžāĻžāĻ¨!

āĻ‰āĻ¤ā§āĻ¸: www.habr.com

āĻāĻ•āĻŸāĻŋ āĻŽāĻ¨ā§āĻ¤āĻŦā§āĻ¯ āĻœā§āĻĄāĻŧā§āĻ¨