рдкрд╛рдпрдерди рдореЗрдВ рдЧреНрд░реБрдкрд┐рдВрдЧ рдФрд░ рдбреЗрдЯрд╛ рд╡рд┐рдЬрд╝реБрдЕрд▓рд╛рдЗрдЬрд╝реЗрд╢рди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рдХреМрд╢рд▓ рдкрд░ рдХрд╛рдо рдХрд░рдирд╛

рдкрд╛рдпрдерди рдореЗрдВ рдЧреНрд░реБрдкрд┐рдВрдЧ рдФрд░ рдбреЗрдЯрд╛ рд╡рд┐рдЬрд╝реБрдЕрд▓рд╛рдЗрдЬрд╝реЗрд╢рди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рдХреМрд╢рд▓ рдкрд░ рдХрд╛рдо рдХрд░рдирд╛

рд╣реЗ рд╣рдмрд░!

рдЖрдЬ рд╣рдо рдкрд╛рдпрдерди рдореЗрдВ рдбреЗрдЯрд╛ рдХреЛ рдЧреНрд░реБрдкрд┐рдВрдЧ рдФрд░ рд╡рд┐рдЬрд╝реБрдЕрд▓рд╛рдЗрдЬрд╝ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЯреВрд▓ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рдХреМрд╢рд▓ рдкрд░ рдХрд╛рдо рдХрд░реЗрдВрдЧреЗред рджрд┐рдП рдЧрдП рдореЗрдВ Github рдкрд░ рдбреЗрдЯрд╛рд╕реЗрдЯ рдЖрдЗрдП рдХрдИ рд╡рд┐рд╢реЗрд╖рддрд╛рдУрдВ рдХрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХрд░реЗрдВ рдФрд░ рд╡рд┐рдЬрд╝реБрдЕрд▓рд╛рдЗрдЬрд╝реЗрд╢рди рдХрд╛ рдПрдХ рд╕реЗрдЯ рдмрдирд╛рдПрдВред

рдкрд░рдВрдкрд░рд╛ рдХреЗ рдЕрдиреБрд╕рд╛рд░, рд╢реБрд░реБрдЖрдд рдореЗрдВ, рдЖрдЗрдП рд▓рдХреНрд╖реНрдп рдкрд░рд┐рднрд╛рд╖рд┐рдд рдХрд░реЗрдВ:

  • рд▓рд┐рдВрдЧ рдФрд░ рд╡рд░реНрд╖ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рдбреЗрдЯрд╛ рд╕рдореВрд╣рд┐рдд рдХрд░реЗрдВ рдФрд░ рджреЛрдиреЛрдВ рд▓рд┐рдВрдЧреЛрдВ рдХреА рдЬрдиреНрдо рджрд░ рдХреА рд╕рдордЧреНрд░ рдЧрддрд┐рд╢реАрд▓рддрд╛ рдХреА рдХрд▓реНрдкрдирд╛ рдХрд░реЗрдВ;
  • рдЕрдм рддрдХ рдХреЗ рд╕рдмрд╕реЗ рд▓реЛрдХрдкреНрд░рд┐рдп рдирд╛рдо рдЦреЛрдЬреЗрдВ;
  • рдбреЗрдЯрд╛ рдореЗрдВ рд╕рдВрдкреВрд░реНрдг рд╕рдордпрд╛рд╡рдзрд┐ рдХреЛ 10 рднрд╛рдЧреЛрдВ рдореЗрдВ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд░реЗрдВ рдФрд░ рдкреНрд░рддреНрдпреЗрдХ рдХреЗ рд▓рд┐рдП, рдкреНрд░рддреНрдпреЗрдХ рд▓рд┐рдВрдЧ рдХрд╛ рд╕рдмрд╕реЗ рд▓реЛрдХрдкреНрд░рд┐рдп рдирд╛рдо рдвреВрдВрдвреЗрдВред рдкрд╛рдП рдЧрдП рдкреНрд░рддреНрдпреЗрдХ рдирд╛рдо рдХреЗ рд▓рд┐рдП, рд╣рд░ рд╕рдордп рдЙрд╕рдХреА рдЧрддрд┐рд╢реАрд▓рддрд╛ рдХреА рдХрд▓реНрдкрдирд╛ рдХрд░реЗрдВ;
  • рдкреНрд░рддреНрдпреЗрдХ рд╡рд░реНрд╖ рдХреЗ рд▓рд┐рдП, рдЧрдгрдирд╛ рдХрд░реЗрдВ рдХрд┐ рдХрд┐рддрдиреЗ рдирд╛рдо 50% рд▓реЛрдЧреЛрдВ рдХреЛ рдХрд╡рд░ рдХрд░рддреЗ рд╣реИрдВ рдФрд░ рдХрд▓реНрдкрдирд╛ рдХрд░реЗрдВ (рд╣рдо рдкреНрд░рддреНрдпреЗрдХ рд╡рд░реНрд╖ рдХреЗ рд▓рд┐рдП рдирд╛рдореЛрдВ рдХреА рд╡рд┐рд╡рд┐рдзрддрд╛ рджреЗрдЦреЗрдВрдЧреЗ);
  • рд╕рдВрдкреВрд░реНрдг рдЕрдВрддрд░рд╛рд▓ рд╕реЗ 4 рд╡рд░реНрд╖ рдЪреБрдиреЗрдВ рдФрд░ рдкреНрд░рддреНрдпреЗрдХ рд╡рд░реНрд╖ рдХреЗ рд▓рд┐рдП рдирд╛рдо рдХреЗ рдкрд╣рд▓реЗ рдЕрдХреНрд╖рд░ рдФрд░ рдирд╛рдо рдХреЗ рдЕрдВрддрд┐рдо рдЕрдХреНрд╖рд░ рджреНрд╡рд╛рд░рд╛ рд╡рд┐рддрд░рдг рдкреНрд░рджрд░реНрд╢рд┐рдд рдХрд░реЗрдВ;
  • рдХрдИ рдкреНрд░рд╕рд┐рджреНрдз рд▓реЛрдЧреЛрдВ (рд░рд╛рд╖реНрдЯреНрд░рдкрддрд┐, рдЧрд╛рдпрдХ, рдЕрднрд┐рдиреЗрддрд╛, рдлрд┐рд▓реНрдо рдкрд╛рддреНрд░) рдХреА рд╕реВрдЪреА рдмрдирд╛рдПрдВ рдФрд░ рдирд╛рдореЛрдВ рдХреА рдЧрддрд┐рд╢реАрд▓рддрд╛ рдкрд░ рдЙрдирдХреЗ рдкреНрд░рднрд╛рд╡ рдХрд╛ рдореВрд▓реНрдпрд╛рдВрдХрди рдХрд░реЗрдВред рдПрдХ рд╡рд┐рдЬрд╝реБрдЕрд▓рд╛рдЗрдЬрд╝реЗрд╢рди рдмрдирд╛рдПрдВ.

рдХрдо рд╢рдмреНрдж, рдЕрдзрд┐рдХ рдХреЛрдб!

рдФрд░, рдЪрд▓реЛ рдЪрд▓реЗрдВ.

рдЖрдЗрдП рдбреЗрдЯрд╛ рдХреЛ рд▓рд┐рдВрдЧ рдФрд░ рд╡рд░реНрд╖ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рд╕рдореВрд╣рд┐рдд рдХрд░реЗрдВ рдФрд░ рджреЛрдиреЛрдВ рд▓рд┐рдВрдЧреЛрдВ рдХреА рдЬрдиреНрдо рджрд░ рдХреА рд╕рдордЧреНрд░ рдЧрддрд┐рд╢реАрд▓рддрд╛ рдХреА рдХрд▓реНрдкрдирд╛ рдХрд░реЗрдВ:

import numpy as np
import pandas as pd 
import matplotlib.pyplot as plt

years = np.arange(1880, 2011, 3)
datalist = 'https://raw.githubusercontent.com/wesm/pydata-book/2nd-edition/datasets/babynames/yob{year}.txt'
dataframes = []
for year in years:
    dataset = datalist.format(year=year)
    dataframe = pd.read_csv(dataset, names=['name', 'sex', 'count'])
    dataframes.append(dataframe.assign(year=year))

result = pd.concat(dataframes)
sex = result.groupby('sex')
births_men = sex.get_group('M').groupby('year', as_index=False)
births_women = sex.get_group('F').groupby('year', as_index=False)
births_men_list = births_men.aggregate(np.sum)['count'].tolist()
births_women_list = births_women.aggregate(np.sum)['count'].tolist()

fig, ax = plt.subplots()
fig.set_size_inches(25,15)

index = np.arange(len(years))
stolb1 = ax.bar(index, births_men_list, 0.4, color='c', label='╨Ь╤Г╨╢╤З╨╕╨╜╤Л')
stolb2 = ax.bar(index + 0.4, births_women_list, 0.4, alpha=0.8, color='r', label='╨Ц╨╡╨╜╤Й╨╕╨╜╤Л')

ax.set_title('╨а╨╛╨╢╨┤╨░╨╡╨╝╨╛╤Б╤В╤М ╨┐╨╛ ╨┐╨╛╨╗╤Г ╨╕ ╨│╨╛╨┤╨░╨╝')
ax.set_xlabel('╨У╨╛╨┤╨░')
ax.set_ylabel('╨а╨╛╨╢╨┤╨░╨╡╨╝╨╛╤Б╤В╤М')
ax.set_xticklabels(years)
ax.set_xticks(index + 0.4)
ax.legend(loc=9)

fig.tight_layout()
plt.show()

рдкрд╛рдпрдерди рдореЗрдВ рдЧреНрд░реБрдкрд┐рдВрдЧ рдФрд░ рдбреЗрдЯрд╛ рд╡рд┐рдЬрд╝реБрдЕрд▓рд╛рдЗрдЬрд╝реЗрд╢рди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рдХреМрд╢рд▓ рдкрд░ рдХрд╛рдо рдХрд░рдирд╛

рдЖрдЗрдП рдЗрддрд┐рд╣рд╛рд╕ рдореЗрдВ рд╕рдмрд╕реЗ рд▓реЛрдХрдкреНрд░рд┐рдп рдирд╛рдо рдЦреЛрдЬреЗрдВ:

years = np.arange(1880, 2011)

dataframes = []
for year in years:
    dataset = datalist.format(year=year)
    dataframe = pd.read_csv(dataset, names=['name', 'sex', 'count'])
    dataframes.append(dataframe)

result = pd.concat(dataframes)
names = result.groupby('name', as_index=False).sum().sort_values('count', ascending=False)
names.head(10)

рдкрд╛рдпрдерди рдореЗрдВ рдЧреНрд░реБрдкрд┐рдВрдЧ рдФрд░ рдбреЗрдЯрд╛ рд╡рд┐рдЬрд╝реБрдЕрд▓рд╛рдЗрдЬрд╝реЗрд╢рди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рдХреМрд╢рд▓ рдкрд░ рдХрд╛рдо рдХрд░рдирд╛

рдЖрдЗрдП рдбреЗрдЯрд╛ рдХреА рдкреВрд░реА рд╕рдордпрд╛рд╡рдзрд┐ рдХреЛ 10 рднрд╛рдЧреЛрдВ рдореЗрдВ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд░реЗрдВ рдФрд░ рдкреНрд░рддреНрдпреЗрдХ рдХреЗ рд▓рд┐рдП рд╣рдо рдкреНрд░рддреНрдпреЗрдХ рд▓рд┐рдВрдЧ рдХрд╛ рд╕рдмрд╕реЗ рд▓реЛрдХрдкреНрд░рд┐рдп рдирд╛рдо рдвреВрдВрдвреЗрдВрдЧреЗред рдкрд╛рдП рдЧрдП рдкреНрд░рддреНрдпреЗрдХ рдирд╛рдо рдХреЗ рд▓рд┐рдП, рд╣рдо рд╣рд░ рд╕рдордп рдЗрд╕рдХреА рдЧрддрд┐рд╢реАрд▓рддрд╛ рдХреА рдХрд▓реНрдкрдирд╛ рдХрд░рддреЗ рд╣реИрдВ:

years = np.arange(1880, 2011)
part_size = int((years[years.size - 1] - years[0]) / 10) + 1
parts = {}
def GetPart(year):
    return int((year - years[0]) / part_size)
for year in years:
    index = GetPart(year)
    r = years[0] + part_size * index, min(years[years.size - 1], years[0] + part_size * (index + 1))
    parts[index] = str(r[0]) + '-' + str(r[1])

dataframe_parts = []
dataframes = []
for year in years:
    dataset = datalist.format(year=year)
    dataframe = pd.read_csv(dataset, names=['name', 'sex', 'count'])
    dataframe_parts.append(dataframe.assign(years=parts[GetPart(year)]))
    dataframes.append(dataframe.assign(year=year))
    
result_parts = pd.concat(dataframe_parts)
result = pd.concat(dataframes)

result_parts_sums = result_parts.groupby(['years', 'sex', 'name'], as_index=False).sum()
result_parts_names = result_parts_sums.iloc[result_parts_sums.groupby(['years', 'sex'], as_index=False).apply(lambda x: x['count'].idxmax())]
result_sums = result.groupby(['year', 'sex', 'name'], as_index=False).sum()

for groupName, groupLabels in result_parts_names.groupby(['name', 'sex']).groups.items():
    group = result_sums.groupby(['name', 'sex']).get_group(groupName)
    fig, ax = plt.subplots(1, 1, figsize=(18,10))

    ax.set_xlabel('╨У╨╛╨┤╨░')
    ax.set_ylabel('╨а╨╛╨╢╨┤╨░╨╡╨╝╨╛╤Б╤В╤М')
    label = group['name']
    ax.plot(group['year'], group['count'], label=label.aggregate(np.max), color='b', ls='-')
    ax.legend(loc=9, fontsize=11)

    plt.show()

рдкрд╛рдпрдерди рдореЗрдВ рдЧреНрд░реБрдкрд┐рдВрдЧ рдФрд░ рдбреЗрдЯрд╛ рд╡рд┐рдЬрд╝реБрдЕрд▓рд╛рдЗрдЬрд╝реЗрд╢рди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рдХреМрд╢рд▓ рдкрд░ рдХрд╛рдо рдХрд░рдирд╛

рдкрд╛рдпрдерди рдореЗрдВ рдЧреНрд░реБрдкрд┐рдВрдЧ рдФрд░ рдбреЗрдЯрд╛ рд╡рд┐рдЬрд╝реБрдЕрд▓рд╛рдЗрдЬрд╝реЗрд╢рди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рдХреМрд╢рд▓ рдкрд░ рдХрд╛рдо рдХрд░рдирд╛

рдкрд╛рдпрдерди рдореЗрдВ рдЧреНрд░реБрдкрд┐рдВрдЧ рдФрд░ рдбреЗрдЯрд╛ рд╡рд┐рдЬрд╝реБрдЕрд▓рд╛рдЗрдЬрд╝реЗрд╢рди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рдХреМрд╢рд▓ рдкрд░ рдХрд╛рдо рдХрд░рдирд╛

рдкрд╛рдпрдерди рдореЗрдВ рдЧреНрд░реБрдкрд┐рдВрдЧ рдФрд░ рдбреЗрдЯрд╛ рд╡рд┐рдЬрд╝реБрдЕрд▓рд╛рдЗрдЬрд╝реЗрд╢рди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рдХреМрд╢рд▓ рдкрд░ рдХрд╛рдо рдХрд░рдирд╛

рдкрд╛рдпрдерди рдореЗрдВ рдЧреНрд░реБрдкрд┐рдВрдЧ рдФрд░ рдбреЗрдЯрд╛ рд╡рд┐рдЬрд╝реБрдЕрд▓рд╛рдЗрдЬрд╝реЗрд╢рди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рдХреМрд╢рд▓ рдкрд░ рдХрд╛рдо рдХрд░рдирд╛

рдкрд╛рдпрдерди рдореЗрдВ рдЧреНрд░реБрдкрд┐рдВрдЧ рдФрд░ рдбреЗрдЯрд╛ рд╡рд┐рдЬрд╝реБрдЕрд▓рд╛рдЗрдЬрд╝реЗрд╢рди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рдХреМрд╢рд▓ рдкрд░ рдХрд╛рдо рдХрд░рдирд╛

рдкрд╛рдпрдерди рдореЗрдВ рдЧреНрд░реБрдкрд┐рдВрдЧ рдФрд░ рдбреЗрдЯрд╛ рд╡рд┐рдЬрд╝реБрдЕрд▓рд╛рдЗрдЬрд╝реЗрд╢рди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рдХреМрд╢рд▓ рдкрд░ рдХрд╛рдо рдХрд░рдирд╛

рдкрд╛рдпрдерди рдореЗрдВ рдЧреНрд░реБрдкрд┐рдВрдЧ рдФрд░ рдбреЗрдЯрд╛ рд╡рд┐рдЬрд╝реБрдЕрд▓рд╛рдЗрдЬрд╝реЗрд╢рди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рдХреМрд╢рд▓ рдкрд░ рдХрд╛рдо рдХрд░рдирд╛

рдкрд╛рдпрдерди рдореЗрдВ рдЧреНрд░реБрдкрд┐рдВрдЧ рдФрд░ рдбреЗрдЯрд╛ рд╡рд┐рдЬрд╝реБрдЕрд▓рд╛рдЗрдЬрд╝реЗрд╢рди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рдХреМрд╢рд▓ рдкрд░ рдХрд╛рдо рдХрд░рдирд╛

рдкрд╛рдпрдерди рдореЗрдВ рдЧреНрд░реБрдкрд┐рдВрдЧ рдФрд░ рдбреЗрдЯрд╛ рд╡рд┐рдЬрд╝реБрдЕрд▓рд╛рдЗрдЬрд╝реЗрд╢рди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рдХреМрд╢рд▓ рдкрд░ рдХрд╛рдо рдХрд░рдирд╛

рдкреНрд░рддреНрдпреЗрдХ рд╡рд░реНрд╖ рдХреЗ рд▓рд┐рдП, рд╣рдо рдЧрдгрдирд╛ рдХрд░рддреЗ рд╣реИрдВ рдХрд┐ рдХрд┐рддрдиреЗ рдирд╛рдо 50% рд▓реЛрдЧреЛрдВ рдХреЛ рдХрд╡рд░ рдХрд░рддреЗ рд╣реИрдВ рдФрд░ рдЗрд╕ рдбреЗрдЯрд╛ рдХреА рдХрд▓реНрдкрдирд╛ рдХрд░рддреЗ рд╣реИрдВ:

dataframe = pd.DataFrame({'year': [], 'count': []})
years = np.arange(1880, 2011)
for year in years:
    dataset = datalist.format(year=year)
    csv = pd.read_csv(dataset, names=['name', 'sex', 'count'])
    names = csv.groupby('name', as_index=False).aggregate(np.sum)
    names['sum'] = names.sum()['count']
    names['percent'] = names['count'] / names['sum'] * 100
    names = names.sort_values(['percent'], ascending=False)
    names['cum_perc'] = names['percent'].cumsum()
    names_filtered = names[names['cum_perc'] <= 50]
    dataframe = dataframe.append(pd.DataFrame({'year': [year], 'count': [names_filtered.shape[0]]}))

fig, ax1 = plt.subplots(1, 1, figsize=(22,13))
ax1.set_xlabel('╨У╨╛╨┤╨░', fontsize = 12)
ax1.set_ylabel('╨а╨░╨╖╨╜╨╛╨╛╨▒╤А╨░╨╖╨╕╨╡ ╨╕╨╝╨╡╨╜', fontsize = 12)
ax1.plot(dataframe['year'], dataframe['count'], color='r', ls='-')
ax1.legend(loc=9, fontsize=12)

plt.show()

рдкрд╛рдпрдерди рдореЗрдВ рдЧреНрд░реБрдкрд┐рдВрдЧ рдФрд░ рдбреЗрдЯрд╛ рд╡рд┐рдЬрд╝реБрдЕрд▓рд╛рдЗрдЬрд╝реЗрд╢рди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рдХреМрд╢рд▓ рдкрд░ рдХрд╛рдо рдХрд░рдирд╛

рдЖрдЗрдП рд╕рдВрдкреВрд░реНрдг рдЕрдВрддрд░рд╛рд▓ рд╕реЗ 4 рд╡рд░реНрд╖ рдЪреБрдиреЗрдВ рдФрд░ рдкреНрд░рддреНрдпреЗрдХ рд╡рд░реНрд╖ рдХреЗ рд▓рд┐рдП рдирд╛рдо рдХреЗ рдкрд╣рд▓реЗ рдЕрдХреНрд╖рд░ рдФрд░ рдирд╛рдо рдХреЗ рдЕрдВрддрд┐рдо рдЕрдХреНрд╖рд░ рджреНрд╡рд╛рд░рд╛ рд╡рд┐рддрд░рдг рдкреНрд░рджрд░реНрд╢рд┐рдд рдХрд░реЗрдВ:

from string import ascii_lowercase, ascii_uppercase

fig_first, ax_first = plt.subplots(1, 1, figsize=(14,10))
fig_last, ax_last = plt.subplots(1, 1, figsize=(14,10))

index = np.arange(len(ascii_uppercase))
years = [1944, 1978, 1991, 2003]
colors = ['r', 'g', 'b', 'y']
n = 0
for year in years:
    dataset = datalist.format(year=year)
    csv = pd.read_csv(dataset, names=['name', 'sex', 'count'])
    names = csv.groupby('name', as_index=False).aggregate(np.sum)
    count = names.shape[0]

    dataframe = pd.DataFrame({'letter': [], 'frequency_first': [], 'frequency_last': []})
    for letter in ascii_uppercase:
        countFirst = (names[names.name.str.startswith(letter)].count()['count'])
        countLast = (names[names.name.str.endswith(letter.lower())].count()['count'])

        dataframe = dataframe.append(pd.DataFrame({
            'letter': [letter],
            'frequency_first': [countFirst / count * 100],
            'frequency_last': [countLast / count * 100]}))

    ax_first.bar(index + 0.3 * n, dataframe['frequency_first'], 0.3, alpha=0.5, color=colors[n], label=year)
    ax_last.bar(index + bar_width * n, dataframe['frequency_last'], 0.3, alpha=0.5, color=colors[n], label=year)
    n += 1

ax_first.set_xlabel('╨С╤Г╨║╨▓╨░ ╨░╨╗╤Д╨░╨▓╨╕╤В╨░')
ax_first.set_ylabel('╨з╨░╤Б╤В╨╛╤В╨░, %')
ax_first.set_title('╨Я╨╡╤А╨▓╨░╤П ╨▒╤Г╨║╨▓╨░ ╨▓ ╨╕╨╝╨╡╨╜╨╕')
ax_first.set_xticks(index)
ax_first.set_xticklabels(ascii_uppercase)
ax_first.legend()

ax_last.set_xlabel('╨С╤Г╨║╨▓╨░ ╨░╨╗╤Д╨░╨▓╨╕╤В╨░')
ax_last.set_ylabel('╨з╨░╤Б╤В╨╛╤В╨░, %')
ax_last.set_title('╨Я╨╛╤Б╨╗╨╡╨┤╨╜╤П╤П ╨▒╤Г╨║╨▓╨░ ╨▓ ╨╕╨╝╨╡╨╜╨╕')
ax_last.set_xticks(index)
ax_last.set_xticklabels(ascii_uppercase)
ax_last.legend()

fig_first.tight_layout()
fig_last.tight_layout()

plt.show()

рдкрд╛рдпрдерди рдореЗрдВ рдЧреНрд░реБрдкрд┐рдВрдЧ рдФрд░ рдбреЗрдЯрд╛ рд╡рд┐рдЬрд╝реБрдЕрд▓рд╛рдЗрдЬрд╝реЗрд╢рди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рдХреМрд╢рд▓ рдкрд░ рдХрд╛рдо рдХрд░рдирд╛

рдкрд╛рдпрдерди рдореЗрдВ рдЧреНрд░реБрдкрд┐рдВрдЧ рдФрд░ рдбреЗрдЯрд╛ рд╡рд┐рдЬрд╝реБрдЕрд▓рд╛рдЗрдЬрд╝реЗрд╢рди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рдХреМрд╢рд▓ рдкрд░ рдХрд╛рдо рдХрд░рдирд╛

рдЖрдЗрдП рдХрдИ рдкреНрд░рд╕рд┐рджреНрдз рд▓реЛрдЧреЛрдВ (рд░рд╛рд╖реНрдЯреНрд░рдкрддрд┐, рдЧрд╛рдпрдХ, рдЕрднрд┐рдиреЗрддрд╛, рдлрд┐рд▓реНрдо рдкрд╛рддреНрд░) рдХреА рдПрдХ рд╕реВрдЪреА рдмрдирд╛рдПрдВ рдФрд░ рдирд╛рдореЛрдВ рдХреА рдЧрддрд┐рд╢реАрд▓рддрд╛ рдкрд░ рдЙрдирдХреЗ рдкреНрд░рднрд╛рд╡ рдХрд╛ рдореВрд▓реНрдпрд╛рдВрдХрди рдХрд░реЗрдВ:

celebrities = {'Frank': 'M', 'Britney': 'F', 'Madonna': 'F', 'Bob': 'M'}
dataframes = []
for year in years:
    dataset = datalist.format(year=year)
    dataframe = pd.read_csv(dataset, names=['name', 'sex', 'count'])
    dataframes.append(dataframe.assign(year=year))

result = pd.concat(dataframes)

for celebrity, sex in celebrities.items():
    names = result[result.name == celebrity]
    dataframe = names[names.sex == sex]
    fig, ax = plt.subplots(1, 1, figsize=(16,8))

    ax.set_xlabel('╨У╨╛╨┤╨░', fontsize = 10)
    ax.set_ylabel('╨а╨╛╨╢╨┤╨░╨╡╨╝╨╛╤Б╤В╤М', fontsize = 10)
    ax.plot(dataframe['year'], dataframe['count'], label=celebrity, color='r', ls='-')
    ax.legend(loc=9, fontsize=12)
        
    plt.show()

рдкрд╛рдпрдерди рдореЗрдВ рдЧреНрд░реБрдкрд┐рдВрдЧ рдФрд░ рдбреЗрдЯрд╛ рд╡рд┐рдЬрд╝реБрдЕрд▓рд╛рдЗрдЬрд╝реЗрд╢рди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рдХреМрд╢рд▓ рдкрд░ рдХрд╛рдо рдХрд░рдирд╛

рдкрд╛рдпрдерди рдореЗрдВ рдЧреНрд░реБрдкрд┐рдВрдЧ рдФрд░ рдбреЗрдЯрд╛ рд╡рд┐рдЬрд╝реБрдЕрд▓рд╛рдЗрдЬрд╝реЗрд╢рди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рдХреМрд╢рд▓ рдкрд░ рдХрд╛рдо рдХрд░рдирд╛

рдкрд╛рдпрдерди рдореЗрдВ рдЧреНрд░реБрдкрд┐рдВрдЧ рдФрд░ рдбреЗрдЯрд╛ рд╡рд┐рдЬрд╝реБрдЕрд▓рд╛рдЗрдЬрд╝реЗрд╢рди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рдХреМрд╢рд▓ рдкрд░ рдХрд╛рдо рдХрд░рдирд╛

рдкрд╛рдпрдерди рдореЗрдВ рдЧреНрд░реБрдкрд┐рдВрдЧ рдФрд░ рдбреЗрдЯрд╛ рд╡рд┐рдЬрд╝реБрдЕрд▓рд╛рдЗрдЬрд╝реЗрд╢рди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рдХреМрд╢рд▓ рдкрд░ рдХрд╛рдо рдХрд░рдирд╛

рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдХреЗ рд▓рд┐рдП, рдЖрдк рдирд╛рдореЛрдВ рдХреА рдЧрддрд┐рд╢реАрд▓рддрд╛ рдкрд░ рдЙрдирдХреЗ рдкреНрд░рднрд╛рд╡ рдХрд╛ рд╕реНрдкрд╖реНрдЯ рд░реВрдк рд╕реЗ рдЖрдХрд▓рди рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЕрдВрддрд┐рдо рдЙрджрд╛рд╣рд░рдг рд╕реЗ рд╡рд┐рдЬрд╝реБрдЕрд▓рд╛рдЗрдЬрд╝реЗрд╢рди рдореЗрдВ рд╕реЗрд▓рд┐рдмреНрд░рд┐рдЯреА рдХреЗ рдЬреАрд╡рди рдХрд╛рд▓ рдХреЛ рдЬреЛрдбрд╝ рд╕рдХрддреЗ рд╣реИрдВред

рдЗрд╕рд╕реЗ рд╣рдорд╛рд░реЗ рд╕рднреА рд▓рдХреНрд╖реНрдп рдкреНрд░рд╛рдкреНрдд рдПрд╡рдВ рдкреВрд░реНрдг рд╣реЛ рдЧрдпреЗред рд╣рдордиреЗ рдкрд╛рдпрдерди рдореЗрдВ рдбреЗрдЯрд╛ рдХреЛ рд╕рдореВрд╣реАрдХреГрдд рдХрд░рдиреЗ рдФрд░ рд╡рд┐рдЬрд╝реБрдЕрд▓рд╛рдЗрдЬрд╝ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЯреВрд▓ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХрд╛ рдХреМрд╢рд▓ рд╡рд┐рдХрд╕рд┐рдд рдХрд┐рдпрд╛ рд╣реИ, рдФрд░ рд╣рдо рдбреЗрдЯрд╛ рдХреЗ рд╕рд╛рде рдХрд╛рдо рдХрд░рдирд╛ рдЬрд╛рд░реА рд░рдЦреЗрдВрдЧреЗред рд╣рд░ рдХреЛрдИ рд╕реНрд╡рдпрдВ рддреИрдпрд╛рд░, рд╡рд┐рдЬрд╝реБрдЕрд▓рд╛рдЗрдЬрд╝ рдХрд┐рдП рдЧрдП рдбреЗрдЯрд╛ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рдирд┐рд╖реНрдХрд░реНрд╖ рдирд┐рдХрд╛рд▓ рд╕рдХрддрд╛ рд╣реИред

рд╕рднреА рдХреЛ рдЬреНрдЮрд╛рди!

рд╕реНрд░реЛрдд: www.habr.com

рдПрдХ рдЯрд┐рдкреНрдкрдгреА рдЬреЛрдбрд╝реЗрдВ