Π Π°Π±ΠΎΡ‚Π° Π½Π° Π²Π΅ΡˆΡ‚ΠΈΠ½Π°Ρ‚Π° Π·Π° ΠΊΠΎΡ€ΠΈΡΡ‚Π΅ΡšΠ΅ Π½Π° Π³Ρ€ΡƒΠΏΠΈΡ€Π°ΡšΠ΅ ΠΈ Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·Π°Ρ†ΠΈΡ˜Π° Π½Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ Π²ΠΎ Python

Π Π°Π±ΠΎΡ‚Π° Π½Π° Π²Π΅ΡˆΡ‚ΠΈΠ½Π°Ρ‚Π° Π·Π° ΠΊΠΎΡ€ΠΈΡΡ‚Π΅ΡšΠ΅ Π½Π° Π³Ρ€ΡƒΠΏΠΈΡ€Π°ΡšΠ΅ ΠΈ Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·Π°Ρ†ΠΈΡ˜Π° Π½Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ Π²ΠΎ Python

Π•Ρ˜ Π₯Π°Π±Ρ€!

ДСнСска ќС Ρ€Π°Π±ΠΎΡ‚ΠΈΠΌΠ΅ Π½Π° Π²Π΅ΡˆΡ‚ΠΈΠ½Π°Ρ‚Π° Π·Π° ΠΊΠΎΡ€ΠΈΡΡ‚Π΅ΡšΠ΅ Π°Π»Π°Ρ‚ΠΊΠΈ Π·Π° Π³Ρ€ΡƒΠΏΠΈΡ€Π°ΡšΠ΅ ΠΈ Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·Π°Ρ†ΠΈΡ˜Π° Π½Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ Π²ΠΎ Python. Π’ΠΎ ΠΏΡ€Π΅Π΄Π²ΠΈΠ΄Π΅Π½ΠΈΡ‚Π΅ Π±Π°Π·Π° Π½Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ Π½Π° Github АјдС Π΄Π° Π°Π½Π°Π»ΠΈΠ·ΠΈΡ€Π°ΠΌΠ΅ Π½Π΅ΠΊΠΎΠ»ΠΊΡƒ карактСристики ΠΈ Π΄Π° ΠΈΠ·Π³Ρ€Π°Π΄ΠΈΠΌΠ΅ сСт Π½Π° Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ.

Π‘ΠΏΠΎΡ€Π΅Π΄ Ρ‚Ρ€Π°Π΄ΠΈΡ†ΠΈΡ˜Π°Ρ‚Π°, Π½Π° ΠΏΠΎΡ‡Π΅Ρ‚ΠΎΠΊΠΎΡ‚, Π΄Π° Π³ΠΈ Π΄Π΅Ρ„ΠΈΠ½ΠΈΡ€Π°ΠΌΠ΅ Ρ†Π΅Π»ΠΈΡ‚Π΅:

  • Π“Ρ€ΡƒΠΏΠΈΡ€Π°Ρ˜Ρ‚Π΅ ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ ΠΏΠΎ ΠΏΠΎΠ» ΠΈ Π³ΠΎΠ΄ΠΈΠ½Π° ΠΈ Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·ΠΈΡ€Π°Ρ˜Ρ‚Π΅ ја Ρ†Π΅Π»ΠΎΠΊΡƒΠΏΠ½Π°Ρ‚Π° Π΄ΠΈΠ½Π°ΠΌΠΈΠΊΠ° Π½Π° Π½Π°Ρ‚Π°Π»ΠΈΡ‚Π΅Ρ‚ΠΎΡ‚ кај Π΄Π²Π°Ρ‚Π° ΠΏΠΎΠ»Π°;
  • ΠΠ°Ρ˜Π΄Π΅Ρ‚Π΅ Π³ΠΈ Π½Π°Ρ˜ΠΏΠΎΠΏΡƒΠ»Π°Ρ€Π½ΠΈΡ‚Π΅ имиња Π½Π° ситС Π²Ρ€Π΅ΠΌΠΈΡšΠ°;
  • ΠŸΠΎΠ΄Π΅Π»Π΅Ρ‚Π΅ Π³ΠΎ Ρ†Π΅Π»ΠΈΠΎΡ‚ врСмСнски ΠΏΠ΅Ρ€ΠΈΠΎΠ΄ Π²ΠΎ ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈΡ‚Π΅ Π½Π° 10 Π΄Π΅Π»Π° ΠΈ Π·Π° сСкој Π½Π°Ρ˜Π΄Π΅Ρ‚Π΅ Π³ΠΎ Π½Π°Ρ˜ΠΏΠΎΠΏΡƒΠ»Π°Ρ€Π½ΠΎΡ‚ΠΎ ΠΈΠΌΠ΅ ΠΎΠ΄ сСкој ΠΏΠΎΠ». Π—Π° сСкоС ΠΏΡ€ΠΎΠ½Π°Ρ˜Π΄Π΅Π½ΠΎ ΠΈΠΌΠ΅, Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·ΠΈΡ€Π°Ρ˜Ρ‚Π΅ ја Π½Π΅Π³ΠΎΠ²Π°Ρ‚Π° Π΄ΠΈΠ½Π°ΠΌΠΈΠΊΠ° Π²ΠΎ сСкоС Π²Ρ€Π΅ΠΌΠ΅;
  • Π—Π° сСкоја Π³ΠΎΠ΄ΠΈΠ½Π°, ΠΏΡ€Π΅ΡΠΌΠ΅Ρ‚Π°Ρ˜Ρ‚Π΅ ΠΊΠΎΠ»ΠΊΡƒ имиња ΠΎΠΏΡ„Π°ΡœΠ°Π°Ρ‚ 50% ΠΎΠ΄ Π»ΡƒΡ“Π΅Ρ‚ΠΎ ΠΈ Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·ΠΈΡ€Π°Ρ˜Ρ‚Π΅ (ќС ја Π²ΠΈΠ΄ΠΈΠΌΠ΅ разновидноста Π½Π° ΠΈΠΌΠΈΡšΠ°Ρ‚Π° Π·Π° сСкоја Π³ΠΎΠ΄ΠΈΠ½Π°);
  • Π˜Π·Π±Π΅Ρ€Π΅Ρ‚Π΅ 4 Π³ΠΎΠ΄ΠΈΠ½ΠΈ ΠΎΠ΄ Ρ†Π΅Π»ΠΈΠΎΡ‚ ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π» ΠΈ ΠΏΡ€ΠΈΠΊΠ°ΠΆΠ΅Ρ‚Π΅ ја распрСдСлбата Π·Π° сСкоја Π³ΠΎΠ΄ΠΈΠ½Π° ΠΏΠΎ ΠΏΡ€Π²Π°Ρ‚Π° Π±ΡƒΠΊΠ²Π° Π²ΠΎ ΠΈΠΌΠ΅Ρ‚ΠΎ ΠΈ ΠΏΠΎ послСдната Π±ΡƒΠΊΠ²Π° Π²ΠΎ ΠΈΠΌΠ΅Ρ‚ΠΎ;
  • НаправСтС список Π½Π° Π½Π΅ΠΊΠΎΠ»ΠΊΡƒ ΠΏΠΎΠ·Π½Π°Ρ‚ΠΈ личности (прСтсСдатСли, ΠΏΠ΅Ρ˜Π°Ρ‡ΠΈ, Π°ΠΊΡ‚Π΅Ρ€ΠΈ, филмски Π»ΠΈΠΊΠΎΠ²ΠΈ) ΠΈ ΠΏΡ€ΠΎΡ†Π΅Π½Π΅Ρ‚Π΅ Π³ΠΎ Π½ΠΈΠ²Π½ΠΎΡ‚ΠΎ влијаниС Π²Ρ€Π· Π΄ΠΈΠ½Π°ΠΌΠΈΠΊΠ°Ρ‚Π° Π½Π° ΠΈΠΌΠΈΡšΠ°Ρ‚Π°. Π˜Π·Π³Ρ€Π°Π΄Π΅Ρ‚Π΅ Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·Π°Ρ†ΠΈΡ˜Π°.

ΠŸΠΎΠΌΠ°Π»ΠΊΡƒ Π·Π±ΠΎΡ€ΠΎΠ²ΠΈ, повСќС ΠΊΠΎΠ΄!

И, ајдС да одимС.

Π”Π° Π³ΠΈ Π³Ρ€ΡƒΠΏΠΈΡ€Π°ΠΌΠ΅ ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈΡ‚Π΅ ΠΏΠΎ ΠΏΠΎΠ» ΠΈ Π³ΠΎΠ΄ΠΈΠ½Π° ΠΈ Π΄Π° ја Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·ΠΈΡ€Π°ΠΌΠ΅ сСвкупната Π΄ΠΈΠ½Π°ΠΌΠΈΠΊΠ° Π½Π° Π½Π°Ρ‚Π°Π»ΠΈΡ‚Π΅Ρ‚ΠΎΡ‚ кај Π΄Π²Π°Ρ‚Π° ΠΏΠΎΠ»Π°:

import numpy as np
import pandas as pd 
import matplotlib.pyplot as plt

years = np.arange(1880, 2011, 3)
datalist = 'https://raw.githubusercontent.com/wesm/pydata-book/2nd-edition/datasets/babynames/yob{year}.txt'
dataframes = []
for year in years:
    dataset = datalist.format(year=year)
    dataframe = pd.read_csv(dataset, names=['name', 'sex', 'count'])
    dataframes.append(dataframe.assign(year=year))

result = pd.concat(dataframes)
sex = result.groupby('sex')
births_men = sex.get_group('M').groupby('year', as_index=False)
births_women = sex.get_group('F').groupby('year', as_index=False)
births_men_list = births_men.aggregate(np.sum)['count'].tolist()
births_women_list = births_women.aggregate(np.sum)['count'].tolist()

fig, ax = plt.subplots()
fig.set_size_inches(25,15)

index = np.arange(len(years))
stolb1 = ax.bar(index, births_men_list, 0.4, color='c', label='ΠœΡƒΠΆΡ‡ΠΈΠ½Ρ‹')
stolb2 = ax.bar(index + 0.4, births_women_list, 0.4, alpha=0.8, color='r', label='Π–Π΅Π½Ρ‰ΠΈΠ½Ρ‹')

ax.set_title('Π ΠΎΠΆΠ΄Π°Π΅ΠΌΠΎΡΡ‚ΡŒ ΠΏΠΎ ΠΏΠΎΠ»Ρƒ ΠΈ Π³ΠΎΠ΄Π°ΠΌ')
ax.set_xlabel('Π“ΠΎΠ΄Π°')
ax.set_ylabel('Π ΠΎΠΆΠ΄Π°Π΅ΠΌΠΎΡΡ‚ΡŒ')
ax.set_xticklabels(years)
ax.set_xticks(index + 0.4)
ax.legend(loc=9)

fig.tight_layout()
plt.show()

Π Π°Π±ΠΎΡ‚Π° Π½Π° Π²Π΅ΡˆΡ‚ΠΈΠ½Π°Ρ‚Π° Π·Π° ΠΊΠΎΡ€ΠΈΡΡ‚Π΅ΡšΠ΅ Π½Π° Π³Ρ€ΡƒΠΏΠΈΡ€Π°ΡšΠ΅ ΠΈ Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·Π°Ρ†ΠΈΡ˜Π° Π½Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ Π²ΠΎ Python

АјдС Π΄Π° Π³ΠΈ најдСмС Π½Π°Ρ˜ΠΏΠΎΠΏΡƒΠ»Π°Ρ€Π½ΠΈΡ‚Π΅ имиња Π²ΠΎ ΠΈΡΡ‚ΠΎΡ€ΠΈΡ˜Π°Ρ‚Π°:

years = np.arange(1880, 2011)

dataframes = []
for year in years:
    dataset = datalist.format(year=year)
    dataframe = pd.read_csv(dataset, names=['name', 'sex', 'count'])
    dataframes.append(dataframe)

result = pd.concat(dataframes)
names = result.groupby('name', as_index=False).sum().sort_values('count', ascending=False)
names.head(10)

Π Π°Π±ΠΎΡ‚Π° Π½Π° Π²Π΅ΡˆΡ‚ΠΈΠ½Π°Ρ‚Π° Π·Π° ΠΊΠΎΡ€ΠΈΡΡ‚Π΅ΡšΠ΅ Π½Π° Π³Ρ€ΡƒΠΏΠΈΡ€Π°ΡšΠ΅ ΠΈ Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·Π°Ρ†ΠΈΡ˜Π° Π½Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ Π²ΠΎ Python

АјдС Π΄Π° Π³ΠΎ ΠΏΠΎΠ΄Π΅Π»ΠΈΠΌΠ΅ Ρ†Π΅Π»ΠΈΠΎΡ‚ врСмСнски ΠΏΠ΅Ρ€ΠΈΠΎΠ΄ Π²ΠΎ ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈΡ‚Π΅ Π½Π° 10 Π΄Π΅Π»Π° ΠΈ Π·Π° сСкој ќС Π³ΠΎ најдСмС Π½Π°Ρ˜ΠΏΠΎΠΏΡƒΠ»Π°Ρ€Π½ΠΎΡ‚ΠΎ ΠΈΠΌΠ΅ ΠΎΠ΄ сСкој ΠΏΠΎΠ». Π—Π° сСкоС ΠΏΡ€ΠΎΠ½Π°Ρ˜Π΄Π΅Π½ΠΎ ΠΈΠΌΠ΅, ја Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·ΠΈΡ€Π°ΠΌΠ΅ Π½Π΅Π³ΠΎΠ²Π°Ρ‚Π° Π΄ΠΈΠ½Π°ΠΌΠΈΠΊΠ° Π²ΠΎ сСкоС Π²Ρ€Π΅ΠΌΠ΅:

years = np.arange(1880, 2011)
part_size = int((years[years.size - 1] - years[0]) / 10) + 1
parts = {}
def GetPart(year):
    return int((year - years[0]) / part_size)
for year in years:
    index = GetPart(year)
    r = years[0] + part_size * index, min(years[years.size - 1], years[0] + part_size * (index + 1))
    parts[index] = str(r[0]) + '-' + str(r[1])

dataframe_parts = []
dataframes = []
for year in years:
    dataset = datalist.format(year=year)
    dataframe = pd.read_csv(dataset, names=['name', 'sex', 'count'])
    dataframe_parts.append(dataframe.assign(years=parts[GetPart(year)]))
    dataframes.append(dataframe.assign(year=year))
    
result_parts = pd.concat(dataframe_parts)
result = pd.concat(dataframes)

result_parts_sums = result_parts.groupby(['years', 'sex', 'name'], as_index=False).sum()
result_parts_names = result_parts_sums.iloc[result_parts_sums.groupby(['years', 'sex'], as_index=False).apply(lambda x: x['count'].idxmax())]
result_sums = result.groupby(['year', 'sex', 'name'], as_index=False).sum()

for groupName, groupLabels in result_parts_names.groupby(['name', 'sex']).groups.items():
    group = result_sums.groupby(['name', 'sex']).get_group(groupName)
    fig, ax = plt.subplots(1, 1, figsize=(18,10))

    ax.set_xlabel('Π“ΠΎΠ΄Π°')
    ax.set_ylabel('Π ΠΎΠΆΠ΄Π°Π΅ΠΌΠΎΡΡ‚ΡŒ')
    label = group['name']
    ax.plot(group['year'], group['count'], label=label.aggregate(np.max), color='b', ls='-')
    ax.legend(loc=9, fontsize=11)

    plt.show()

Π Π°Π±ΠΎΡ‚Π° Π½Π° Π²Π΅ΡˆΡ‚ΠΈΠ½Π°Ρ‚Π° Π·Π° ΠΊΠΎΡ€ΠΈΡΡ‚Π΅ΡšΠ΅ Π½Π° Π³Ρ€ΡƒΠΏΠΈΡ€Π°ΡšΠ΅ ΠΈ Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·Π°Ρ†ΠΈΡ˜Π° Π½Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ Π²ΠΎ Python

Π Π°Π±ΠΎΡ‚Π° Π½Π° Π²Π΅ΡˆΡ‚ΠΈΠ½Π°Ρ‚Π° Π·Π° ΠΊΠΎΡ€ΠΈΡΡ‚Π΅ΡšΠ΅ Π½Π° Π³Ρ€ΡƒΠΏΠΈΡ€Π°ΡšΠ΅ ΠΈ Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·Π°Ρ†ΠΈΡ˜Π° Π½Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ Π²ΠΎ Python

Π Π°Π±ΠΎΡ‚Π° Π½Π° Π²Π΅ΡˆΡ‚ΠΈΠ½Π°Ρ‚Π° Π·Π° ΠΊΠΎΡ€ΠΈΡΡ‚Π΅ΡšΠ΅ Π½Π° Π³Ρ€ΡƒΠΏΠΈΡ€Π°ΡšΠ΅ ΠΈ Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·Π°Ρ†ΠΈΡ˜Π° Π½Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ Π²ΠΎ Python

Π Π°Π±ΠΎΡ‚Π° Π½Π° Π²Π΅ΡˆΡ‚ΠΈΠ½Π°Ρ‚Π° Π·Π° ΠΊΠΎΡ€ΠΈΡΡ‚Π΅ΡšΠ΅ Π½Π° Π³Ρ€ΡƒΠΏΠΈΡ€Π°ΡšΠ΅ ΠΈ Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·Π°Ρ†ΠΈΡ˜Π° Π½Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ Π²ΠΎ Python

Π Π°Π±ΠΎΡ‚Π° Π½Π° Π²Π΅ΡˆΡ‚ΠΈΠ½Π°Ρ‚Π° Π·Π° ΠΊΠΎΡ€ΠΈΡΡ‚Π΅ΡšΠ΅ Π½Π° Π³Ρ€ΡƒΠΏΠΈΡ€Π°ΡšΠ΅ ΠΈ Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·Π°Ρ†ΠΈΡ˜Π° Π½Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ Π²ΠΎ Python

Π Π°Π±ΠΎΡ‚Π° Π½Π° Π²Π΅ΡˆΡ‚ΠΈΠ½Π°Ρ‚Π° Π·Π° ΠΊΠΎΡ€ΠΈΡΡ‚Π΅ΡšΠ΅ Π½Π° Π³Ρ€ΡƒΠΏΠΈΡ€Π°ΡšΠ΅ ΠΈ Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·Π°Ρ†ΠΈΡ˜Π° Π½Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ Π²ΠΎ Python

Π Π°Π±ΠΎΡ‚Π° Π½Π° Π²Π΅ΡˆΡ‚ΠΈΠ½Π°Ρ‚Π° Π·Π° ΠΊΠΎΡ€ΠΈΡΡ‚Π΅ΡšΠ΅ Π½Π° Π³Ρ€ΡƒΠΏΠΈΡ€Π°ΡšΠ΅ ΠΈ Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·Π°Ρ†ΠΈΡ˜Π° Π½Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ Π²ΠΎ Python

Π Π°Π±ΠΎΡ‚Π° Π½Π° Π²Π΅ΡˆΡ‚ΠΈΠ½Π°Ρ‚Π° Π·Π° ΠΊΠΎΡ€ΠΈΡΡ‚Π΅ΡšΠ΅ Π½Π° Π³Ρ€ΡƒΠΏΠΈΡ€Π°ΡšΠ΅ ΠΈ Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·Π°Ρ†ΠΈΡ˜Π° Π½Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ Π²ΠΎ Python

Π Π°Π±ΠΎΡ‚Π° Π½Π° Π²Π΅ΡˆΡ‚ΠΈΠ½Π°Ρ‚Π° Π·Π° ΠΊΠΎΡ€ΠΈΡΡ‚Π΅ΡšΠ΅ Π½Π° Π³Ρ€ΡƒΠΏΠΈΡ€Π°ΡšΠ΅ ΠΈ Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·Π°Ρ†ΠΈΡ˜Π° Π½Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ Π²ΠΎ Python

Π Π°Π±ΠΎΡ‚Π° Π½Π° Π²Π΅ΡˆΡ‚ΠΈΠ½Π°Ρ‚Π° Π·Π° ΠΊΠΎΡ€ΠΈΡΡ‚Π΅ΡšΠ΅ Π½Π° Π³Ρ€ΡƒΠΏΠΈΡ€Π°ΡšΠ΅ ΠΈ Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·Π°Ρ†ΠΈΡ˜Π° Π½Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ Π²ΠΎ Python

Π—Π° сСкоја Π³ΠΎΠ΄ΠΈΠ½Π°, прСсмСтувамС ΠΊΠΎΠ»ΠΊΡƒ имиња ΠΏΠΎΠΊΡ€ΠΈΠ²Π°Π°Ρ‚ 50% ΠΎΠ΄ Π»ΡƒΡ“Π΅Ρ‚ΠΎ ΠΈ Π³ΠΈ Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·ΠΈΡ€Π°ΠΌΠ΅ ΠΎΠ²ΠΈΠ΅ ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ:

dataframe = pd.DataFrame({'year': [], 'count': []})
years = np.arange(1880, 2011)
for year in years:
    dataset = datalist.format(year=year)
    csv = pd.read_csv(dataset, names=['name', 'sex', 'count'])
    names = csv.groupby('name', as_index=False).aggregate(np.sum)
    names['sum'] = names.sum()['count']
    names['percent'] = names['count'] / names['sum'] * 100
    names = names.sort_values(['percent'], ascending=False)
    names['cum_perc'] = names['percent'].cumsum()
    names_filtered = names[names['cum_perc'] <= 50]
    dataframe = dataframe.append(pd.DataFrame({'year': [year], 'count': [names_filtered.shape[0]]}))

fig, ax1 = plt.subplots(1, 1, figsize=(22,13))
ax1.set_xlabel('Π“ΠΎΠ΄Π°', fontsize = 12)
ax1.set_ylabel('Π Π°Π·Π½ΠΎΠΎΠ±Ρ€Π°Π·ΠΈΠ΅ ΠΈΠΌΠ΅Π½', fontsize = 12)
ax1.plot(dataframe['year'], dataframe['count'], color='r', ls='-')
ax1.legend(loc=9, fontsize=12)

plt.show()

Π Π°Π±ΠΎΡ‚Π° Π½Π° Π²Π΅ΡˆΡ‚ΠΈΠ½Π°Ρ‚Π° Π·Π° ΠΊΠΎΡ€ΠΈΡΡ‚Π΅ΡšΠ΅ Π½Π° Π³Ρ€ΡƒΠΏΠΈΡ€Π°ΡšΠ΅ ΠΈ Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·Π°Ρ†ΠΈΡ˜Π° Π½Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ Π²ΠΎ Python

Π”Π° ΠΈΠ·Π±Π΅Ρ€Π΅ΠΌΠ΅ 4 Π³ΠΎΠ΄ΠΈΠ½ΠΈ ΠΎΠ΄ Ρ†Π΅Π»ΠΈΠΎΡ‚ ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π» ΠΈ Π΄Π° ја ΠΏΡ€ΠΈΠΊΠ°ΠΆΠ΅ΠΌΠ΅ распрСдСлбата Π·Π° сСкоја Π³ΠΎΠ΄ΠΈΠ½Π° ΠΏΠΎ ΠΏΡ€Π²Π°Ρ‚Π° Π±ΡƒΠΊΠ²Π° Π²ΠΎ ΠΈΠΌΠ΅Ρ‚ΠΎ ΠΈ ΠΏΠΎ послСдната Π±ΡƒΠΊΠ²Π° Π²ΠΎ ΠΈΠΌΠ΅Ρ‚ΠΎ:

from string import ascii_lowercase, ascii_uppercase

fig_first, ax_first = plt.subplots(1, 1, figsize=(14,10))
fig_last, ax_last = plt.subplots(1, 1, figsize=(14,10))

index = np.arange(len(ascii_uppercase))
years = [1944, 1978, 1991, 2003]
colors = ['r', 'g', 'b', 'y']
n = 0
for year in years:
    dataset = datalist.format(year=year)
    csv = pd.read_csv(dataset, names=['name', 'sex', 'count'])
    names = csv.groupby('name', as_index=False).aggregate(np.sum)
    count = names.shape[0]

    dataframe = pd.DataFrame({'letter': [], 'frequency_first': [], 'frequency_last': []})
    for letter in ascii_uppercase:
        countFirst = (names[names.name.str.startswith(letter)].count()['count'])
        countLast = (names[names.name.str.endswith(letter.lower())].count()['count'])

        dataframe = dataframe.append(pd.DataFrame({
            'letter': [letter],
            'frequency_first': [countFirst / count * 100],
            'frequency_last': [countLast / count * 100]}))

    ax_first.bar(index + 0.3 * n, dataframe['frequency_first'], 0.3, alpha=0.5, color=colors[n], label=year)
    ax_last.bar(index + bar_width * n, dataframe['frequency_last'], 0.3, alpha=0.5, color=colors[n], label=year)
    n += 1

ax_first.set_xlabel('Π‘ΡƒΠΊΠ²Π° Π°Π»Ρ„Π°Π²ΠΈΡ‚Π°')
ax_first.set_ylabel('Частота, %')
ax_first.set_title('ΠŸΠ΅Ρ€Π²Π°Ρ Π±ΡƒΠΊΠ²Π° Π² ΠΈΠΌΠ΅Π½ΠΈ')
ax_first.set_xticks(index)
ax_first.set_xticklabels(ascii_uppercase)
ax_first.legend()

ax_last.set_xlabel('Π‘ΡƒΠΊΠ²Π° Π°Π»Ρ„Π°Π²ΠΈΡ‚Π°')
ax_last.set_ylabel('Частота, %')
ax_last.set_title('ПослСдняя Π±ΡƒΠΊΠ²Π° Π² ΠΈΠΌΠ΅Π½ΠΈ')
ax_last.set_xticks(index)
ax_last.set_xticklabels(ascii_uppercase)
ax_last.legend()

fig_first.tight_layout()
fig_last.tight_layout()

plt.show()

Π Π°Π±ΠΎΡ‚Π° Π½Π° Π²Π΅ΡˆΡ‚ΠΈΠ½Π°Ρ‚Π° Π·Π° ΠΊΠΎΡ€ΠΈΡΡ‚Π΅ΡšΠ΅ Π½Π° Π³Ρ€ΡƒΠΏΠΈΡ€Π°ΡšΠ΅ ΠΈ Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·Π°Ρ†ΠΈΡ˜Π° Π½Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ Π²ΠΎ Python

Π Π°Π±ΠΎΡ‚Π° Π½Π° Π²Π΅ΡˆΡ‚ΠΈΠ½Π°Ρ‚Π° Π·Π° ΠΊΠΎΡ€ΠΈΡΡ‚Π΅ΡšΠ΅ Π½Π° Π³Ρ€ΡƒΠΏΠΈΡ€Π°ΡšΠ΅ ΠΈ Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·Π°Ρ†ΠΈΡ˜Π° Π½Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ Π²ΠΎ Python

АјдС Π΄Π° Π½Π°ΠΏΡ€Π°Π²ΠΈΠΌΠ΅ список Π½Π° Π½Π΅ΠΊΠΎΠ»ΠΊΡƒ ΠΏΠΎΠ·Π½Π°Ρ‚ΠΈ личности (прСтсСдатСли, ΠΏΠ΅Ρ˜Π°Ρ‡ΠΈ, Π°ΠΊΡ‚Π΅Ρ€ΠΈ, филмски Π»ΠΈΠΊΠΎΠ²ΠΈ) ΠΈ Π΄Π° Π³ΠΎ ΠΎΡ†Π΅Π½ΠΈΠΌΠ΅ Π½ΠΈΠ²Π½ΠΎΡ‚ΠΎ влијаниС Π²Ρ€Π· Π΄ΠΈΠ½Π°ΠΌΠΈΠΊΠ°Ρ‚Π° Π½Π° ΠΈΠΌΠΈΡšΠ°Ρ‚Π°:

celebrities = {'Frank': 'M', 'Britney': 'F', 'Madonna': 'F', 'Bob': 'M'}
dataframes = []
for year in years:
    dataset = datalist.format(year=year)
    dataframe = pd.read_csv(dataset, names=['name', 'sex', 'count'])
    dataframes.append(dataframe.assign(year=year))

result = pd.concat(dataframes)

for celebrity, sex in celebrities.items():
    names = result[result.name == celebrity]
    dataframe = names[names.sex == sex]
    fig, ax = plt.subplots(1, 1, figsize=(16,8))

    ax.set_xlabel('Π“ΠΎΠ΄Π°', fontsize = 10)
    ax.set_ylabel('Π ΠΎΠΆΠ΄Π°Π΅ΠΌΠΎΡΡ‚ΡŒ', fontsize = 10)
    ax.plot(dataframe['year'], dataframe['count'], label=celebrity, color='r', ls='-')
    ax.legend(loc=9, fontsize=12)
        
    plt.show()

Π Π°Π±ΠΎΡ‚Π° Π½Π° Π²Π΅ΡˆΡ‚ΠΈΠ½Π°Ρ‚Π° Π·Π° ΠΊΠΎΡ€ΠΈΡΡ‚Π΅ΡšΠ΅ Π½Π° Π³Ρ€ΡƒΠΏΠΈΡ€Π°ΡšΠ΅ ΠΈ Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·Π°Ρ†ΠΈΡ˜Π° Π½Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ Π²ΠΎ Python

Π Π°Π±ΠΎΡ‚Π° Π½Π° Π²Π΅ΡˆΡ‚ΠΈΠ½Π°Ρ‚Π° Π·Π° ΠΊΠΎΡ€ΠΈΡΡ‚Π΅ΡšΠ΅ Π½Π° Π³Ρ€ΡƒΠΏΠΈΡ€Π°ΡšΠ΅ ΠΈ Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·Π°Ρ†ΠΈΡ˜Π° Π½Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ Π²ΠΎ Python

Π Π°Π±ΠΎΡ‚Π° Π½Π° Π²Π΅ΡˆΡ‚ΠΈΠ½Π°Ρ‚Π° Π·Π° ΠΊΠΎΡ€ΠΈΡΡ‚Π΅ΡšΠ΅ Π½Π° Π³Ρ€ΡƒΠΏΠΈΡ€Π°ΡšΠ΅ ΠΈ Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·Π°Ρ†ΠΈΡ˜Π° Π½Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ Π²ΠΎ Python

Π Π°Π±ΠΎΡ‚Π° Π½Π° Π²Π΅ΡˆΡ‚ΠΈΠ½Π°Ρ‚Π° Π·Π° ΠΊΠΎΡ€ΠΈΡΡ‚Π΅ΡšΠ΅ Π½Π° Π³Ρ€ΡƒΠΏΠΈΡ€Π°ΡšΠ΅ ΠΈ Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·Π°Ρ†ΠΈΡ˜Π° Π½Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ Π²ΠΎ Python

Π—Π° ΠΎΠ±ΡƒΠΊΠ°, ΠΌΠΎΠΆΠ΅Ρ‚Π΅ Π΄Π° Π³ΠΎ Π΄ΠΎΠ΄Π°Π΄Π΅Ρ‚Π΅ ΠΆΠΈΠ²ΠΎΡ‚Π½ΠΈΠΎΡ‚ ΠΏΠ΅Ρ€ΠΈΠΎΠ΄ Π½Π° славната личност Π½Π° Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·Π°Ρ†ΠΈΡ˜Π°Ρ‚Π° ΠΎΠ΄ послСдниот ΠΏΡ€ΠΈΠΌΠ΅Ρ€ со Ρ†Π΅Π» јасно Π΄Π° Π³ΠΎ ΠΏΡ€ΠΎΡ†Π΅Π½ΠΈΡ‚Π΅ Π½ΠΈΠ²Π½ΠΎΡ‚ΠΎ влијаниС Π²Ρ€Π· Π΄ΠΈΠ½Π°ΠΌΠΈΠΊΠ°Ρ‚Π° Π½Π° ΠΈΠΌΠΈΡšΠ°Ρ‚Π°.

Π‘ΠΎ ΠΎΠ²Π° ситС наши Ρ†Π΅Π»ΠΈ Π±Π΅Π° постигнати ΠΈ исполнСти. Π Π°Π·Π²ΠΈΠ²ΠΌΠ΅ Π²Π΅ΡˆΡ‚ΠΈΠ½Π° Π·Π° ΠΊΠΎΡ€ΠΈΡΡ‚Π΅ΡšΠ΅ Π°Π»Π°Ρ‚ΠΊΠΈ Π·Π° Π³Ρ€ΡƒΠΏΠΈΡ€Π°ΡšΠ΅ ΠΈ Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·Π°Ρ†ΠΈΡ˜Π° Π½Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ Π²ΠΎ Python ΠΈ ќС ΠΏΡ€ΠΎΠ΄ΠΎΠ»ΠΆΠΈΠΌΠ΅ Π΄Π° Ρ€Π°Π±ΠΎΡ‚ΠΈΠΌΠ΅ со ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ. БСкој ΠΌΠΎΠΆΠ΅ сам Π΄Π° ΠΈΠ·Π²Π»Π΅Ρ‡Π΅ Π·Π°ΠΊΠ»ΡƒΡ‡ΠΎΡ†ΠΈ Π²Ρ€Π· основа Π½Π° Π³ΠΎΡ‚ΠΎΠ²ΠΈ, Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·ΠΈΡ€Π°Π½ΠΈ ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ.

Π—Π½Π°Π΅ΡšΠ΅ Π·Π° ситС!

Π˜Π·Π²ΠΎΡ€: www.habr.com

Π”ΠΎΠ΄Π°Π΄Π΅Ρ‚Π΅ ΠΊΠΎΠΌΠ΅Π½Ρ‚Π°Ρ€