เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ— เจ…เจคเฉ‡ เจกเฉ‡เจŸเจพ เจตเจฟเจœเจผเฉ‚เจ…เจฒเจพเจˆเจœเจผเฉ‡เจธเจผเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจจ เจฆเฉ‡ เจนเฉเจจเจฐ 'เจคเฉ‡ เจ•เฉฐเจฎ เจ•เจฐเจจเจพ

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ— เจ…เจคเฉ‡ เจกเฉ‡เจŸเจพ เจตเจฟเจœเจผเฉ‚เจ…เจฒเจพเจˆเจœเจผเฉ‡เจธเจผเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจจ เจฆเฉ‡ เจนเฉเจจเจฐ 'เจคเฉ‡ เจ•เฉฐเจฎ เจ•เจฐเจจเจพ

เจนเฉ‡ เจนเจฌเจฐ!

เจ…เฉฑเจœ เจ…เจธเฉ€เจ‚ เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจกเฉ‡เจŸเจพ เจจเฉ‚เฉฐ เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ— เจ…เจคเฉ‡ เจตเจฟเจœเจผเฉ‚เจ…เจฒเจพเจˆเจœเจผ เจ•เจฐเจจ เจฒเจˆ เจŸเฉ‚เจฒเจธ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจจ เจฆเฉ‡ เจนเฉเจจเจฐ 'เจคเฉ‡ เจ•เฉฐเจฎ เจ•เจฐเจพเจ‚เจ—เฉ‡เฅค เจชเฉเจฐเจฆเจพเจจ เจ•เฉ€เจคเฉ‡ เจ—เจ เจตเจฟเฉฑเจš Github 'เจคเฉ‡ เจกเจพเจŸเจพเจธเฉˆเจŸ เจ†เจ‰ เจ•เจˆ เจ—เฉเจฃเจพเจ‚ เจฆเจพ เจตเจฟเจธเจผเจฒเฉ‡เจธเจผเจฃ เจ•เจฐเฉ€เจ เจ…เจคเฉ‡ เจตเจฟเจœเจผเฉ‚เจ…เจฒเจพเจˆเจœเจผเฉ‡เจธเจผเจจเจพเจ‚ เจฆเจพ เจ‡เฉฑเจ• เจธเฉˆเฉฑเจŸ เจฌเจฃเจพเจˆเจเฅค

เจชเจฐเฉฐเจชเจฐเจพ เจฆเฉ‡ เจ…เจจเฉเจธเจพเจฐ, เจธเจผเฉเจฐเฉ‚ เจตเจฟเฉฑเจš, เจ†เจ“ เจŸเฉ€เจšเจฟเจ†เจ‚ เจจเฉ‚เฉฐ เจชเจฐเจฟเจญเจพเจธเจผเจฟเจค เจ•เจฐเฉ€เจ:

  • เจฒเจฟเฉฐเจ— เจ…เจคเฉ‡ เจธเจพเจฒ เจฆเฉ‡ เจ…เจจเฉเจธเจพเจฐ เจธเจฎเฉ‚เจน เจกเฉ‡เจŸเจพ เจ…เจคเฉ‡ เจฆเฉ‹เจตเจพเจ‚ เจฒเจฟเฉฐเจ—เจพเจ‚ เจฆเฉ€ เจœเจจเจฎ เจฆเจฐ เจฆเฉ€ เจธเจฎเฉเฉฑเจšเฉ€ เจ—เจคเฉ€เจธเจผเฉ€เจฒเจคเจพ เจฆเฉ€ เจ•เจฒเจชเจจเจพ เจ•เจฐเฉ‹;
  • เจนเจฐ เจธเจฎเฉ‡เจ‚ เจฆเฉ‡ เจธเจญ เจคเฉ‹เจ‚ เจชเฉเจฐเจธเจฟเฉฑเจง เจจเจพเจฎ เจฒเฉฑเจญเฉ‹;
  • เจกเฉ‡เจŸเจพ เจตเจฟเฉฑเจš เจชเฉ‚เจฐเฉ‡ เจธเจฎเฉ‡เจ‚ เจฆเฉ€ เจฎเจฟเจ†เจฆ เจจเฉ‚เฉฐ 10 เจญเจพเจ—เจพเจ‚ เจตเจฟเฉฑเจš เจตเฉฐเจกเฉ‹ เจ…เจคเฉ‡ เจนเจฐเฉ‡เจ• เจฒเจˆ, เจนเจฐเฉ‡เจ• เจฒเจฟเฉฐเจ— เจฆเจพ เจธเจญ เจคเฉ‹เจ‚ เจชเฉเจฐเจธเจฟเฉฑเจง เจจเจพเจฎ เจฒเฉฑเจญเฉ‹เฅค เจฒเฉฑเจญเฉ‡ เจ—เจ เจนเจฐเฉ‡เจ• เจจเจพเจฎ เจฒเจˆ, เจนเจฐ เจธเจฎเฉ‡เจ‚ เจ‡เจธเจฆเฉ€ เจ—เจคเฉ€เจธเจผเฉ€เจฒเจคเจพ เจฆเฉ€ เจ•เจฒเจชเจจเจพ เจ•เจฐเฉ‹;
  • เจนเจฐ เจธเจพเจฒ เจฒเจˆ, เจ—เจฃเจจเจพ เจ•เจฐเฉ‹ เจ•เจฟ เจ•เจฟเฉฐเจจเฉ‡ เจจเจพเจฎ 50% เจฒเฉ‹เจ•เจพเจ‚ เจจเฉ‚เฉฐ เจ•เจตเจฐ เจ•เจฐเจฆเฉ‡ เจนเจจ เจ…เจคเฉ‡ เจ•เจฒเจชเจจเจพ เจ•เจฐเฉ‹ (เจ…เจธเฉ€เจ‚ เจนเจฐ เจธเจพเจฒ เจฒเจˆ เจจเจพเจฎเจพเจ‚ เจฆเฉ€ เจตเจฟเจญเจฟเฉฐเจจเจคเจพ เจฆเฉ‡เจ–เจพเจ‚เจ—เฉ‡);
  • เจชเฉ‚เจฐเฉ‡ เจ…เฉฐเจคเจฐเจพเจฒ เจคเฉ‹เจ‚ 4 เจธเจพเจฒ เจšเฉเจฃเฉ‹ เจ…เจคเฉ‡ เจนเจฐ เจธเจพเจฒ เจฒเจˆ เจจเจพเจฎ เจฆเฉ‡ เจชเจนเจฟเจฒเฉ‡ เจ…เฉฑเจ–เจฐ เจ…เจคเฉ‡ เจจเจพเจฎ เจฆเฉ‡ เจ†เจ–เจฐเฉ€ เจ…เฉฑเจ–เจฐ เจฆเฉเจ†เจฐเจพ เจตเฉฐเจก เจจเฉ‚เฉฐ เจชเฉเจฐเจฆเจฐเจธเจผเจฟเจค เจ•เจฐเฉ‹;
  • เจ•เจˆ เจฎเจธเจผเจนเฉ‚เจฐ เจฒเฉ‹เจ•เจพเจ‚ (เจฐเจพเจธเจผเจŸเจฐเจชเจคเฉ€, เจ—เจพเจ‡เจ•, เจ…เจญเจฟเจจเฉ‡เจคเจพ, เจซเจฟเจฒเจฎ เจฆเฉ‡ เจชเจพเจคเจฐ) เจฆเฉ€ เจธเฉ‚เจšเฉ€ เจฌเจฃเจพเจ“ เจ…เจคเฉ‡ เจจเจพเจตเจพเจ‚ เจฆเฉ€ เจ—เจคเฉ€เจธเจผเฉ€เจฒเจคเจพ 'เจคเฉ‡ เจ‰เจจเฉเจนเจพเจ‚ เจฆเฉ‡ เจชเฉเจฐเจญเจพเจต เจฆเจพ เจฎเฉเจฒเจพเจ‚เจ•เจฃ เจ•เจฐเฉ‹เฅค เจ‡เฉฑเจ• เจฆเฉเจฐเจฟเจธเจผเจŸเฉ€เจ•เฉ‹เจฃ เจฌเจฃเจพเจ“เฅค

เจ˜เฉฑเจŸ เจธเจผเจฌเจฆ, เจตเจงเฉ‡เจฐเฉ‡ เจ•เฉ‹เจก!

เจ…เจคเฉ‡, เจ†เจ“ เจšเฉฑเจฒเฉ€เจเฅค

เจ†เจ‰ เจฒเจฟเฉฐเจ— เจ…เจคเฉ‡ เจธเจพเจฒ เจฆเฉเจ†เจฐเจพ เจกเฉ‡เจŸเจพ เจจเฉ‚เฉฐ เจธเจฎเฉ‚เจน เจ•เจฐเฉ€เจ เจ…เจคเฉ‡ เจฆเฉ‹เจตเจพเจ‚ เจฒเจฟเฉฐเจ—เจพเจ‚ เจฆเฉ€ เจœเจจเจฎ เจฆเจฐ เจฆเฉ€ เจธเจฎเฉเฉฑเจšเฉ€ เจ—เจคเฉ€เจธเจผเฉ€เจฒเจคเจพ เจฆเฉ€ เจ•เจฒเจชเจจเจพ เจ•เจฐเฉ€เจ:

import numpy as np
import pandas as pd 
import matplotlib.pyplot as plt

years = np.arange(1880, 2011, 3)
datalist = 'https://raw.githubusercontent.com/wesm/pydata-book/2nd-edition/datasets/babynames/yob{year}.txt'
dataframes = []
for year in years:
    dataset = datalist.format(year=year)
    dataframe = pd.read_csv(dataset, names=['name', 'sex', 'count'])
    dataframes.append(dataframe.assign(year=year))

result = pd.concat(dataframes)
sex = result.groupby('sex')
births_men = sex.get_group('M').groupby('year', as_index=False)
births_women = sex.get_group('F').groupby('year', as_index=False)
births_men_list = births_men.aggregate(np.sum)['count'].tolist()
births_women_list = births_women.aggregate(np.sum)['count'].tolist()

fig, ax = plt.subplots()
fig.set_size_inches(25,15)

index = np.arange(len(years))
stolb1 = ax.bar(index, births_men_list, 0.4, color='c', label='ะœัƒะถั‡ะธะฝั‹')
stolb2 = ax.bar(index + 0.4, births_women_list, 0.4, alpha=0.8, color='r', label='ะ–ะตะฝั‰ะธะฝั‹')

ax.set_title('ะ ะพะถะดะฐะตะผะพัั‚ัŒ ะฟะพ ะฟะพะปัƒ ะธ ะณะพะดะฐะผ')
ax.set_xlabel('ะ“ะพะดะฐ')
ax.set_ylabel('ะ ะพะถะดะฐะตะผะพัั‚ัŒ')
ax.set_xticklabels(years)
ax.set_xticks(index + 0.4)
ax.legend(loc=9)

fig.tight_layout()
plt.show()

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ— เจ…เจคเฉ‡ เจกเฉ‡เจŸเจพ เจตเจฟเจœเจผเฉ‚เจ…เจฒเจพเจˆเจœเจผเฉ‡เจธเจผเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจจ เจฆเฉ‡ เจนเฉเจจเจฐ 'เจคเฉ‡ เจ•เฉฐเจฎ เจ•เจฐเจจเจพ

เจ†เจ“ เจ‡เจคเจฟเจนเจพเจธ เจตเจฟเฉฑเจš เจธเจญ เจคเฉ‹เจ‚ เจชเฉเจฐเจธเจฟเฉฑเจง เจจเจพเจฎ เจฒเฉฑเจญเฉ€เจ:

years = np.arange(1880, 2011)

dataframes = []
for year in years:
    dataset = datalist.format(year=year)
    dataframe = pd.read_csv(dataset, names=['name', 'sex', 'count'])
    dataframes.append(dataframe)

result = pd.concat(dataframes)
names = result.groupby('name', as_index=False).sum().sort_values('count', ascending=False)
names.head(10)

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ— เจ…เจคเฉ‡ เจกเฉ‡เจŸเจพ เจตเจฟเจœเจผเฉ‚เจ…เจฒเจพเจˆเจœเจผเฉ‡เจธเจผเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจจ เจฆเฉ‡ เจนเฉเจจเจฐ 'เจคเฉ‡ เจ•เฉฐเจฎ เจ•เจฐเจจเจพ

เจ†เจ‰ เจกเฉ‡เจŸเจพ เจตเจฟเฉฑเจš เจชเฉ‚เจฐเฉ‡ เจธเจฎเฉ‡เจ‚ เจฆเฉ€ เจฎเจฟเจ†เจฆ เจจเฉ‚เฉฐ 10 เจญเจพเจ—เจพเจ‚ เจตเจฟเฉฑเจš เจตเฉฐเจกเฉ€เจ เจ…เจคเฉ‡ เจนเจฐเฉ‡เจ• เจฒเจˆ เจ…เจธเฉ€เจ‚ เจนเจฐเฉ‡เจ• เจฒเจฟเฉฐเจ— เจฆเจพ เจธเจญ เจคเฉ‹เจ‚ เจชเฉเจฐเจธเจฟเฉฑเจง เจจเจพเจฎ เจฒเฉฑเจญเจพเจ‚เจ—เฉ‡เฅค เจฒเฉฑเจญเฉ‡ เจ—เจ เจนเจฐเฉ‡เจ• เจจเจพเจฎ เจฒเจˆ, เจ…เจธเฉ€เจ‚ เจนเจฐ เจธเจฎเฉ‡เจ‚ เจ‡เจธเจฆเฉ€ เจ—เจคเฉ€เจธเจผเฉ€เจฒเจคเจพ เจฆเฉ€ เจ•เจฒเจชเจจเจพ เจ•เจฐเจฆเฉ‡ เจนเจพเจ‚:

years = np.arange(1880, 2011)
part_size = int((years[years.size - 1] - years[0]) / 10) + 1
parts = {}
def GetPart(year):
    return int((year - years[0]) / part_size)
for year in years:
    index = GetPart(year)
    r = years[0] + part_size * index, min(years[years.size - 1], years[0] + part_size * (index + 1))
    parts[index] = str(r[0]) + '-' + str(r[1])

dataframe_parts = []
dataframes = []
for year in years:
    dataset = datalist.format(year=year)
    dataframe = pd.read_csv(dataset, names=['name', 'sex', 'count'])
    dataframe_parts.append(dataframe.assign(years=parts[GetPart(year)]))
    dataframes.append(dataframe.assign(year=year))
    
result_parts = pd.concat(dataframe_parts)
result = pd.concat(dataframes)

result_parts_sums = result_parts.groupby(['years', 'sex', 'name'], as_index=False).sum()
result_parts_names = result_parts_sums.iloc[result_parts_sums.groupby(['years', 'sex'], as_index=False).apply(lambda x: x['count'].idxmax())]
result_sums = result.groupby(['year', 'sex', 'name'], as_index=False).sum()

for groupName, groupLabels in result_parts_names.groupby(['name', 'sex']).groups.items():
    group = result_sums.groupby(['name', 'sex']).get_group(groupName)
    fig, ax = plt.subplots(1, 1, figsize=(18,10))

    ax.set_xlabel('ะ“ะพะดะฐ')
    ax.set_ylabel('ะ ะพะถะดะฐะตะผะพัั‚ัŒ')
    label = group['name']
    ax.plot(group['year'], group['count'], label=label.aggregate(np.max), color='b', ls='-')
    ax.legend(loc=9, fontsize=11)

    plt.show()

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ— เจ…เจคเฉ‡ เจกเฉ‡เจŸเจพ เจตเจฟเจœเจผเฉ‚เจ…เจฒเจพเจˆเจœเจผเฉ‡เจธเจผเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจจ เจฆเฉ‡ เจนเฉเจจเจฐ 'เจคเฉ‡ เจ•เฉฐเจฎ เจ•เจฐเจจเจพ

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ— เจ…เจคเฉ‡ เจกเฉ‡เจŸเจพ เจตเจฟเจœเจผเฉ‚เจ…เจฒเจพเจˆเจœเจผเฉ‡เจธเจผเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจจ เจฆเฉ‡ เจนเฉเจจเจฐ 'เจคเฉ‡ เจ•เฉฐเจฎ เจ•เจฐเจจเจพ

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ— เจ…เจคเฉ‡ เจกเฉ‡เจŸเจพ เจตเจฟเจœเจผเฉ‚เจ…เจฒเจพเจˆเจœเจผเฉ‡เจธเจผเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจจ เจฆเฉ‡ เจนเฉเจจเจฐ 'เจคเฉ‡ เจ•เฉฐเจฎ เจ•เจฐเจจเจพ

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ— เจ…เจคเฉ‡ เจกเฉ‡เจŸเจพ เจตเจฟเจœเจผเฉ‚เจ…เจฒเจพเจˆเจœเจผเฉ‡เจธเจผเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจจ เจฆเฉ‡ เจนเฉเจจเจฐ 'เจคเฉ‡ เจ•เฉฐเจฎ เจ•เจฐเจจเจพ

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ— เจ…เจคเฉ‡ เจกเฉ‡เจŸเจพ เจตเจฟเจœเจผเฉ‚เจ…เจฒเจพเจˆเจœเจผเฉ‡เจธเจผเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจจ เจฆเฉ‡ เจนเฉเจจเจฐ 'เจคเฉ‡ เจ•เฉฐเจฎ เจ•เจฐเจจเจพ

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ— เจ…เจคเฉ‡ เจกเฉ‡เจŸเจพ เจตเจฟเจœเจผเฉ‚เจ…เจฒเจพเจˆเจœเจผเฉ‡เจธเจผเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจจ เจฆเฉ‡ เจนเฉเจจเจฐ 'เจคเฉ‡ เจ•เฉฐเจฎ เจ•เจฐเจจเจพ

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ— เจ…เจคเฉ‡ เจกเฉ‡เจŸเจพ เจตเจฟเจœเจผเฉ‚เจ…เจฒเจพเจˆเจœเจผเฉ‡เจธเจผเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจจ เจฆเฉ‡ เจนเฉเจจเจฐ 'เจคเฉ‡ เจ•เฉฐเจฎ เจ•เจฐเจจเจพ

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ— เจ…เจคเฉ‡ เจกเฉ‡เจŸเจพ เจตเจฟเจœเจผเฉ‚เจ…เจฒเจพเจˆเจœเจผเฉ‡เจธเจผเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจจ เจฆเฉ‡ เจนเฉเจจเจฐ 'เจคเฉ‡ เจ•เฉฐเจฎ เจ•เจฐเจจเจพ

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ— เจ…เจคเฉ‡ เจกเฉ‡เจŸเจพ เจตเจฟเจœเจผเฉ‚เจ…เจฒเจพเจˆเจœเจผเฉ‡เจธเจผเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจจ เจฆเฉ‡ เจนเฉเจจเจฐ 'เจคเฉ‡ เจ•เฉฐเจฎ เจ•เจฐเจจเจพ

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ— เจ…เจคเฉ‡ เจกเฉ‡เจŸเจพ เจตเจฟเจœเจผเฉ‚เจ…เจฒเจพเจˆเจœเจผเฉ‡เจธเจผเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจจ เจฆเฉ‡ เจนเฉเจจเจฐ 'เจคเฉ‡ เจ•เฉฐเจฎ เจ•เจฐเจจเจพ

เจนเจฐ เจธเจพเจฒ เจฒเจˆ, เจ…เจธเฉ€เจ‚ เจ—เจฃเจจเจพ เจ•เจฐเจฆเฉ‡ เจนเจพเจ‚ เจ•เจฟ เจ•เจฟเฉฐเจจเฉ‡ เจจเจพเจฎ 50% เจฒเฉ‹เจ•เจพเจ‚ เจจเฉ‚เฉฐ เจ•เจตเจฐ เจ•เจฐเจฆเฉ‡ เจนเจจ เจ…เจคเฉ‡ เจ‡เจธ เจกเฉ‡เจŸเจพ เจฆเฉ€ เจ•เจฒเจชเจจเจพ เจ•เจฐเจฆเฉ‡ เจนเจพเจ‚:

dataframe = pd.DataFrame({'year': [], 'count': []})
years = np.arange(1880, 2011)
for year in years:
    dataset = datalist.format(year=year)
    csv = pd.read_csv(dataset, names=['name', 'sex', 'count'])
    names = csv.groupby('name', as_index=False).aggregate(np.sum)
    names['sum'] = names.sum()['count']
    names['percent'] = names['count'] / names['sum'] * 100
    names = names.sort_values(['percent'], ascending=False)
    names['cum_perc'] = names['percent'].cumsum()
    names_filtered = names[names['cum_perc'] <= 50]
    dataframe = dataframe.append(pd.DataFrame({'year': [year], 'count': [names_filtered.shape[0]]}))

fig, ax1 = plt.subplots(1, 1, figsize=(22,13))
ax1.set_xlabel('ะ“ะพะดะฐ', fontsize = 12)
ax1.set_ylabel('ะ ะฐะทะฝะพะพะฑั€ะฐะทะธะต ะธะผะตะฝ', fontsize = 12)
ax1.plot(dataframe['year'], dataframe['count'], color='r', ls='-')
ax1.legend(loc=9, fontsize=12)

plt.show()

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ— เจ…เจคเฉ‡ เจกเฉ‡เจŸเจพ เจตเจฟเจœเจผเฉ‚เจ…เจฒเจพเจˆเจœเจผเฉ‡เจธเจผเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจจ เจฆเฉ‡ เจนเฉเจจเจฐ 'เจคเฉ‡ เจ•เฉฐเจฎ เจ•เจฐเจจเจพ

เจ†เจ‰ เจชเฉ‚เจฐเฉ‡ เจ…เฉฐเจคเจฐเจพเจฒ เจคเฉ‹เจ‚ 4 เจธเจพเจฒ เจšเฉเจฃเฉ€เจ เจ…เจคเฉ‡ เจนเจฐ เจธเจพเจฒ เจฒเจˆ เจจเจพเจฎ เจฆเฉ‡ เจชเจนเจฟเจฒเฉ‡ เจ…เฉฑเจ–เจฐ เจ…เจคเฉ‡ เจจเจพเจฎ เจฆเฉ‡ เจ†เจ–เจฐเฉ€ เจ…เฉฑเจ–เจฐ เจฆเฉเจ†เจฐเจพ เจตเฉฐเจก เจจเฉ‚เฉฐ เจชเฉเจฐเจฆเจฐเจธเจผเจฟเจค เจ•เจฐเฉ€เจ:

from string import ascii_lowercase, ascii_uppercase

fig_first, ax_first = plt.subplots(1, 1, figsize=(14,10))
fig_last, ax_last = plt.subplots(1, 1, figsize=(14,10))

index = np.arange(len(ascii_uppercase))
years = [1944, 1978, 1991, 2003]
colors = ['r', 'g', 'b', 'y']
n = 0
for year in years:
    dataset = datalist.format(year=year)
    csv = pd.read_csv(dataset, names=['name', 'sex', 'count'])
    names = csv.groupby('name', as_index=False).aggregate(np.sum)
    count = names.shape[0]

    dataframe = pd.DataFrame({'letter': [], 'frequency_first': [], 'frequency_last': []})
    for letter in ascii_uppercase:
        countFirst = (names[names.name.str.startswith(letter)].count()['count'])
        countLast = (names[names.name.str.endswith(letter.lower())].count()['count'])

        dataframe = dataframe.append(pd.DataFrame({
            'letter': [letter],
            'frequency_first': [countFirst / count * 100],
            'frequency_last': [countLast / count * 100]}))

    ax_first.bar(index + 0.3 * n, dataframe['frequency_first'], 0.3, alpha=0.5, color=colors[n], label=year)
    ax_last.bar(index + bar_width * n, dataframe['frequency_last'], 0.3, alpha=0.5, color=colors[n], label=year)
    n += 1

ax_first.set_xlabel('ะ‘ัƒะบะฒะฐ ะฐะปั„ะฐะฒะธั‚ะฐ')
ax_first.set_ylabel('ะงะฐัั‚ะพั‚ะฐ, %')
ax_first.set_title('ะŸะตั€ะฒะฐั ะฑัƒะบะฒะฐ ะฒ ะธะผะตะฝะธ')
ax_first.set_xticks(index)
ax_first.set_xticklabels(ascii_uppercase)
ax_first.legend()

ax_last.set_xlabel('ะ‘ัƒะบะฒะฐ ะฐะปั„ะฐะฒะธั‚ะฐ')
ax_last.set_ylabel('ะงะฐัั‚ะพั‚ะฐ, %')
ax_last.set_title('ะŸะพัะปะตะดะฝัั ะฑัƒะบะฒะฐ ะฒ ะธะผะตะฝะธ')
ax_last.set_xticks(index)
ax_last.set_xticklabels(ascii_uppercase)
ax_last.legend()

fig_first.tight_layout()
fig_last.tight_layout()

plt.show()

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ— เจ…เจคเฉ‡ เจกเฉ‡เจŸเจพ เจตเจฟเจœเจผเฉ‚เจ…เจฒเจพเจˆเจœเจผเฉ‡เจธเจผเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจจ เจฆเฉ‡ เจนเฉเจจเจฐ 'เจคเฉ‡ เจ•เฉฐเจฎ เจ•เจฐเจจเจพ

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ— เจ…เจคเฉ‡ เจกเฉ‡เจŸเจพ เจตเจฟเจœเจผเฉ‚เจ…เจฒเจพเจˆเจœเจผเฉ‡เจธเจผเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจจ เจฆเฉ‡ เจนเฉเจจเจฐ 'เจคเฉ‡ เจ•เฉฐเจฎ เจ•เจฐเจจเจพ

เจ†เจ‰ เจ•เจˆ เจฎเจธเจผเจนเฉ‚เจฐ เจฒเฉ‹เจ•เจพเจ‚ (เจฐเจพเจธเจผเจŸเจฐเจชเจคเฉ€, เจ—เจพเจ‡เจ•, เจ…เจญเจฟเจจเฉ‡เจคเจพ, เจซเจฟเจฒเจฎ เจฆเฉ‡ เจชเจพเจคเจฐ) เจฆเฉ€ เจธเฉ‚เจšเฉ€ เจฌเจฃเจพเจˆเจ เจ…เจคเฉ‡ เจจเจพเจตเจพเจ‚ เจฆเฉ€ เจ—เจคเฉ€เจธเจผเฉ€เจฒเจคเจพ 'เจคเฉ‡ เจ‰เจจเฉเจนเจพเจ‚ เจฆเฉ‡ เจชเฉเจฐเจญเจพเจต เจฆเจพ เจฎเฉเจฒเจพเจ‚เจ•เจฃ เจ•เจฐเฉ€เจ:

celebrities = {'Frank': 'M', 'Britney': 'F', 'Madonna': 'F', 'Bob': 'M'}
dataframes = []
for year in years:
    dataset = datalist.format(year=year)
    dataframe = pd.read_csv(dataset, names=['name', 'sex', 'count'])
    dataframes.append(dataframe.assign(year=year))

result = pd.concat(dataframes)

for celebrity, sex in celebrities.items():
    names = result[result.name == celebrity]
    dataframe = names[names.sex == sex]
    fig, ax = plt.subplots(1, 1, figsize=(16,8))

    ax.set_xlabel('ะ“ะพะดะฐ', fontsize = 10)
    ax.set_ylabel('ะ ะพะถะดะฐะตะผะพัั‚ัŒ', fontsize = 10)
    ax.plot(dataframe['year'], dataframe['count'], label=celebrity, color='r', ls='-')
    ax.legend(loc=9, fontsize=12)
        
    plt.show()

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ— เจ…เจคเฉ‡ เจกเฉ‡เจŸเจพ เจตเจฟเจœเจผเฉ‚เจ…เจฒเจพเจˆเจœเจผเฉ‡เจธเจผเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจจ เจฆเฉ‡ เจนเฉเจจเจฐ 'เจคเฉ‡ เจ•เฉฐเจฎ เจ•เจฐเจจเจพ

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ— เจ…เจคเฉ‡ เจกเฉ‡เจŸเจพ เจตเจฟเจœเจผเฉ‚เจ…เจฒเจพเจˆเจœเจผเฉ‡เจธเจผเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจจ เจฆเฉ‡ เจนเฉเจจเจฐ 'เจคเฉ‡ เจ•เฉฐเจฎ เจ•เจฐเจจเจพ

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ— เจ…เจคเฉ‡ เจกเฉ‡เจŸเจพ เจตเจฟเจœเจผเฉ‚เจ…เจฒเจพเจˆเจœเจผเฉ‡เจธเจผเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจจ เจฆเฉ‡ เจนเฉเจจเจฐ 'เจคเฉ‡ เจ•เฉฐเจฎ เจ•เจฐเจจเจพ

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ— เจ…เจคเฉ‡ เจกเฉ‡เจŸเจพ เจตเจฟเจœเจผเฉ‚เจ…เจฒเจพเจˆเจœเจผเฉ‡เจธเจผเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจจ เจฆเฉ‡ เจนเฉเจจเจฐ 'เจคเฉ‡ เจ•เฉฐเจฎ เจ•เจฐเจจเจพ

เจธเจฟเจ–เจฒเจพเจˆ เจฒเจˆ, เจคเฉเจธเฉ€เจ‚ เจจเจพเจฎเจพเจ‚ เจฆเฉ€ เจ—เจคเฉ€เจธเจผเฉ€เจฒเจคเจพ 'เจคเฉ‡ เจ‰เจจเฉเจนเจพเจ‚ เจฆเฉ‡ เจชเฉเจฐเจญเจพเจต เจฆเจพ เจธเจชเจธเจผเจŸ เจคเฉŒเจฐ 'เจคเฉ‡ เจฎเฉเจฒเจพเจ‚เจ•เจฃ เจ•เจฐเจจ เจฒเจˆ เจ†เจ–เจฐเฉ€ เจ‰เจฆเจพเจนเจฐเจฃ เจคเฉ‹เจ‚ เจตเจฟเจœเจผเฉ‚เจ…เจฒเจพเจˆเจœเจผเฉ‡เจธเจผเจจ เจตเจฟเฉฑเจš เจฎเจธเจผเจนเฉ‚เจฐ เจนเจธเจคเฉ€เจ†เจ‚ เจฆเฉ‡ เจœเฉ€เจตเจจ เจ•เจพเจฒ เจจเฉ‚เฉฐ เจœเฉ‹เฉœ เจธเจ•เจฆเฉ‡ เจนเฉ‹เฅค

เจ‡เจธ เจจเจพเจฒ, เจธเจพเจกเฉ‡ เจธเจพเจฐเฉ‡ เจŸเฉ€เจšเฉ‡ เจชเฉเจฐเจพเจชเจค เจนเฉ‹เจ เจ…เจคเฉ‡ เจชเฉ‚เจฐเฉ‡ เจนเฉ‹ เจ—เจเฅค เจ…เจธเฉ€เจ‚ เจชเจพเจ‡เจฅเจจ เจตเจฟเฉฑเจš เจกเฉ‡เจŸเจพ เจจเฉ‚เฉฐ เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ— เจ…เจคเฉ‡ เจตเจฟเจœเจผเฉ‚เจ…เจฒเจพเจˆเจœเจผ เจ•เจฐเจจ เจฒเจˆ เจŸเฉ‚เจฒเจธ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจจ เจฆเจพ เจนเฉเจจเจฐ เจตเจฟเจ•เจธเจฟเจค เจ•เฉ€เจคเจพ เจนเฉˆ, เจ…เจคเฉ‡ เจ…เจธเฉ€เจ‚ เจกเฉ‡เจŸเจพ เจฆเฉ‡ เจจเจพเจฒ เจ•เฉฐเจฎ เจ•เจฐเจจเจพ เจœเจพเจฐเฉ€ เจฐเฉฑเจ–เจพเจ‚เจ—เฉ‡เฅค เจนเจฐ เจ•เฉ‹เจˆ เจคเจฟเจ†เจฐ-เจฌเจฃเจพเจ‡เจ†, เจตเจฟเจœเจผเฉเจ…เจฒ เจกเจพเจŸเจพ เจฆเฉ‡ เจ†เจงเจพเจฐ 'เจคเฉ‡ เจธเจฟเฉฑเจŸเจพ เจ•เฉฑเจข เจธเจ•เจฆเจพ เจนเฉˆเฅค

เจนเจฐ เจ•เจฟเจธเฉ‡ เจจเฉ‚เฉฐ เจ—เจฟเจ†เจจ!

เจธเจฐเฉ‹เจค: www.habr.com

เจ‡เฉฑเจ• เจŸเจฟเฉฑเจชเจฃเฉ€ เจœเฉ‹เฉœเฉ‹