ΠΠ΅Π±ΠΎΠ»ΡΡΠΎΠ΅ Π²ΡΡΡΠΏΠΈΡΠ΅Π»ΡΠ½ΠΎΠ΅ ΡΠ»ΠΎΠ²ΠΎ
Π― ΡΡΠΈΡΠ°Ρ, ΡΡΠΎ Π±ΠΠ»ΡΡΠ΅Π΅ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ Π΄Π΅Π» ΠΌΡ Π±Ρ ΠΌΠΎΠ³Π»ΠΈ ΡΠΎΠ²Π΅ΡΡΠ°ΡΡ, Π΅ΡΠ»ΠΈ Π±Ρ Π½Π°ΠΌ ΠΏΡΠ΅Π΄ΠΎΡΡΠ°Π²Π»ΡΠ»ΠΈ ΠΏΠΎΡΠ°Π³ΠΎΠ²ΡΠ΅ ΠΈΠ½ΡΡΡΡΠΊΡΠΈΠΈ, ΠΊΠΎΡΠΎΡΡΠ΅ ΡΠΊΠ°ΠΆΡΡ ΡΡΠΎ ΠΈ ΠΊΠ°ΠΊ Π΄Π΅Π»Π°ΡΡ. Π‘Π°ΠΌ ΠΆΠ΅ Π²ΡΠΏΠΎΠΌΠΈΠ½Π°Ρ Π² ΡΠ²ΠΎΠ΅ΠΉ ΠΆΠΈΠ·Π½ΠΈ ΡΠ°ΠΊΠΈΠ΅ ΠΌΠΎΠΌΠ΅Π½ΡΡ, ΠΊΠΎΠ³Π΄Π° Π½Π΅ ΠΌΠΎΠ³ Π½Π°ΡΠ°ΡΡΡΡ ΠΊΠ°ΠΊΠΎΠ΅-ΡΠΎ Π΄Π΅Π»ΠΎ ΠΈΠ·-Π·Π° ΡΠΎΠ³ΠΎ, ΡΡΠΎ Π±ΡΠ»ΠΎ ΠΏΡΠΎΡΡΠΎ ΡΠ»ΠΎΠΆΠ½ΠΎ ΠΏΠΎΠ½ΡΡΡ, Ρ ΡΠ΅Π³ΠΎ Π½ΡΠΆΠ½ΠΎ Π½Π°ΡΠΈΠ½Π°ΡΡ. ΠΡΡΡ ΠΌΠΎΠΆΠ΅Ρ, ΠΊΠΎΠ³Π΄Π°-ΡΠΎ Π΄Π°Π²Π½ΠΎ Π² ΠΈΠ½ΡΠ΅ΡΠ½Π΅ΡΠ΅ ΡΡ ΡΠ²ΠΈΠ΄Π΅Π» ΡΠ»ΠΎΠ²Π° Β«Data ScienceΒ» ΠΈ ΡΠ΅ΡΠΈΠ», ΡΡΠΎ ΡΠ΅Π±Π΅ Π΄ΠΎ ΡΡΠΎΠ³ΠΎ Π΄Π°Π»Π΅ΠΊΠΎ, Π° Π»ΡΠ΄ΠΈ, ΠΊΠΎΡΠΎΡΡΠ΅ ΡΡΠΈΠΌ Π·Π°Π½ΠΈΠΌΠ°ΡΡΡΡ Π³Π΄Π΅-ΡΠΎ ΡΠ°ΠΌ, Π² Π΄ΡΡΠ³ΠΎΠΌ ΠΌΠΈΡΠ΅. Π’Π°ΠΊ Π½Π΅Ρ ΠΆΠ΅, ΠΎΠ½ΠΈ ΠΏΡΡΠΌΠΎ Π·Π΄Π΅ΡΡ. Π, Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ, Π±Π»Π°Π³ΠΎΠ΄Π°ΡΡ Π»ΡΠ΄ΡΠΌ ΠΈΠ· ΡΡΠΎΠΉ ΡΡΠ΅ΡΡ ΡΠ΅Π±Π΅ Π² Π»Π΅Π½ΡΡ ΠΏΠΎΠΏΠ°Π»Π° ΡΡΠ°ΡΡΡ. Π‘ΡΡΠ΅ΡΡΠ²ΡΠ΅Ρ ΠΏΠΎΠ»Π½ΠΎ ΠΊΡΡΡΠΎΠ², ΠΊΠΎΡΠΎΡΡΠ΅ ΠΏΠΎΠΌΠΎΠ³ΡΡ ΡΠ΅Π±Π΅ ΠΎΡΠ²ΠΎΠΈΡΡΡ Ρ ΡΡΠΈΠΌ ΡΠ΅ΠΌΠ΅ΡΠ»ΠΎΠΌ, Π·Π΄Π΅ΡΡ ΠΆΠ΅ Ρ ΠΏΠΎΠΌΠΎΠ³Ρ ΡΠ΅Π±Π΅ ΡΠ΄Π΅Π»Π°ΡΡ ΠΏΠ΅ΡΠ²ΡΠΉ ΡΠ°Π³.
ΠΡ ΡΡΠΎ, ΡΡ Π³ΠΎΡΠΎΠ²? Π‘ΡΠ°Π·Ρ ΡΠΊΠ°ΠΆΡ, ΡΡΠΎ ΡΠ΅Π±Π΅ ΠΏΡΠΈΠ΄Π΅ΡΡΡ Π·Π½Π°ΡΡ Python 3, ΠΏΠΎΡΠΊΠΎΠ»ΡΠΊΡ Π΅Π³ΠΎ Ρ Π±ΡΠ΄Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ Π·Π΄Π΅ΡΡ. Π ΡΠ°ΠΊΠΆΠ΅ ΡΠΎΠ²Π΅ΡΡΡ Π·Π°ΡΠ°Π½Π΅Π΅ ΡΡΡΠ°Π½ΠΎΠ²ΠΈΡΡ Π½Π° Jupyter Notebook ΠΈΠ»ΠΈ ΠΏΠΎΡΠΌΠΎΡΡΠ΅ΡΡ, ΠΊΠ°ΠΊ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ google colab.
Π¨Π°Π³ ΠΏΠ΅ΡΠ²ΡΠΉ
Kaggle β ΡΠ²ΠΎΠΉ Π·Π½Π°ΡΠΈΡΠ΅Π»ΡΠ½ΡΠΉ ΠΏΠΎΠΌΠΎΡΠ½ΠΈΠΊ Π² ΡΡΠΎΠΌ Π΄Π΅Π»Π΅. Π ΠΏΡΠΈΠ½ΡΠΈΠΏΠ΅, ΠΌΠΎΠΆΠ½ΠΎ ΠΈ ΠΎΠ±ΠΎΠΉΡΠΈΡΡ Π±Π΅Π· Π½Π΅Π³ΠΎ, Π½ΠΎ ΠΎΠ± ΡΡΠΎΠΌ Ρ ΡΠ°ΡΡΠΊΠ°ΠΆΡ Π² Π΄ΡΡΠ³ΠΎΠΉ ΡΡΠ°ΡΡΠ΅. ΠΡΠΎ ΡΠ°ΠΊΠ°Ρ ΠΏΠ»Π°ΡΡΠΎΡΠΌΠ°, Π² ΠΊΠΎΡΠΎΡΠΎΠΉ ΡΠ°Π·ΠΌΠ΅ΡΠ°ΡΡΡΡ ΡΠΎΡΠ΅Π²Π½ΠΎΠ²Π°Π½ΠΈΡ ΠΏΠΎ Data Science. Π ΠΊΠ°ΠΆΠ΄ΠΎΠΌ ΡΠ°ΠΊΠΎΠΌ ΡΠΎΡΠ΅Π²Π½ΠΎΠ²Π°Π½ΠΈΠΈ Π½Π° ΡΠ°Π½Π½ΠΈΡ
ΡΡΠ°ΠΏΠ°Ρ
ΡΡ Π±ΡΠ΄Π΅ΡΡ ΠΏΠΎΠ»ΡΡΠ°ΡΡ Π½Π΅ΡΠ΅Π°Π»ΡΠ½ΠΎΠ΅ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ ΠΎΠΏΡΡΠ° ΡΠ΅ΡΠ΅Π½ΠΈΡ Π·Π°Π΄Π°Ρ ΡΠ°Π·Π½ΠΎΠ³ΠΎ ΡΠΎΠ΄Π°, ΠΎΠΏΡΡΠ° ΡΠ°Π·ΡΠ°Π±ΠΎΡΠΊΠΈ ΠΈ ΠΎΠΏΡΡΠ° ΡΠ°Π±ΠΎΡΡ Π² ΠΊΠΎΠΌΠ°Π½Π΄Π΅, ΡΡΠΎ Π²Π°ΠΆΠ½ΠΎ Π² Π½Π°ΡΠ΅ Π²ΡΠ΅ΠΌΡ.
ΠΠ°ΡΡ Π·Π°Π΄Π°ΡΡ ΠΌΡ Π²ΠΎΠ·ΡΠΌΡΠΌ ΠΎΡΡΡΠ΄Π°. ΠΠ°Π·ΡΠ²Π°Π΅ΡΡΡ ΠΎΠ½Π° ΡΠ°ΠΊ: Β«Π’ΠΈΡΠ°Π½ΠΈΠΊΒ». Π£ΡΠ»ΠΎΠ²ΠΈΠ΅ ΡΠ°ΠΊΠΎΠ²ΠΎ: ΡΠΏΡΠΎΠ³Π½ΠΎΠ·ΠΈΡΠΎΠ²Π°ΡΡ, Π²ΡΠΆΠΈΠ²Π΅Ρ ΠΊΠ°ΠΆΠ΄ΡΠΉ ΠΎΡΠ΄Π΅Π»ΡΠ½ΠΎ Π²Π·ΡΡΡΠΉ ΡΠ΅Π»ΠΎΠ²Π΅ΠΊ. Π ΡΠ΅Π»ΠΎΠΌ Π³ΠΎΠ²ΠΎΡΡ, Π·Π°Π΄Π°ΡΠ° ΡΠ΅Π»ΠΎΠ²Π΅ΠΊΠ°, Π·Π°Π½ΠΈΠΌΠ°ΡΡΠ΅Π³ΠΎΡΡ DS, ΡΡΠΎ ΡΠ±ΠΎΡ Π΄Π°Π½Π½ΡΡ , ΠΈΡ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠ°, ΠΎΠ±ΡΡΠ΅Π½ΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΠΏΡΠΎΠ³Π½ΠΎΠ· ΠΈ ΡΠ°ΠΊ Π΄Π°Π»Π΅Π΅. Π kaggle ΠΆΠ΅ Π½Π°ΠΌ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡΡ ΠΏΡΠΎΠΏΡΡΡΠΈΡΡ ΡΡΠ°ΠΏ ΡΠ±ΠΎΡΠ° Π΄Π°Π½Π½ΡΡ β ΠΎΠ½ΠΈ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½Ρ Π½Π° ΠΏΠ»Π°ΡΡΠΎΡΠΌΠ΅. ΠΠ°ΠΌ Π½ΡΠΆΠ½ΠΎ ΠΈΡ Π·Π°Π³ΡΡΠ·ΠΈΡΡ ΠΈ ΠΌΠΎΠΆΠ½ΠΎ Π½Π°ΡΠ°ΡΡ ΡΠ°Π±ΠΎΡΡ!
Π‘Π΄Π΅Π»Π°ΡΡ ΡΡΠΎ ΠΌΠΎΠΆΠ½ΠΎ ΡΠ»Π΅Π΄ΡΡΡΠΈΠΌ ΠΎΠ±ΡΠ°Π·ΠΎΠΌ:
Π²ΠΎ Π²ΠΊΠ»Π°Π΄ΠΊΠ΅ Data ΡΠ°ΡΠΏΠΎΠ»ΠΎΠΆΠ΅Π½Ρ ΡΠ°ΠΉΠ»Ρ, Π² ΠΊΠΎΡΠΎΡΡΡ ΡΠΎΠ΄Π΅ΡΠΆΠ°ΡΡΡ Π΄Π°Π½Π½ΡΠ΅
ΠΠ°Π³ΡΡΠ·ΠΈΠ»ΠΈ Π΄Π°Π½Π½ΡΠ΅, ΠΏΠΎΠ΄Π³ΠΎΡΠΎΠ²ΠΈΠ»ΠΈ Π½Π°ΡΠΈ Jupyter ΡΠ΅ΡΡΠ°Π΄ΠΊΠΈ ΠΈβ¦
Π¨Π°Π³ Π²ΡΠΎΡΠΎΠΉ
ΠΠ°ΠΊ Π½Π°ΠΌ ΡΠ΅ΠΏΠ΅ΡΡ Π·Π°Π³ΡΡΠ·ΠΈΡΡ ΡΡΠΈ Π΄Π°Π½Π½ΡΠ΅?
ΠΠΎ-ΠΏΠ΅ΡΠ²ΡΡ , ΠΈΠΌΠΏΠΎΡΡΠΈΡΡΠ΅ΠΌ Π½Π΅ΠΎΠ±Ρ ΠΎΠ΄ΠΈΠΌΡΠ΅ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠΈ:
import pandas as pd
import numpy as np
Pandas ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΡ Π½Π°ΠΌ Π·Π°Π³ΡΡΠ·ΠΈΡΡ .csv ΡΠ°ΠΉΠ»Ρ Π΄Π»Ρ Π΄Π°Π»ΡΠ½Π΅ΠΉΡΠ΅ΠΌ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΈ.
Numpy Π½ΡΠΆΠ΅Π½ Π΄Π»Ρ ΡΠΎΠ³ΠΎ, ΡΡΠΎΠ±Ρ ΠΏΡΠ΅Π΄ΡΡΠ°Π²ΠΈΡΡ Π½Π°ΡΡ ΡΠ°Π±Π»ΠΈΡΡ Π΄Π°Π½Π½ΡΡ
Π² Π²ΠΈΠ΄Π΅ ΠΌΠ°ΡΡΠΈΡΡ Ρ ΡΠΈΡΠ»Π°ΠΌΠΈ.
ΠΠ΄ΡΠΌ Π΄Π°Π»ΡΡΠ΅. ΠΠΎΠ·ΡΠΌΡΠΌ ΡΠ°ΠΉΠ» train.csv ΠΈ Π·Π°Π³ΡΡΠ·ΠΈΠΌ Π΅Π³ΠΎ ΠΊ Π½Π°ΠΌ:
dataset = pd.read_csv('train.csv')
ΠΡ Π±ΡΠ΄Π΅ΠΌ ΡΡΡΠ»Π°ΡΡΡΡ ΠΊ Π½Π°ΡΠ΅ΠΉ Π²ΡΠ±ΠΎΡΠΊΠ΅ train.csv Π΄Π°Π½Π½ΡΡ ΡΠ΅ΡΠ΅Π· ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΡΡ dataset. ΠΠ°Π²Π°ΠΉΡΠ΅ Π³Π»ΡΠ½Π΅ΠΌ, ΡΡΠΎ ΡΠ°ΠΌ Π½Π°Ρ ΠΎΠ΄ΠΈΡΡΡ:
dataset.head()
Π€ΡΠ½ΠΊΡΠΈΡ head() ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ Π½Π°ΠΌ ΠΏΡΠΎΡΠΌΠΎΡΡΠ΅ΡΡ ΠΏΠ΅ΡΠ²ΡΠ΅ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΎ ΡΡΡΠΎΠΊ Π΄Π°ΡΠ°ΡΡΠ΅ΠΉΠΌΠ°.
Π‘ΡΠΎΠ±ΡΡ Survived β ΡΡΠΎ, ΠΊΠ°ΠΊ ΡΠ°Π·, Π½Π°ΡΠΈ ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΡ, ΠΊΠΎΡΠΎΡΡΠ΅ Π² ΡΡΠΎΠΌ Π΄Π°ΡΠ°ΡΡΠ΅ΠΉΠΌΠ΅ ΠΈΠ·Π²Π΅ΡΡΠ½Ρ. ΠΠΎ Π²ΠΎΠΏΡΠΎΡΡ Π·Π°Π΄Π°ΡΠΈ Π½Π°ΠΌ Π½ΡΠΆΠ½ΠΎ ΠΏΡΠ΅Π΄ΡΠΊΠ°Π·Π°ΡΡ ΡΡΠΎΠ»Π±Π΅Ρ Survived Π΄Π»Ρ Π΄Π°Π½Π½ΡΡ test.csv. Π ΡΡΠΈΡ Π΄Π°Π½Π½ΡΡ Ρ ΡΠ°Π½ΠΈΡΡΡ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΡ ΠΎ Π΄ΡΡΠ³ΠΈΡ ΠΏΠ°ΡΡΠ°ΠΆΠΈΡΠ°Ρ Π’ΠΈΡΠ°Π½ΠΈΠΊΠ°, Π΄Π»Ρ ΠΊΠΎΡΠΎΡΡΡ Π½Π°ΠΌ, ΡΠ΅ΡΠ°ΡΡΠΈΠΌ Π·Π°Π΄Π°ΡΡ, Π½Π΅ΠΈΠ·Π²Π΅ΡΡΠ½Ρ ΠΈΡΡ ΠΎΠ΄Ρ.
ΠΡΠ°ΠΊ, ΡΠ°Π·Π΄Π΅Π»ΠΈΠΌ Π½Π°ΡΡ ΡΠ°Π±Π»ΠΈΡΡ Π½Π° Π·Π°Π²ΠΈΡΠΈΠΌΡΠ΅ ΠΈ Π½Π΅Π·Π°Π²ΠΈΡΠΈΠΌΡΠ΅ Π΄Π°Π½Π½ΡΠ΅. Π’ΡΡ Π²ΡΡ ΠΏΡΠΎΡΡΠΎ. ΠΠ°Π²ΠΈΡΠΈΠΌΡΠ΅ Π΄Π°Π½Π½ΡΠ΅ β ΡΡΠΎ ΡΠ΅ Π΄Π°Π½Π½ΡΠ΅, ΠΊΠΎΡΠΎΡΡΠ΅ Π·Π°Π²ΠΈΡΡΡ ΠΎΡ Π½Π΅Π·Π°Π²ΠΈΡΠΈΠΌΡΡ ΡΠΎ, ΡΡΠΎ Π½Π°Ρ ΠΎΠ΄ΠΈΡΡΡ Π² ΠΈΡΡ ΠΎΠ΄Π°Ρ . ΠΠ΅Π·Π°Π²ΠΈΡΠΈΠΌΡΠ΅ Π΄Π°Π½Π½ΡΠ΅ β ΡΡΠΎ ΡΠ΅ Π΄Π°Π½Π½ΡΠ΅, ΠΊΠΎΡΠΎΡΡΠ΅ Π²Π»ΠΈΡΡΡ Π½Π° ΠΈΡΡ ΠΎΠ΄.
Π ΠΏΡΠΈΠΌΠ΅ΡΡ, Ρ Π½Π°Ρ Π΅ΡΡΡ ΡΠ°ΠΊΠΎΠΉ Π½Π°Π±ΠΎΡ Π΄Π°Π½Π½ΡΡ :
Β«ΠΠΎΠ²Π° ΡΡΠΈΠ» ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΊΡ β Π½Π΅Ρ.
ΠΠΎΠ²Π° ΠΏΠΎΠ»ΡΡΠΈΠ» ΠΏΠΎ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΊΠ΅ 2.Β»
ΠΡΠ΅Π½ΠΊΠ° ΠΏΠΎ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΊΠ΅ Π·Π°Π²ΠΈΡΠΈΡ ΠΎΡ ΠΎΡΠ²Π΅ΡΠ° Π½Π° Π²ΠΎΠΏΡΠΎΡ: ΡΡΠΈΠ» Π»ΠΈ ΠΠΎΠ²Π° ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΊΡ? Π―ΡΠ½Π΅Π½ΡΠΊΠΎ? ΠΠ²ΠΈΠ³Π°Π΅ΠΌΡΡ Π΄Π°Π»ΡΡΠ΅, ΠΌΡ ΡΠΆΠ΅ Π±Π»ΠΈΠΆΠ΅ ΠΊ ΡΠ΅Π»ΠΈ!
Π’ΡΠ°Π΄ΠΈΡΠΈΠΎΠ½Π½Π°Ρ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½Π°Ρ Π΄Π»Ρ Π½Π΅Π·Π°Π²ΠΈΡΠΈΠΌΡΡ Π΄Π°Π½Π½ΡΡ β Π₯. ΠΠ»Ρ Π·Π°Π²ΠΈΡΠΈΠΌΡΡ β Ρ.
ΠΠ΅Π»Π°Π΅ΠΌ ΡΠ»Π΅Π΄ΡΡΡΠ΅Π΅:
X = dataset.iloc[ : , 2 : ]
y = dataset.iloc[ : , 1 : 2 ]
Π§ΡΠΎ ΡΡΠΎ ΡΠ°ΠΊΠΎΠ΅? Π€ΡΠ½ΠΊΡΠΈΠ΅ΠΉ iloc[:, 2: ] ΠΌΡ Π³ΠΎΠ²ΠΎΡΠΈΠΌ ΠΏΠΈΡΠΎΠ½Ρ: Ρ ΠΎΡΡ Π²ΠΈΠ΄Π΅ΡΡ Π² ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΠΎΠΉ Π₯ Π΄Π°Π½Π½ΡΠ΅, Π½Π°ΡΠΈΠ½Π°ΡΡΠΈΠ΅ΡΡ ΡΠΎ Π²ΡΠΎΡΠΎΠΉ ΡΡΠΎΠ»Π±ΡΠ° (Π²ΠΊΠ»ΡΡΠΈΡΠ΅Π»ΡΠ½ΠΎ ΠΈ ΠΏΡΠΈ ΡΡΠ»ΠΎΠ²ΠΈΠΈ, ΡΡΠΎ ΡΡΡΡ Π½Π°ΡΠΈΠ½Π°Π΅ΡΡΡ Ρ Π½ΡΠ»Ρ). ΠΠΎ Π²ΡΠΎΡΠΎΠΉ ΡΡΡΠΎΠΊΠ΅ Π³ΠΎΠ²ΠΎΡΠΈΠΌ, ΡΡΠΎ Ρ ΠΎΡΠΈΠΌ Π²ΠΈΠ΄Π΅ΡΡ Π² Ρ Π΄Π°Π½Π½ΡΠ΅ ΠΏΠ΅ΡΠ²ΠΎΠ³ΠΎ ΡΡΠΎΠ»Π±ΡΠ°.
[ a:b, c:d ] β ΡΡΠΎ ΠΊΠΎΠ½ΡΡΡΡΠΊΡΠΈΡ ΡΠΎΠ³ΠΎ, ΡΡΠΎ ΠΌΡ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΠΌ Π² ΡΠΊΠΎΠ±ΠΊΠ°Ρ . ΠΡΠ»ΠΈ Π½Π΅ ΡΠΊΠ°Π·ΡΠ²Π°ΡΡ ΠΊΠ°ΠΊΠΈΠ΅-ΡΠΎ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΡΠ΅, ΡΠΎ ΠΎΠ½ΠΈ Π±ΡΠ΄ΡΡ ΡΠΎΡ ΡΠ°Π½ΡΡΡΡΡ Π΄Π΅ΡΠΎΠ»ΡΠ½ΡΠΌΠΈ. Π’ΠΎ Π΅ΡΡΡ ΠΌΡ ΠΌΠΎΠΆΠ΅ΠΌ ΡΠΊΠ°Π·Π°ΡΡ [:,: d] ΠΈ ΡΠΎΠ³Π΄Π° ΠΌΡ ΠΏΠΎΠ»ΡΡΠΈΠΌ Π² Π΄Π°ΡΠ°ΡΡΠ΅ΠΉΠΌΠ΅ Π²ΡΠ΅ ΡΡΠΎΠ»Π±ΡΡ, ΠΊΡΠΎΠΌΠ΅ ΡΠ΅Ρ , ΠΊΠΎΡΠΎΡΡΠ΅ ΠΈΠ΄ΡΡ, Π½Π°ΡΠΈΠ½Π°Ρ Ρ Π½ΠΎΠΌΠ΅ΡΠ° d ΠΈ Π΄Π°Π»ΡΡΠ΅. ΠΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΡΠ΅ a ΠΈ b ΠΎΠΏΡΠ΅Π΄Π΅Π»ΡΡΡ ΡΡΡΠΎΠΊΠΈ, Π½ΠΎ ΠΎΠ½ΠΈ Π½Π°ΠΌ Π²ΡΠ΅ Π½ΡΠΆΠ½Ρ, ΠΏΠΎΡΡΠΎΠΌΡ ΡΡΠΎ ΠΎΡΡΠ°Π²Π»ΡΠ΅ΠΌ Π΄Π΅ΡΠΎΠ»ΡΠ½ΡΠΌ.ΠΠΎΡΠΌΠΎΡΡΠΈΠΌ, ΡΡΠΎ Ρ Π½Π°Ρ Π²ΡΡΠ»ΠΎ:
X.head()
y.head()
ΠΠ»Ρ ΡΠΎΠ³ΠΎ, ΡΡΠΎΠ±Ρ ΡΠΏΡΠΎΡΡΠΈΡΡ ΡΡΠΎΡ Π½Π΅Π±ΠΎΠ»ΡΡΠΎΠΉ ΡΡΠΎΠΊ, ΠΌΡ ΡΠ΄Π°Π»ΠΈΠΌ ΡΡΠΎΠ»Π±ΡΡ, ΠΊΠΎΡΠΎΡΡΠ΅ ΡΡΠ΅Π±ΡΡΡ ΠΎΡΠΎΠ±ΠΎΠ³ΠΎ Β«ΡΡ
ΠΎΠ΄Π°Β», Π»ΠΈΠ±ΠΎ Π²ΠΎΠΎΠ±ΡΠ΅ Π½Π΅ Π²Π»ΠΈΡΡΡ Π½Π° Π²ΡΠΆΠΈΠ²Π°Π΅ΠΌΠΎΡΡΡ. Π Π½ΠΈΡ
ΡΠΎΠ΄Π΅ΡΠΆΠ°ΡΡΡ Π΄Π°Π½Π½ΡΠ΅ ΡΠΈΠΏΠ° str.
count = ['Name', 'Ticket', 'Cabin', 'Embarked']
X.drop(count, inplace=True, axis=1)
Π‘ΡΠΏΠ΅Ρ! ΠΠ΄ΡΠΌ ΠΊ ΡΠ»Π΅Π΄ΡΡΡΠ΅ΠΌΡ ΡΠ°Π³Ρ.
Π¨Π°Π³ ΡΡΠ΅ΡΠΈΠΉ
Π’ΡΡ Π½Π°ΠΌ ΠΏΠΎΡΡΠ΅Π±ΡΠ΅ΡΡΡ Π·Π°ΠΊΠΎΠ΄ΠΈΡΠΎΠ²Π°ΡΡ Π½Π°ΡΠΈ Π΄Π°Π½Π½ΡΠ΅, ΡΡΠΎΠ±Ρ ΠΌΠ°ΡΠΈΠ½Π° Π»ΡΡΡΠ΅ ΠΏΠΎΠ½ΠΈΠΌΠ°Π»Π°, ΠΊΠ°ΠΊ ΡΡΠΈ Π΄Π°Π½Π½ΡΠ΅ Π²Π»ΠΈΡΡΡ Π½Π° ΡΠ΅Π·ΡΠ»ΡΡΠ°Ρ. ΠΠΎ ΠΊΠΎΠ΄ΠΈΡΠΎΠ²Π°ΡΡ Π±ΡΠ΄Π΅ΠΌ Π½Π΅ Π²ΡΠ΅, Π° ΡΠΎΠ»ΡΠΊΠΎ Π΄Π°Π½Π½ΡΠ΅ ΡΠΈΠΏΠ° str, ΠΊΠΎΡΠΎΡΡΠ΅ ΠΌΡ ΠΎΡΡΠ°Π²ΠΈΠ»ΠΈ. Π‘ΡΠΎΠ»Π±Π΅Ρ Β«SexΒ». ΠΠ°ΠΊ ΠΌΡ Ρ ΠΎΡΠΈΠΌ Π·Π°ΠΊΠΎΠ΄ΠΈΡΠΎΠ²Π°ΡΡ? ΠΡΠ΅Π΄ΡΡΠ°Π²ΠΈΠΌ Π΄Π°Π½Π½ΡΠ΅ ΠΎ ΠΏΠΎΠ»Π΅ ΡΠ΅Π»ΠΎΠ²Π΅ΠΊΠ° Π²Π΅ΠΊΡΠΎΡΠΎΠΌ: 10 β ΠΌΡΠΆΡΠΊΠΎΠΉ ΠΏΠΎΠ», 01 β ΠΆΠ΅Π½ΡΠΊΠΈΠΉ ΠΏΠΎΠ».
ΠΠ»Ρ Π½Π°ΡΠ°Π»Π° Π½Π°ΡΠΈ ΡΠ°Π±Π»ΠΈΡΡ ΠΏΠ΅ΡΠ΅Π²Π΅Π΄Π΅ΠΌ Π² ΠΌΠ°ΡΡΠΈΡΡ NumPy:
X = np.array(X)
y = np.array(y)
Π ΡΠ΅ΠΏΠ΅ΡΡ Π³Π»ΡΠ΄ΠΈΠΌ:
from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import OneHotEncoder
ct = ColumnTransformer(transformers=[('encoder', OneHotEncoder(), [1])],
remainder='passthrough')
X = np.array(ct.fit_transform(X))
ΠΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ° sklearn β ΡΡΠΎ ΡΠ°ΠΊΠ°Ρ ΠΊΡΡΡΠ°Ρ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ°, ΠΊΠΎΡΠΎΡΠ°Ρ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ Π½Π°ΠΌ ΠΏΡΠΎΠ²ΠΎΠ΄ΠΈΡΡ ΠΏΠΎΠ»Π½ΡΡ ΡΠ°Π±ΠΎΡΡ Π² Data Science. ΠΠ½Π° ΡΠΎΠ΄Π΅ΡΠΆΠΈΡ Π±ΠΎΠ»ΡΡΠΎΠ΅ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ ΠΈΠ½ΡΠ΅ΡΠ΅ΡΠ½ΡΡ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΌΠ°ΡΠΈΠ½Π½ΠΎΠ³ΠΎ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ, Π° ΡΠ°ΠΊΠΆΠ΅ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ Π½Π°ΠΌ Π·Π°Π½ΡΡΡΡΡ ΠΏΠΎΠ΄Π³ΠΎΡΠΎΠ²ΠΊΠΎΠΉ Π΄Π°Π½Π½ΡΡ .
OneHotEncoder ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΡ Π½Π°ΠΌ Π·Π°ΠΊΠΎΠ΄ΠΈΡΠΎΠ²Π°ΡΡ ΠΏΠΎΠ» ΡΠ΅Π»ΠΎΠ²Π΅ΠΊΠ° Π² ΡΠΎΠΌ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ΠΈΠΈ, ΠΊΠ°ΠΊ ΠΌΡ ΠΈ ΠΎΠΏΠΈΡΠ°Π»ΠΈ. ΠΡΠ΄Π΅Ρ ΡΠΎΠ·Π΄Π°Π½ΠΎ 2 ΠΊΠ»Π°ΡΡΠ°: ΠΌΡΠΆΡΠΊΠΎΠΉ, ΠΆΠ΅Π½ΡΠΊΠΈΠΉ. ΠΡΠ»ΠΈ ΡΠ΅Π»ΠΎΠ²Π΅ΠΊ β ΠΌΡΠΆΡΠΈΠ½Π°, ΡΠΎ Π² ΡΡΠΎΠ»Π±Π΅Ρ Β«ΠΌΡΠΆΡΠΊΠΎΠΉΒ» Π±ΡΠ΄Π΅Ρ Π·Π°ΠΏΠΈΡΠ°Π½Π° 1, Π° Π² Β«ΠΆΠ΅Π½ΡΠΊΠΈΠΉΒ», ΡΠΎΠΎΡΠ²Π΅ΡΡΡΠ²Π΅Π½Π½ΠΎ, 0.
ΠΠΎΡΠ»Π΅ OneHotEncoder() cΡΠΎΠΈΡ [1] β ΡΡΠΎ Π·Π½Π°ΡΠΈΡ, ΡΡΠΎ Ρ ΠΎΡΠΈΠΌ Π·Π°ΠΊΠΎΠ΄ΠΈΡΠΎΠ²Π°ΡΡ ΡΡΠΎΠ»Π±Π΅Ρ Π½ΠΎΠΌΠ΅Ρ 1 (ΡΡΡΡ Ρ Π½ΡΠ»Ρ).
Π‘ΡΠΏΠ΅Ρ. ΠΠ²ΠΈΠ³Π°Π΅ΠΌΡΡ Π΅ΡΠ΅ Π΄Π°Π»ΡΡΠ΅!
ΠΠ°ΠΊ ΠΏΡΠ°Π²ΠΈΠ»ΠΎ, ΡΠ°ΠΊΠΎΠ΅ ΡΠ»ΡΡΠ°Π΅ΡΡΡ, ΡΡΠΎ Π½Π΅ΠΊΠΎΡΠΎΡΡΠ΅ Π΄Π°Π½Π½ΡΠ΅ ΠΎΡΡΠ°ΡΡΡΡ Π½Π΅Π·Π°ΠΏΠΎΠ»Π½Π΅Π½Π½ΡΠΌΠΈ(ΡΠΎ Π΅ΡΡΡ NaN β not a number). ΠΠ°ΠΏΡΠΈΠΌΠ΅Ρ, Π΅ΡΡΡ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΡ ΠΎ ΡΠ΅Π»ΠΎΠ²Π΅ΠΊΠ΅: Π΅Π³ΠΎ ΠΈΠΌΡ, ΠΏΠΎΠ». Π Π²ΠΎΡ Π΄Π°Π½Π½ΡΡ ΠΎ Π΅Π³ΠΎ Π²ΠΎΠ·ΡΠ°ΡΡΠ΅ Π½Π΅Ρ. Π ΡΠ°ΠΊΠΎΠΌ ΡΠ»ΡΡΠ°Π΅ ΠΌΡ ΠΏΡΠΈΠΌΠ΅Π½ΠΈΠΌ ΡΠ°ΠΊΠΎΠΉ ΠΌΠ΅ΡΠΎΠ΄: Π½Π°ΠΉΠ΄Π΅ΠΌ ΡΡΠ΅Π΄Π½Π΅Π΅ Π°ΡΠΈΡΠΌΠ΅ΡΠΈΡΠ΅ΡΠΊΠΎΠ΅ ΠΏΠΎ Π²ΡΠ΅ΠΌ ΡΡΠΎΠ»Π±ΡΠ°ΠΌ ΠΈ, Π΅ΡΠ»ΠΈ Π΄Π°Π½Π½ΡΠ΅ ΠΊΠ°ΠΊΠΈΠ΅-ΡΠΎ Π² ΡΡΠΎΠ»Π±ΡΠ΅ ΠΏΡΠΎΠΏΡΡΠ΅Π½Ρ, ΡΠΎ Π·Π°ΠΏΠΎΠ»Π½ΠΈΠΌ ΠΏΡΡΡΠΎΡΡ ΡΡΠ΅Π΄Π½ΠΈΠΌ Π°ΡΠΈΡΠΌΠ΅ΡΠΈΡΠ΅ΡΠΊΠΈΠΌ.
from sklearn.impute import SimpleImputer
imputer = SimpleImputer(missing_values=np.nan, strategy='mean')
imputer.fit(X)
X = imputer.transform(X)
Π ΡΠ΅ΠΏΠ΅ΡΡ Π²ΠΎΠ·ΡΠΌΠ΅ΠΌ Π² ΡΡΠ΅Ρ, ΡΡΠΎ ΡΠ»ΡΡΠ°ΡΡΡΡ ΡΠ°ΠΊΠΈΠ΅ ΡΠΈΡΡΠ°ΡΠΈΠΈ, ΠΊΠΎΠ³Π΄Π° Π΄Π°Π½Π½ΡΠ΅ ΠΎΡΠ΅Π½Ρ ΡΠΈΠ»ΡΠ½ΠΎ ΡΠ°Π·ΡΠΎΡΠ°Π½Ρ. ΠΠ°ΠΊΠΈΠ΅-ΡΠΎ Π΄Π°Π½Π½ΡΠ΅ Π½Π°Ρ ΠΎΠ΄ΡΡΡΡ Π² ΠΎΡΡΠ΅Π·ΠΊΠ΅ [0:1], Π° ΠΊΠ°ΠΊΠΈΠ΅-ΡΠΎ ΠΌΠΎΠ³ΡΡ Π·Π°Ρ ΠΎΠ΄ΠΈΡΡ Π·Π° ΡΠΎΡΠ½ΠΈ ΠΈ ΡΡΡΡΡΠΈ. Π§ΡΠΎΠ±Ρ ΠΈΡΠΊΠ»ΡΡΠΈΡΡ ΡΠ°ΠΊΠΎΠΉ ΡΠ°Π·Π±ΡΠΎΡ ΠΈ ΠΊΠΎΠΌΠΏΡΡΡΠ΅Ρ Π±ΡΠ» ΡΠΎΡΠ½Π΅Π΅ Π² ΡΠ°ΡΡΡΡΠ°Ρ , ΠΌΡ ΠΏΡΠΎΡΠΊΠ°Π»ΠΈΡΡΠ΅ΠΌ Π΄Π°Π½Π½ΡΠ΅, ΠΎΡΠΌΠ°ΡΡΡΠ°Π±ΠΈΡΡΠ΅ΠΌ. ΠΡΡΡΡ Π²ΡΠ΅ ΡΠΈΡΠ»Π° Π½Π΅ Π±ΡΠ΄ΡΡ ΠΏΡΠ΅Π²ΡΡΠ°ΡΡ ΡΡΡΡ . ΠΠ»Ρ ΡΡΠΎΠ³ΠΎ Π²ΠΎΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΠΌΡΡ ΡΡΠ½ΠΊΡΠΈΠ΅ΠΉ StandartScaler.
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X[:, 2:] = sc.fit_transform(X[:, 2:])
Π’Π΅ΠΏΠ΅ΡΡ Π½Π°ΡΠΈ Π΄Π°Π½Π½ΡΠ΅ Π²ΡΠ³Π»ΡΠ΄ΡΡ ΡΠ°ΠΊ:
ΠΠ»Π°ΡΡ. ΠΡ ΡΠΆΠ΅ Π±Π»ΠΈΠ·ΠΊΠΎ ΠΊ Π½Π°ΡΠ΅ΠΉ ΡΠ΅Π»ΠΈ!
Π¨Π°Π³ ΡΠ΅ΡΠ²ΡΡΡΡΠΉ
ΠΠ±ΡΡΠΈΠΌ Π½Π°ΡΡ ΠΏΠ΅ΡΠ²ΡΡ ΠΌΠΎΠ΄Π΅Π»Ρ! ΠΠ· Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠΈ sklearn ΠΌΡ ΠΌΠΎΠΆΠ΅ΠΌ Π½Π°ΠΉΡΠΈ ΠΎΠ³ΡΠΎΠΌΠ½ΠΎΠ΅ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ ΠΈΠ½ΡΠ΅ΡΠ΅ΡΠ½ΠΎΡΡΠ΅ΠΉ. Π― ΠΏΡΠΈΠΌΠ΅Π½ΠΈΠ» ΠΊ Π΄Π°Π½Π½ΠΎΠΉ Π·Π°Π΄Π°ΡΠ΅ ΠΌΠΎΠ΄Π΅Π»Ρ Gradient Boosting Classifier. A classifier ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΠΌ, ΠΏΠΎΡΠΊΠΎΠ»ΡΠΊΡ Π½Π°ΡΠ° Π·Π°Π΄Π°ΡΠ° β ΡΡΠΎ Π·Π°Π΄Π°ΡΠ° ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ. ΠΡΠΆΠ½ΠΎ ΠΏΡΠΎΠ³Π½ΠΎΠ· ΠΎΡΠ½Π΅ΡΡΠΈ ΠΊ 1 (Π²ΡΠΆΠΈΠ») ΠΈΠ»ΠΈ 0 (Π½Π΅ Π²ΡΠΆΠΈΠ»).
from sklearn.ensemble import GradientBoostingClassifier
gbc = GradientBoostingClassifier(learning_rate=0.5, max_depth=5, n_estimators=150)
gbc.fit(X, y)
Π€ΡΠ½ΠΊΡΠΈΡ fit Π³ΠΎΠ²ΠΎΡΠΈΡ ΠΏΠΈΡΠΎΠ½Ρ: ΠΡΡΡΡ ΠΌΠΎΠ΄Π΅Π»Ρ ΠΈΡΠ΅Ρ Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡΠΈ ΠΌΠ΅ΠΆΠ΄Ρ X ΠΈ Ρ.
ΠΠ΅Π½ΡΡΠ΅ ΡΠ΅ΠΊΡΠ½Π΄Ρ ΠΈ ΠΌΠΎΠ΄Π΅Π»Ρ Π³ΠΎΡΠΎΠ²Π°.
ΠΠ°ΠΊ Π΅Ρ ΠΏΡΠΈΠΌΠ΅Π½ΠΈΡΡ? Π‘Π΅ΠΉΡΠ°Ρ ΡΠ²ΠΈΠ΄ΠΈΠΌ!
Π¨Π°Π³ ΠΏΡΡΡΠΉ. ΠΠ°ΠΊΠ»ΡΡΠ΅Π½ΠΈΠ΅
Π’Π΅ΠΏΠ΅ΡΡ Π½Π°ΠΌ Π½ΡΠΆΠ½ΠΎ Π·Π°Π³ΡΡΠ·ΠΈΡΡ ΡΠ°Π±Π»ΠΈΡΡ Ρ Π½Π°ΡΠΈΠΌΠΈ ΡΠ΅ΡΡΠΎΠ²ΡΠΌΠΈ Π΄Π°Π½Π½ΡΠΌΠΈ, Π΄Π»Ρ ΠΊΠΎΡΠΎΡΡΡ Π½ΡΠΆΠ½ΠΎ ΡΠΎΡΡΠ°Π²ΠΈΡΡ ΠΏΡΠΎΠ³Π½ΠΎΠ·. Π‘ ΡΡΠΎΠΉ ΡΠ°Π±Π»ΠΈΡΠ΅ΠΉ ΠΏΡΠΎΠ΄Π΅Π»Π°Π΅ΠΌ Π²ΡΠ΅ ΡΠ΅ ΠΆΠ΅ ΡΠ°ΠΌΡΠ΅ Π΄Π΅ΠΉΡΡΠ²ΠΈΡ, ΠΊΠΎΡΠΎΡΡΠ΅ ΠΌΡ Π΄Π΅Π»Π°Π»ΠΈ Π΄Π»Ρ X.
X_test = pd.read_csv('test.csv', index_col=0)
count = ['Name', 'Ticket', 'Cabin', 'Embarked']
X_test.drop(count, inplace=True, axis=1)
X_test = np.array(X_test)
from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import OneHotEncoder
ct = ColumnTransformer(transformers=[('encoder', OneHotEncoder(), [1])],
remainder='passthrough')
X_test = np.array(ct.fit_transform(X_test))
from sklearn.impute import SimpleImputer
imputer = SimpleImputer(missing_values=np.nan, strategy='mean')
imputer.fit(X_test)
X_test = imputer.transform(X_test)
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_test[:, 2:] = sc.fit_transform(X_test[:, 2:])
ΠΡΠΈΠΌΠ΅Π½ΠΈΠΌ ΠΆΠ΅ ΡΠΆΠ΅ Π½Π°ΡΡ ΠΌΠΎΠ΄Π΅Π»Ρ!
gbc_predict = gbc.predict(X_test)
ΠΡΡ. ΠΡ ΡΠΎΡΡΠ°Π²ΠΈΠ»ΠΈ ΠΏΡΠΎΠ³Π½ΠΎΠ·. Π’Π΅ΠΏΠ΅ΡΡ Π΅Π³ΠΎ Π½ΡΠΆΠ½ΠΎ Π·Π°ΠΏΠΈΡΠ°ΡΡ Π² csv ΠΈ ΠΎΡΠΏΡΠ°Π²ΠΈΡΡ Π½Π° ΡΠ°ΠΉΡ.
np.savetxt('my_gbc_predict.csv', gbc_predict, delimiter=",", header = 'Survived')
ΠΠΎΡΠΎΠ²ΠΎ. ΠΠΎΠ»ΡΡΠΈΠ»ΠΈ ΡΠ°ΠΉΠ», ΡΠΎΠ΄Π΅ΡΠΆΠ°ΡΠΈΠΉ Π² ΡΠ΅Π±Π΅ ΠΏΡΠ΅Π΄ΡΠΊΠ°Π·Π°Π½ΠΈΡ Π΄Π»Ρ ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ ΠΏΠ°ΡΡΠ°ΠΆΠΈΡΠ°. ΠΡΡΠ°Π»ΠΎΡΡ Π·Π°Π»ΠΈΡΡ ΡΡΠΈ ΡΠ΅ΡΠ΅Π½ΠΈΡ Π½Π° ΡΠ°ΠΉΡ ΠΈ ΠΏΠΎΠ»ΡΡΠΈΡΡ ΠΎΡΠ΅Π½ΠΊΡ ΠΏΡΠΎΠ³Π½ΠΎΠ·Π°. Π’Π°ΠΊΠΎΠ΅ ΠΏΡΠΈΠΌΠΈΡΠΈΠ²Π½ΠΎΠ΅ ΡΠ΅ΡΠ΅Π½ΠΈΠ΅ Π΄Π°ΡΡ Π½Π΅ ΡΠΎΠ»ΡΠΊΠΎ 74% ΠΏΡΠ°Π²ΠΈΠ»ΡΠ½ΡΡ
ΠΎΡΠ²Π΅ΡΠΎΠ² Π½Π° ΠΏΠ°Π±Π»ΠΈΠΊΠ΅, Π½ΠΎ ΡΠ°ΠΊΠΆΠ΅ ΠΈ Π½Π΅ΠΊΠΎΡΠΎΡΡΠΉ ΡΠΎΠ»ΡΠΎΠΊ Π² Data Science. Π‘Π°ΠΌΡΠ΅ Π»ΡΠ±ΠΎΠΏΡΡΠ½ΡΠ΅ ΠΌΠΎΠ³ΡΡ Π² Π»ΡΠ±ΠΎΠ΅ Π²ΡΠ΅ΠΌΡ Π½Π°ΠΏΠΈΡΠ°ΡΡ ΠΌΠ½Π΅ Π² Π»ΠΈΡΠ½ΡΠ΅ ΡΠΎΠΎΠ±ΡΠ΅Π½ΠΈΡ ΠΈ Π·Π°Π΄Π°ΡΡ Π²ΠΎΠΏΡΠΎΡ. ΠΡΠ΅ΠΌ ΡΠΏΠ°ΡΠΈΠ±ΠΎ!
ΠΡΡΠΎΡΠ½ΠΈΠΊ: habr.com