Π’Π°ΡˆΠΈΠΎΡ‚ ΠΏΡ€Π² Ρ‡Π΅ΠΊΠΎΡ€ Π²ΠΎ Π½Π°ΡƒΠΊΠ°Ρ‚Π° Π·Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ. Π’ΠΈΡ‚Π°Π½ΠΈΠΊ

ΠšΡ€Π°Ρ‚ΠΎΠΊ Π²ΠΎΠ²Π΅Π΄Π΅Π½ Π·Π±ΠΎΡ€

Π’Π΅Ρ€ΡƒΠ²Π°ΠΌ Π΄Π΅ΠΊΠ° Π±ΠΈ ΠΌΠΎΠΆΠ΅Π»Π΅ Π΄Π° Π½Π°ΠΏΡ€Π°Π²ΠΈΠΌΠ΅ повСќС Ρ€Π°Π±ΠΎΡ‚ΠΈ Π΄ΠΎΠΊΠΎΠ»ΠΊΡƒ Π½ΠΈ Π±ΠΈΠ΄Π°Ρ‚ Π΄Π°Π΄Π΅Π½ΠΈ Ρ‡Π΅ΠΊΠΎΡ€-ΠΏΠΎ-Ρ‡Π΅ΠΊΠΎΡ€ инструкции ΠΊΠΎΠΈ ќС Π½ΠΈ ΠΊΠ°ΠΆΠ°Ρ‚ ΡˆΡ‚ΠΎ Π΄Π° ΠΏΡ€Π°Π²ΠΈΠΌΠ΅ ΠΈ ΠΊΠ°ΠΊΠΎ Π΄Π° Π³ΠΎ ΠΏΡ€Π°Π²ΠΈΠΌΠ΅ Ρ‚ΠΎΠ°. Π‘Π΅ сСќавам Π½Π° ΠΌΠΎΠΌΠ΅Π½Ρ‚ΠΈ ΠΎΠ΄ ΠΌΠΎΡ˜ΠΎΡ‚ ΠΆΠΈΠ²ΠΎΡ‚ ΠΊΠΎΠ³Π° Π½Π΅ ΠΌΠΎΠΆΠ΅Π² Π΄Π° Π·Π°ΠΏΠΎΡ‡Π½Π°ΠΌ Π½Π΅ΡˆΡ‚ΠΎ Π·Π°Ρ‚ΠΎΠ° ΡˆΡ‚ΠΎ бСшС Сдноставно Ρ‚Π΅ΡˆΠΊΠΎ Π΄Π° сС Ρ€Π°Π·Π±Π΅Ρ€Π΅ ΠΎΠ΄ ΠΊΠ°Π΄Π΅ Π΄Π° ΠΏΠΎΡ‡Π½Π°ΠΌ. МоТСби нСкогаш Π½Π° Π˜Π½Ρ‚Π΅Ρ€Π½Π΅Ρ‚ стС Π³ΠΈ Π²ΠΈΠ΄Π΅Π»Π΅ Π·Π±ΠΎΡ€ΠΎΠ²ΠΈΡ‚Π΅ β€žΠΠ°ΡƒΠΊΠ° Π·Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈβ€œ ΠΈ Ρ€Π΅ΡˆΠΈΠ²Ρ‚Π΅ Π΄Π΅ΠΊΠ° стС Π΄Π°Π»Π΅ΠΊΡƒ ΠΎΠ΄ ΠΎΠ²Π°, Π° Π»ΡƒΡ“Π΅Ρ‚ΠΎ ΡˆΡ‚ΠΎ Π³ΠΎ ΠΏΡ€Π°Π²Π°Ρ‚ Ρ‚ΠΎΠ° Π±ΠΈΠ»Π΅ Π½Π΅ΠΊΠ°Π΄Π΅ Ρ‚Π°ΠΌΡƒ, Π²ΠΎ Π΄Ρ€ΡƒΠ³ свСт. НС, Ρ‚ΠΈΠ΅ сС Ρ‚ΡƒΠΊΠ°. И, ΠΌΠΎΠΆΠ΅Π±ΠΈ, Π±Π»Π°Π³ΠΎΠ΄Π°Ρ€Π΅Π½ΠΈΠ΅ Π½Π° Π»ΡƒΡ“Π΅Ρ‚ΠΎ ΠΎΠ΄ ΠΎΠ²Π°Π° област, сС појави ΡΡ‚Π°Ρ‚ΠΈΡ˜Π° Π½Π° Π²Π°ΡˆΠ°Ρ‚Π° Ρ…Ρ€Π°Π½Π°. Има ΠΌΠ½ΠΎΠ³Ρƒ курсСви ΠΊΠΎΠΈ ќС Π²ΠΈ ΠΏΠΎΠΌΠΎΠ³Π½Π°Ρ‚ Π΄Π° сС Π½Π°Π²ΠΈΠΊΠ½Π΅Ρ‚Π΅ Π½Π° овој Π·Π°Π½Π°Π΅Ρ‚, Π½ΠΎ Ρ‚ΡƒΠΊΠ° ќС Π²ΠΈ ΠΏΠΎΠΌΠΎΠ³Π½Π°ΠΌ Π΄Π° Π³ΠΎ Π½Π°ΠΏΡ€Π°Π²ΠΈΡ‚Π΅ ΠΏΡ€Π²ΠΈΠΎΡ‚ Ρ‡Π΅ΠΊΠΎΡ€.

Па, Π΄Π°Π»ΠΈ стС ΠΏΠΎΠ΄Π³ΠΎΡ‚Π²Π΅Π½ΠΈ? Π’Π΅Π΄Π½Π°Ρˆ Π΄Π° Π²ΠΈ ΠΊΠ°ΠΆΠ°ΠΌ Π΄Π΅ΠΊΠ° ќС Ρ‚Ρ€Π΅Π±Π° Π΄Π° Π³ΠΎ Π·Π½Π°Π΅Ρ‚Π΅ Python 3, бидСјќи Ρ‚ΠΎΠ° Π΅ ΠΎΠ½Π° ΡˆΡ‚ΠΎ ќС Π³ΠΎ користам ΠΎΠ²Π΄Π΅. Π˜ΡΡ‚ΠΎ Ρ‚Π°ΠΊΠ°, Π²Π΅ совСтувам ΠΎΠ΄Π½Π°ΠΏΡ€Π΅Π΄ Π΄Π° Π³ΠΎ инсталиратС Π½Π° Jupyter Notebook ΠΈΠ»ΠΈ Π΄Π° Π²ΠΈΠ΄ΠΈΡ‚Π΅ ΠΊΠ°ΠΊΠΎ Π΄Π° користитС google colab.

Π§Π΅ΠΊΠΎΡ€ Π΅Π΄Π΅Π½

Π’Π°ΡˆΠΈΠΎΡ‚ ΠΏΡ€Π² Ρ‡Π΅ΠΊΠΎΡ€ Π²ΠΎ Π½Π°ΡƒΠΊΠ°Ρ‚Π° Π·Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ. Π’ΠΈΡ‚Π°Π½ΠΈΠΊ

Kaggle Π΅ Π²Π°ΡˆΠΈΠΎΡ‚ Π·Π½Π°Ρ‡Π°Π΅Π½ асистСнт Π²ΠΎ ΠΎΠ²Π° ΠΏΡ€Π°ΡˆΠ°ΡšΠ΅. Π’ΠΎ ΠΏΡ€ΠΈΠ½Ρ†ΠΈΠΏ, ΠΌΠΎΠΆΠ΅Ρ‚Π΅ Π΄Π° Π½Π°ΠΏΡ€Π°Π²ΠΈΡ‚Π΅ Π±Π΅Π· Π½Π΅Π³ΠΎ, Π½ΠΎ јас ќС Π·Π±ΠΎΡ€ΡƒΠ²Π°ΠΌ Π·Π° ΠΎΠ²Π° Π²ΠΎ Π΄Ρ€ΡƒΠ³Π° ΡΡ‚Π°Ρ‚ΠΈΡ˜Π°. Ова Π΅ ΠΏΠ»Π°Ρ‚Ρ„ΠΎΡ€ΠΌΠ° која Π΅ домаќин Π½Π° Π½Π°Ρ‚ΠΏΡ€Π΅Π²Π°Ρ€ΠΈ Π·Π° Data Science. Π’ΠΎ сСкој Ρ‚Π°ΠΊΠΎΠ² Π½Π°Ρ‚ΠΏΡ€Π΅Π²Π°Ρ€, Π²ΠΎ Ρ€Π°Π½ΠΈΡ‚Π΅ Ρ„Π°Π·ΠΈ ќС стСкнСтС Π½Π΅Ρ€Π΅Π°Π»Π½ΠΎ искуство Π²ΠΎ Ρ€Π΅ΡˆΠ°Π²Π°ΡšΠ΅ Π½Π° ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠΈ ΠΎΠ΄ Ρ€Π°Π·Π»ΠΈΡ‡Π½ΠΈ Π²ΠΈΠ΄ΠΎΠ²ΠΈ, Ρ€Π°Π·Π²ΠΎΡ˜Π½ΠΎ искуство ΠΈ искуство Π²ΠΎ тимска Ρ€Π°Π±ΠΎΡ‚Π°, ΡˆΡ‚ΠΎ Π΅ Π²Π°ΠΆΠ½ΠΎ Π²ΠΎ нашС Π²Ρ€Π΅ΠΌΠ΅.

Од Ρ‚Π°ΠΌΡƒ ќС си ја ΠΏΡ€Π΅Π·Π΅ΠΌΠ΅ΠΌΠ΅ Π·Π°Π΄Π°Ρ‡Π°Ρ‚Π°. Π‘Π΅ Π²ΠΈΠΊΠ° β€žΠ’ΠΈΡ‚Π°Π½ΠΈΠΊβ€œ. Условот Π΅ овој: ΠΏΡ€Π΅Π΄Π²ΠΈΠ΄Π΅Ρ‚Π΅ Π΄Π°Π»ΠΈ сСкој ΠΏΠΎΠ΅Π΄ΠΈΠ½Π΅Ρ† ќС ΠΏΡ€Π΅ΠΆΠΈΠ²Π΅Π΅. ΠžΠΏΡˆΡ‚ΠΎ Π·Π΅ΠΌΠ΅Π½ΠΎ, Π·Π°Π΄Π°Ρ‡Π°Ρ‚Π° Π½Π° Π»ΠΈΡ†Π΅Ρ‚ΠΎ Π²ΠΊΠ»ΡƒΡ‡Π΅Π½ΠΎ Π²ΠΎ Π”Π‘ Π΅ ΡΠΎΠ±ΠΈΡ€Π°ΡšΠ΅ ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ, Π½ΠΈΠ²Π½Π° ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ°, ΠΎΠ±ΡƒΠΊΠ° Π½Π° ΠΌΠΎΠ΄Π΅Π», ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€Π°ΡšΠ΅ ΠΈΡ‚Π½. Π’ΠΎ kaggle, Π½ΠΈ Π΅ Π΄ΠΎΠ·Π²ΠΎΠ»Π΅Π½ΠΎ Π΄Π° ја прСскокнСмС Ρ„Π°Π·Π°Ρ‚Π° Π½Π° ΡΠΎΠ±ΠΈΡ€Π°ΡšΠ΅ ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ - Ρ‚ΠΈΠ΅ сС прСтставСни Π½Π° ΠΏΠ»Π°Ρ‚Ρ„ΠΎΡ€ΠΌΠ°Ρ‚Π°. Π’Ρ€Π΅Π±Π° Π΄Π° Π³ΠΈ ΠΏΡ€Π΅Π·Π΅ΠΌΠ΅ΠΌΠ΅ ΠΈ ΠΌΠΎΠΆΠ΅ΠΌΠ΅ Π΄Π° Π·Π°ΠΏΠΎΡ‡Π½Π΅ΠΌΠ΅!

ΠœΠΎΠΆΠ΅Ρ‚Π΅ Π΄Π° Π³ΠΎ Π½Π°ΠΏΡ€Π°Π²ΠΈΡ‚Π΅ ΠΎΠ²Π° Π½Π° слСдниов Π½Π°Ρ‡ΠΈΠ½:

Ρ‚Π°Π±ΠΎΡ‚ ΠŸΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ содрТи Π΄Π°Ρ‚ΠΎΡ‚Π΅ΠΊΠΈ ΡˆΡ‚ΠΎ содрТат ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ

Π’Π°ΡˆΠΈΠΎΡ‚ ΠΏΡ€Π² Ρ‡Π΅ΠΊΠΎΡ€ Π²ΠΎ Π½Π°ΡƒΠΊΠ°Ρ‚Π° Π·Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ. Π’ΠΈΡ‚Π°Π½ΠΈΠΊ

Π’Π°ΡˆΠΈΠΎΡ‚ ΠΏΡ€Π² Ρ‡Π΅ΠΊΠΎΡ€ Π²ΠΎ Π½Π°ΡƒΠΊΠ°Ρ‚Π° Π·Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ. Π’ΠΈΡ‚Π°Π½ΠΈΠΊ

Π“ΠΈ ΠΏΡ€Π΅Π·Π΅ΠΌΠ°Π²ΠΌΠ΅ ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈΡ‚Π΅, Π³ΠΈ ΠΏΠΎΠ΄Π³ΠΎΡ‚Π²ΠΈΠ²ΠΌΠ΅ Π½Π°ΡˆΠΈΡ‚Π΅ Jupyter Ρ‚Π΅Ρ‚Ρ€Π°Ρ‚ΠΊΠΈ ΠΈ ...

Π§Π΅ΠΊΠΎΡ€ Π΄Π²Π°

Како сСга Π΄Π° Π³ΠΈ Π²Ρ‡ΠΈΡ‚Π°ΠΌΠ΅ ΠΎΠ²ΠΈΠ΅ ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ?

ΠŸΡ€Π²ΠΎ, Π΄Π° Π³ΠΈ ΡƒΠ²Π΅Π·Π΅ΠΌΠ΅ ΠΏΠΎΡ‚Ρ€Π΅Π±Π½ΠΈΡ‚Π΅ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠΈ:

import pandas as pd
import numpy as np

Pandas ќС Π½ΠΈ ΠΎΠ²ΠΎΠ·ΠΌΠΎΠΆΠ°Ρ‚ Π΄Π° ΠΏΡ€Π΅Π·Π΅ΠΌΠ°ΠΌΠ΅ .csv Π΄Π°Ρ‚ΠΎΡ‚Π΅ΠΊΠΈ Π·Π° ΠΏΠΎΠ½Π°Ρ‚Π°ΠΌΠΎΡˆΠ½Π° ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ°.

Numpy Π΅ ΠΏΠΎΡ‚Ρ€Π΅Π±Π΅Π½ Π·Π° Π΄Π° ја прСтстави Π½Π°ΡˆΠ°Ρ‚Π° Ρ‚Π°Π±Π΅Π»Π° со ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ ΠΊΠ°ΠΊΠΎ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π° со Π±Ρ€ΠΎΠ΅Π²ΠΈ.
Π‘Π°ΠΌΠΎ Π½Π°ΠΏΡ€Π΅Π΄. Π”Π° ја Π·Π΅ΠΌΠ΅ΠΌΠ΅ Π΄Π°Ρ‚ΠΎΡ‚Π΅ΠΊΠ°Ρ‚Π° train.csv ΠΈ Π΄Π° ја ΠΏΠΎΠ΄ΠΈΠ³Π½Π΅ΠΌΠ΅ кај нас:

dataset = pd.read_csv('train.csv')

ЌС сС ΠΏΠΎΠ²ΠΈΠΊΠ°ΠΌΠ΅ Π½Π° Π½Π°ΡˆΠΈΠΎΡ‚ ΠΈΠ·Π±ΠΎΡ€ Π½Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ train.csv ΠΏΡ€Π΅ΠΊΡƒ ΠΏΡ€ΠΎΠΌΠ΅Π½Π»ΠΈΠ²Π°Ρ‚Π° Π½Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ. АјдС Π΄Π° Π²ΠΈΠ΄ΠΈΠΌΠ΅ ΡˆΡ‚ΠΎ ΠΈΠΌΠ° Ρ‚Π°ΠΌΡƒ:

dataset.head()

Π’Π°ΡˆΠΈΠΎΡ‚ ΠΏΡ€Π² Ρ‡Π΅ΠΊΠΎΡ€ Π²ΠΎ Π½Π°ΡƒΠΊΠ°Ρ‚Π° Π·Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ. Π’ΠΈΡ‚Π°Π½ΠΈΠΊ

Π€ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π°Ρ‚Π° head() Π½ΠΈ ΠΎΠ²ΠΎΠ·ΠΌΠΎΠΆΡƒΠ²Π° Π΄Π° Π³ΠΈ ΠΏΠΎΠ³Π»Π΅Π΄Π½Π΅ΠΌΠ΅ ΠΏΡ€Π²ΠΈΡ‚Π΅ Π½Π΅ΠΊΠΎΠ»ΠΊΡƒ Ρ€Π΅Π΄ΠΎΠ²ΠΈ ΠΎΠ΄ ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ‡Π½Π°Ρ‚Π° Ρ€Π°ΠΌΠΊΠ°.

ΠšΠΎΠ»ΠΎΠ½ΠΈΡ‚Π΅ Survived сС Ρ‚ΠΎΠΊΠΌΡƒ Π½Π°ΡˆΠΈΡ‚Π΅ Ρ€Π΅Π·ΡƒΠ»Ρ‚Π°Ρ‚ΠΈ, ΠΊΠΎΠΈ сС ΠΏΠΎΠ·Π½Π°Ρ‚ΠΈ Π²ΠΎ ΠΎΠ²Π°Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ‡Π½Π° Ρ€Π°ΠΌΠΊΠ°. Π—Π° ΠΏΡ€Π°ΡˆΠ°ΡšΠ΅Ρ‚ΠΎ Π·Π° Π·Π°Π΄Π°Ρ‡Π°Ρ‚Π°, Ρ‚Ρ€Π΅Π±Π° Π΄Π° ја ΠΏΡ€Π΅Π΄Π²ΠΈΠ΄ΠΈΠΌΠ΅ ΠΊΠΎΠ»ΠΎΠ½Π°Ρ‚Π° Survived Π·Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ test.csv. ОвиС ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ Ρ‡ΡƒΠ²Π°Π°Ρ‚ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ Π·Π° Π΄Ρ€ΡƒΠ³ΠΈ ΠΏΠ°Ρ‚Π½ΠΈΡ†ΠΈ Π½Π° Π’ΠΈΡ‚Π°Π½ΠΈΠΊ, Π·Π° ΠΊΠΎΠΈ Π½ΠΈΠ΅, Ρ€Π΅ΡˆΠ°Π²Π°Ρ˜ΡœΠΈ Π³ΠΎ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠΎΡ‚, Π½Π΅ Π³ΠΎ Π·Π½Π°Π΅ΠΌΠ΅ исходот.

Π—Π½Π°Ρ‡ΠΈ, ајдС Π΄Π° ја ΠΏΠΎΠ΄Π΅Π»ΠΈΠΌΠ΅ Π½Π°ΡˆΠ°Ρ‚Π° Ρ‚Π°Π±Π΅Π»Π° Π½Π° зависни ΠΈ нСзависни ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ. Π‘Γ¨ Π΅ Сдноставно ΠΎΠ²Π΄Π΅. Зависни ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ сС ΠΎΠ½ΠΈΠ΅ ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ ΠΊΠΎΠΈ зависат ΠΎΠ΄ нСзависнитС ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ ΠΊΠΎΠΈ сС Π²ΠΎ исходитС. НСзависни ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ сС ΠΎΠ½ΠΈΠ΅ ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ ΠΊΠΎΠΈ Π²Π»ΠΈΡ˜Π°Π°Ρ‚ Π½Π° исходот.

На ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Π³ΠΎ ΠΈΠΌΠ°ΠΌΠ΅ слСдното Π·Π±ΠΈΡ€ Π½Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ:

β€žΠ’ΠΎΠ²Π° ΠΏΡ€Π΅Π΄Π°Π²Π°ΡˆΠ΅ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈΠΊΠ° - Π±Ρ€.
Π’ΠΎΠ²Π° Π΄ΠΎΠ±ΠΈ 2 ΠΏΠΎ ΠΊΠΎΠΌΠΏΡ˜ΡƒΡ‚Π΅Ρ€ΡΠΊΠΈ Π½Π°ΡƒΠΊΠΈβ€œ.

ΠžΡ†Π΅Π½ΠΊΠ°Ρ‚Π° ΠΏΠΎ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈΠΊΠ° зависи ΠΎΠ΄ ΠΎΠ΄Π³ΠΎΠ²ΠΎΡ€ΠΎΡ‚ Π½Π° ΠΏΡ€Π°ΡˆΠ°ΡšΠ΅Ρ‚ΠΎ: Π΄Π°Π»ΠΈ Π’ΠΎΠ²Π° студирал ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈΠΊΠ°? Π”Π°Π»ΠΈ Π΅ јасно? ОдимС ΠΏΠΎΠ½Π°Ρ‚Π°ΠΌΡƒ, вСќС смС поблиску Π΄ΠΎ Ρ†Π΅Π»Ρ‚Π°!

Π’Ρ€Π°Π΄ΠΈΡ†ΠΈΠΎΠ½Π°Π»Π½Π°Ρ‚Π° ΠΏΡ€ΠΎΠΌΠ΅Π½Π»ΠΈΠ²Π° Π·Π° нСзависни ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ Π΅ X. Π—Π° зависни ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ, y.

Π“ΠΎ ΠΏΡ€Π°Π²ΠΈΠΌΠ΅ слСдново:

X = dataset.iloc[ : , 2 : ]
y = dataset.iloc[ : , 1 : 2 ]

Π¨Ρ‚ΠΎ Π΅ Ρ‚ΠΎΠ°? Π‘ΠΎ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π°Ρ‚Π° iloc[:, 2: ] ΠΌΡƒ ΠΊΠ°ΠΆΡƒΠ²Π°ΠΌΠ΅ Π½Π° Python: Π‘Π°ΠΊΠ°ΠΌ Π΄Π° Π³ΠΈ Π²ΠΈΠ΄Π°ΠΌ Π²ΠΎ ΠΏΡ€ΠΎΠΌΠ΅Π½Π»ΠΈΠ²Π°Ρ‚Π° X ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈΡ‚Π΅ ΠΏΠΎΡ‡Π½ΡƒΠ²Π°Ρ˜ΡœΠΈ ΠΎΠ΄ Π²Ρ‚ΠΎΡ€Π°Ρ‚Π° ΠΊΠΎΠ»ΠΎΠ½Π° (Π²ΠΊΠ»ΡƒΡ‡ΠΈΡ‚Π΅Π»Π½ΠΎ ΠΈ ΠΏΠΎΠ΄ услов Π±Ρ€ΠΎΠ΅ΡšΠ΅Ρ‚ΠΎ Π΄Π° Π·Π°ΠΏΠΎΡ‡Π½Π΅ ΠΎΠ΄ Π½ΡƒΠ»Π°). Π’ΠΎ Π²Ρ‚ΠΎΡ€ΠΈΠΎΡ‚ Ρ€Π΅Π΄ Π²Π΅Π»ΠΈΠΌΠ΅ Π΄Π΅ΠΊΠ° сакамС Π΄Π° Π³ΠΈ Π²ΠΈΠ΄ΠΈΠΌΠ΅ ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈΡ‚Π΅ Π²ΠΎ ΠΏΡ€Π²Π°Ρ‚Π° ΠΊΠΎΠ»ΠΎΠ½Π°.

[ a:b, c:d ] Π΅ ΠΊΠΎΠ½ΡΡ‚Ρ€ΡƒΠΊΡ†ΠΈΡ˜Π° Π½Π° ΠΎΠ½Π° ΡˆΡ‚ΠΎ Π³ΠΎ користимС Π²ΠΎ Π·Π°Π³Ρ€Π°Π΄ΠΈ. Ако Π½Π΅ Π½Π°Π²Π΅Π΄Π΅Ρ‚Π΅ Π½ΠΈΠΊΠ°ΠΊΠ²ΠΈ ΠΏΡ€ΠΎΠΌΠ΅Π½Π»ΠΈΠ²ΠΈ, Ρ‚ΠΈΠ΅ ќС Π±ΠΈΠ΄Π°Ρ‚ Π·Π°Ρ‡ΡƒΠ²Π°Π½ΠΈ ΠΊΠ°ΠΊΠΎ стандардни. Односно, ΠΌΠΎΠΆΠ΅ΠΌΠ΅ Π΄Π° ΠΎΠ΄Ρ€Π΅Π΄ΠΈΠΌΠ΅ [:,: d] ΠΈ ΠΏΠΎΡ‚ΠΎΠ° ќС Π³ΠΈ Π΄ΠΎΠ±ΠΈΠ΅ΠΌΠ΅ ситС ΠΊΠΎΠ»ΠΎΠ½ΠΈ Π²ΠΎ ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ‡Π½Π°Ρ‚Π° Ρ€Π°ΠΌΠΊΠ°, освСн ΠΎΠ½ΠΈΠ΅ ΡˆΡ‚ΠΎ ΠΎΠ΄Π°Ρ‚ ΠΎΠ΄ Π±Ρ€ΠΎΡ˜ΠΎΡ‚ d Π½Π°Π²Π°ΠΌΡƒ. ΠŸΡ€ΠΎΠΌΠ΅Π½Π»ΠΈΠ²ΠΈΡ‚Π΅ a ΠΈ b Π΄Π΅Ρ„ΠΈΠ½ΠΈΡ€Π°Π°Ρ‚ Π½ΠΈΠ·ΠΈ, Π½ΠΎ Π½ΠΈ Ρ‚Ρ€Π΅Π±Π°Π°Ρ‚ ситС, ΠΏΠ° Π³ΠΎ оставамС ΠΎΠ²Π° ΠΊΠ°ΠΊΠΎ стандардно.

АјдС Π΄Π° Π²ΠΈΠ΄ΠΈΠΌΠ΅ ΡˆΡ‚ΠΎ Π΄ΠΎΠ±ΠΈΠ²ΠΌΠ΅:

X.head()

Π’Π°ΡˆΠΈΠΎΡ‚ ΠΏΡ€Π² Ρ‡Π΅ΠΊΠΎΡ€ Π²ΠΎ Π½Π°ΡƒΠΊΠ°Ρ‚Π° Π·Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ. Π’ΠΈΡ‚Π°Π½ΠΈΠΊ

y.head()

Π’Π°ΡˆΠΈΠΎΡ‚ ΠΏΡ€Π² Ρ‡Π΅ΠΊΠΎΡ€ Π²ΠΎ Π½Π°ΡƒΠΊΠ°Ρ‚Π° Π·Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ. Π’ΠΈΡ‚Π°Π½ΠΈΠΊ

Π‘ΠΎ Ρ†Π΅Π» Π΄Π° ја поСдноставимС ΠΎΠ²Π°Π° ΠΌΠ°Π»Π° Π»Π΅ΠΊΡ†ΠΈΡ˜Π°, ќС Π³ΠΈ отстранимС ΠΊΠΎΠ»ΠΎΠ½ΠΈΡ‚Π΅ ΠΊΠΎΠΈ Π±Π°Ρ€Π°Π°Ρ‚ посСбна Π³Ρ€ΠΈΠΆΠ° ΠΈΠ»ΠΈ Π²ΠΎΠΎΠΏΡˆΡ‚ΠΎ Π½Π΅ Π²Π»ΠΈΡ˜Π°Π°Ρ‚ Π½Π° опстанокот. Π‘ΠΎΠ΄Ρ€ΠΆΠ°Ρ‚ ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ ΠΎΠ΄ Ρ‚ΠΈΠΏΠΎΡ‚ str.

count = ['Name', 'Ticket', 'Cabin', 'Embarked']
X.drop(count, inplace=True, axis=1)

Π‘ΡƒΠΏΠ΅Ρ€! АјдС Π΄Π° ΠΏΡ€ΠΎΠ΄ΠΎΠ»ΠΆΠΈΠΌΠ΅ Π½Π° слСдниот Ρ‡Π΅ΠΊΠΎΡ€.

Π§Π΅ΠΊΠΎΡ€ Ρ‚Ρ€ΠΈ

Π’ΡƒΠΊΠ° Ρ‚Ρ€Π΅Π±Π° Π΄Π° Π³ΠΈ ΡˆΠΈΡ„Ρ€ΠΈΡ€Π°ΠΌΠ΅ Π½Π°ΡˆΠΈΡ‚Π΅ ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ Π·Π° ΠΌΠ°ΡˆΠΈΠ½Π°Ρ‚Π° ΠΏΠΎΠ΄ΠΎΠ±Ρ€ΠΎ Π΄Π° Ρ€Π°Π·Π±Π΅Ρ€Π΅ ΠΊΠ°ΠΊΠΎ ΠΎΠ²ΠΈΠ΅ ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ Π²Π»ΠΈΡ˜Π°Π°Ρ‚ Π½Π° Ρ€Π΅Π·ΡƒΠ»Ρ‚Π°Ρ‚ΠΎΡ‚. Но, Π½ΠΈΠ΅ Π½Π΅ΠΌΠ° Π΄Π° ΡˆΠΈΡ„Ρ€ΠΈΡ€Π°ΠΌΠ΅ сè, Ρ‚ΡƒΠΊΡƒ само ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈΡ‚Π΅ Π·Π° str ΡˆΡ‚ΠΎ Π³ΠΈ оставивмС. Колона β€žΠ‘Π΅ΠΊΡβ€œ. Како сакамС Π΄Π° ΠΊΠΎΠ΄ΠΈΡ€Π°ΠΌΠ΅? Π”Π° Π³ΠΈ прСтставимС ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈΡ‚Π΅ Π·Π° ΠΏΠΎΠ»ΠΎΡ‚ Π½Π° Π΅Π΄Π½Π° личност ΠΊΠ°ΠΊΠΎ Π²Π΅ΠΊΡ‚ΠΎΡ€: 10 - машки, 01 - ТСнски.

ΠŸΡ€Π²ΠΎ, ајдС Π΄Π° Π³ΠΈ ΠΊΠΎΠ½Π²Π΅Ρ€Ρ‚ΠΈΡ€Π°ΠΌΠ΅ Π½Π°ΡˆΠΈΡ‚Π΅ Ρ‚Π°Π±Π΅Π»ΠΈ Π²ΠΎ NumPy ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π°:

X = np.array(X)
y = np.array(y)

И сСга да поглСднСмС:

from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import OneHotEncoder

ct = ColumnTransformer(transformers=[('encoder', OneHotEncoder(), [1])],
                       remainder='passthrough')
X = np.array(ct.fit_transform(X))

Sklearn Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ°Ρ‚Π° Π΅ Ρ‚ΠΎΠ»ΠΊΡƒ ΠΊΡƒΠ» Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ° ΡˆΡ‚ΠΎ Π½ΠΈ ΠΎΠ²ΠΎΠ·ΠΌΠΎΠΆΡƒΠ²Π° Π΄Π° Π½Π°ΠΏΡ€Π°Π²ΠΈΠΌΠ΅ цСлосна Ρ€Π°Π±ΠΎΡ‚Π° Π²ΠΎ Data Science. Π‘ΠΎΠ΄Ρ€ΠΆΠΈ Π³ΠΎΠ»Π΅ΠΌ Π±Ρ€ΠΎΡ˜ Π½Π° интСрСсни ΠΌΠΎΠ΄Π΅Π»ΠΈ Π·Π° машинско ΡƒΡ‡Π΅ΡšΠ΅ ΠΈ исто Ρ‚Π°ΠΊΠ° Π½ΠΈ ΠΎΠ²ΠΎΠ·ΠΌΠΎΠΆΡƒΠ²Π° Π΄Π° ΠΏΡ€Π°Π²ΠΈΠΌΠ΅ ΠΏΠΎΠ΄Π³ΠΎΡ‚ΠΎΠ²ΠΊΠ° Π½Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ.

OneHotEncoder ќС Π½ΠΈ ΠΎΠ²ΠΎΠ·ΠΌΠΎΠΆΠΈ Π΄Π° Π³ΠΎ ΡˆΠΈΡ„Ρ€ΠΈΡ€Π°ΠΌΠ΅ ΠΏΠΎΠ»ΠΎΡ‚ Π½Π° личноста Π²ΠΎ Ρ‚Π°Π° Ρ€Π΅ΠΏΡ€Π΅Π·Π΅Π½Ρ‚Π°Ρ†ΠΈΡ˜Π°, ΠΊΠ°ΠΊΠΎ ΡˆΡ‚ΠΎ опишавмС. ЌС сС создадат 2 ΠΏΠ°Ρ€Π°Π»Π΅Π»ΠΊΠΈ: машки, ТСнски. Ако Π»ΠΈΡ†Π΅Ρ‚ΠΎ Π΅ ΠΌΠ°ΠΆ, Ρ‚ΠΎΠ³Π°Ρˆ Π²ΠΎ ΠΊΠΎΠ»ΠΎΠ½Π°Ρ‚Π° β€žΠΌΠ°ΡˆΠΊΠΈβ€œ ќС Π±ΠΈΠ΄Π΅ напишано 1, Π° Π²ΠΎ ΠΊΠΎΠ»ΠΎΠ½Π°Ρ‚Π° β€žΠΆΠ΅Π½ΡΠΊΠΎβ€œ 0, соодвСтно.

По OneHotEncoder() постои [1] - Ρ‚ΠΎΠ° Π·Π½Π°Ρ‡ΠΈ Π΄Π΅ΠΊΠ° сакамС Π΄Π° ја ΠΊΠΎΠ΄ΠΈΡ€Π°ΠΌΠ΅ ΠΊΠΎΠ»ΠΎΠ½Π°Ρ‚Π° Π±Ρ€ΠΎΡ˜ 1 (Π±Ρ€ΠΎΠ΅Ρ˜ΡœΠΈ ΠΎΠ΄ Π½ΡƒΠ»Π°).

Π‘ΡƒΠΏΠ΅Ρ€. Π”Π° ΠΎΠ΄ΠΈΠΌΠ΅ ΡƒΡˆΡ‚Π΅ ΠΏΠΎΠ΄Π°Π»Π΅ΠΊΡƒ!

Како ΠΏΠΎ ΠΏΡ€Π°Π²ΠΈΠ»ΠΎ, ΠΎΠ²Π° сС случува Π½Π΅ΠΊΠΎΠΈ ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ Π΄Π° останат ΠΏΡ€Π°Π·Π½ΠΈ (Ρ‚.Π΅. NaN - Π½Π΅ Π±Ρ€ΠΎΡ˜ΠΊΠ°). На ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΠΈΠΌΠ° ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ Π·Π° нСкоја личност: Π½Π΅Π³ΠΎΠ²ΠΎΡ‚ΠΎ ΠΈΠΌΠ΅, ΠΏΠΎΠ». Но, Π½Π΅ΠΌΠ° ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ Π·Π° Π½Π΅Π³ΠΎΠ²Π°Ρ‚Π° возраст. Π’ΠΎ овој ΡΠ»ΡƒΡ‡Π°Ρ˜, ќС Π³ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΠΌΠ΅ слСдниов ΠΌΠ΅Ρ‚ΠΎΠ΄: ќС ја најдСмС Π°Ρ€ΠΈΡ‚ΠΌΠ΅Ρ‚ΠΈΡ‡ΠΊΠ°Ρ‚Π° срСдина Π½Π°Π΄ ситС ΠΊΠΎΠ»ΠΎΠ½ΠΈ ΠΈ, Π°ΠΊΠΎ нСдостасуваат Π½Π΅ΠΊΠΎΠΈ ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ Π²ΠΎ ΠΊΠΎΠ»ΠΎΠ½Π°Ρ‚Π°, Ρ‚ΠΎΠ³Π°Ρˆ ΠΏΡ€Π°Π·Π½ΠΈΠ½Π°Ρ‚Π° ќС ја ΠΏΠΎΠΏΠΎΠ»Π½ΠΈΠΌΠ΅ со Π°Ρ€ΠΈΡ‚ΠΌΠ΅Ρ‚ΠΈΡ‡ΠΊΠ°Ρ‚Π° срСдина.

from sklearn.impute import SimpleImputer
imputer = SimpleImputer(missing_values=np.nan, strategy='mean')
imputer.fit(X)
X = imputer.transform(X)

Π‘Π΅Π³Π° Π΄Π° Π·Π΅ΠΌΠ΅ΠΌΠ΅ ΠΏΡ€Π΅Π΄Π²ΠΈΠ΄ Π΄Π΅ΠΊΠ° сС случуваат ситуации ΠΊΠΎΠ³Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈΡ‚Π΅ сС ΠΌΠ½ΠΎΠ³Ρƒ Π³ΠΎΠ»Π΅ΠΌΠΈ. НСкои ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ сС Π²ΠΎ ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π»ΠΎΡ‚ [0:1], Π΄ΠΎΠ΄Π΅ΠΊΠ° Π½Π΅ΠΊΠΎΠΈ ΠΌΠΎΠΆΠ΅ Π΄Π° Π½Π°Π΄ΠΌΠΈΠ½Π°Ρ‚ стотици ΠΈ ΠΈΠ»Ρ˜Π°Π΄Π½ΠΈΡ†ΠΈ. Π—Π° Π΄Π° сС Π΅Π»ΠΈΠΌΠΈΠ½ΠΈΡ€Π° Ρ‚Π°ΠΊΠ²ΠΎΡ‚ΠΎ Ρ€Π°ΡΠ΅Ρ˜ΡƒΠ²Π°ΡšΠ΅ ΠΈ Π΄Π° сС Π½Π°ΠΏΡ€Π°Π²ΠΈ ΠΊΠΎΠΌΠΏΡ˜ΡƒΡ‚Π΅Ρ€ΠΎΡ‚ ΠΏΠΎΠΏΡ€Π΅Ρ†ΠΈΠ·Π΅Π½ Π²ΠΎ Π½Π΅Π³ΠΎΠ²ΠΈΡ‚Π΅ прСсмСтки, ќС Π³ΠΈ скСнирамС ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈΡ‚Π΅ ΠΈ ќС Π³ΠΈ скалирамС. НСка ситС Π±Ρ€ΠΎΠ΅Π²ΠΈ Π½Π΅ Π½Π°Π΄ΠΌΠΈΠ½ΡƒΠ²Π°Π°Ρ‚ Ρ‚Ρ€ΠΈ. Π—Π° Π΄Π° Π³ΠΎ Π½Π°ΠΏΡ€Π°Π²ΠΈΡ‚Π΅ ΠΎΠ²Π°, ќС ја користимС Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π°Ρ‚Π° StandardScaler.

from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X[:, 2:] = sc.fit_transform(X[:, 2:])

Π‘Π΅Π³Π° Π½Π°ΡˆΠΈΡ‚Π΅ ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ ΠΈΠ·Π³Π»Π΅Π΄Π°Π°Ρ‚ Π²Π°ΠΊΠ°:

Π’Π°ΡˆΠΈΠΎΡ‚ ΠΏΡ€Π² Ρ‡Π΅ΠΊΠΎΡ€ Π²ΠΎ Π½Π°ΡƒΠΊΠ°Ρ‚Π° Π·Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ. Π’ΠΈΡ‚Π°Π½ΠΈΠΊ

Класа. Π’Π΅ΡœΠ΅ смС блиску Π΄ΠΎ Π½Π°ΡˆΠ°Ρ‚Π° Ρ†Π΅Π»!

Π§Π΅ΠΊΠΎΡ€ Ρ‡Π΅Ρ‚ΠΈΡ€ΠΈ

АјдС Π΄Π° Π³ΠΎ Ρ‚Ρ€Π΅Π½ΠΈΡ€Π°ΠΌΠ΅ Π½Π°ΡˆΠΈΠΎΡ‚ ΠΏΡ€Π² ΠΌΠΎΠ΄Π΅Π»! Од Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ°Ρ‚Π° Sklearn ΠΌΠΎΠΆΠ΅ΠΌΠ΅ Π΄Π° најдСмС ΠΎΠ³Ρ€ΠΎΠΌΠ΅Π½ Π±Ρ€ΠΎΡ˜ интСрСсни Ρ€Π°Π±ΠΎΡ‚ΠΈ. На овој ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌ Π³ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΠ² ΠΌΠΎΠ΄Π΅Π»ΠΎΡ‚ Π½Π° ΠšΠ»Π°ΡΠΈΡ„ΠΈΠΊΠ°Ρ‚ΠΎΡ€ Π·Π° Π·Π°Ρ˜Π°ΠΊΠ½ΡƒΠ²Π°ΡšΠ΅ Π½Π° Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚. НиС користимС класификатор бидСјќи Π½Π°ΡˆΠ°Ρ‚Π° Π·Π°Π΄Π°Ρ‡Π° Π΅ Π·Π°Π΄Π°Ρ‡Π° Π·Π° ΠΊΠ»Π°ΡΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΡ˜Π°. ΠŸΡ€ΠΎΠ³Π½ΠΎΠ·Π°Ρ‚Π° Ρ‚Ρ€Π΅Π±Π° Π΄Π° сС Π΄ΠΎΠ΄Π΅Π»ΠΈ Π½Π° 1 (ΠΏΡ€Π΅ΠΆΠΈΠ²Π΅Π°Π½) ΠΈΠ»ΠΈ 0 (Π½Π΅ ΠΏΡ€Π΅ΠΆΠΈΠ²Π΅Π°).

from sklearn.ensemble import GradientBoostingClassifier
gbc = GradientBoostingClassifier(learning_rate=0.5, max_depth=5, n_estimators=150)
gbc.fit(X, y)

Π€ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π°Ρ‚Π° Π·Π° Π²ΠΊΠ»ΠΎΠΏΡƒΠ²Π°ΡšΠ΅ ΠΌΡƒ ΠΊΠ°ΠΆΡƒΠ²Π° Π½Π° ΠŸΠ°Ρ˜Ρ‚ΠΎΠ½: НСка ΠΌΠΎΠ΄Π΅Π»ΠΎΡ‚ Π±Π°Ρ€Π° зависност ΠΏΠΎΠΌΠ΅Ρ“Ρƒ X ΠΈ y.

ΠŸΠΎΠΌΠ°Π»ΠΊΡƒ ΠΎΠ΄ сСкунда ΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΎΡ‚ Π΅ Π³ΠΎΡ‚ΠΎΠ².

Π’Π°ΡˆΠΈΠΎΡ‚ ΠΏΡ€Π² Ρ‡Π΅ΠΊΠΎΡ€ Π²ΠΎ Π½Π°ΡƒΠΊΠ°Ρ‚Π° Π·Π° ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ. Π’ΠΈΡ‚Π°Π½ΠΈΠΊ

Како Π΄Π° сС ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈ? Π‘Π΅Π³Π° ќС Π²ΠΈΠ΄ΠΈΠΌΠ΅!

Π§Π΅ΠΊΠΎΡ€ ΠΏΠ΅Ρ‚. Π—Π°ΠΊΠ»ΡƒΡ‡ΠΎΠΊ

Π‘Π΅Π³Π° Ρ‚Ρ€Π΅Π±Π° Π΄Π° Π²Ρ‡ΠΈΡ‚Π°ΠΌΠ΅ Ρ‚Π°Π±Π΅Π»Π° со Π½Π°ΡˆΠΈΡ‚Π΅ тСст ΠΏΠΎΠ΄Π°Ρ‚ΠΎΡ†ΠΈ Π·Π° ΠΊΠΎΠΈ Ρ‚Ρ€Π΅Π±Π° Π΄Π° Π½Π°ΠΏΡ€Π°Π²ΠΈΠΌΠ΅ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Π°. Π‘ΠΎ ΠΎΠ²Π°Π° Ρ‚Π°Π±Π΅Π»Π° ќС Π³ΠΈ Π½Π°ΠΏΡ€Π°Π²ΠΈΠΌΠ΅ ситС исти Π΄Π΅Ρ˜ΡΡ‚Π²Π° ΡˆΡ‚ΠΎ Π³ΠΈ Π½Π°ΠΏΡ€Π°Π²ΠΈΠ²ΠΌΠ΅ Π·Π° X.

X_test = pd.read_csv('test.csv', index_col=0)

count = ['Name', 'Ticket', 'Cabin', 'Embarked']
X_test.drop(count, inplace=True, axis=1)

X_test = np.array(X_test)

from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import OneHotEncoder
ct = ColumnTransformer(transformers=[('encoder', OneHotEncoder(), [1])],
                       remainder='passthrough')
X_test = np.array(ct.fit_transform(X_test))

from sklearn.impute import SimpleImputer
imputer = SimpleImputer(missing_values=np.nan, strategy='mean')
imputer.fit(X_test)
X_test = imputer.transform(X_test)

from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_test[:, 2:] = sc.fit_transform(X_test[:, 2:])

АјдС Π΄Π° Π³ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΠΌΠ΅ Π½Π°ΡˆΠΈΠΎΡ‚ ΠΌΠΎΠ΄Π΅Π» сСга!

gbc_predict = gbc.predict(X_test)

Π‘ΠΈΡ‚Π΅. НаправивмС ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Π°. Π‘Π΅Π³Π° Ρ‚Ρ€Π΅Π±Π° Π΄Π° сС сними Π²ΠΎ csv ΠΈ Π΄Π° сС испрати Π½Π° Π²Π΅Π±-страницата.

np.savetxt('my_gbc_predict.csv', gbc_predict, delimiter=",", header = 'Survived')

ΠŸΠΎΠ΄Π³ΠΎΡ‚Π²Π΅Π½ΠΈ. Π”ΠΎΠ±ΠΈΠ²ΠΌΠ΅ досиС со ΠΏΡ€Π΅Π΄Π²ΠΈΠ΄ΡƒΠ²Π°ΡšΠ° Π·Π° сСкој ΠΏΠ°Ρ‚Π½ΠΈΠΊ. ΠžΡΡ‚Π°Π½ΡƒΠ²Π° само Π΄Π° сС ΠΏΡ€ΠΈΠΊΠ°Ρ‡Π°Ρ‚ ΠΎΠ²ΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ˜Π° Π½Π° Π²Π΅Π±-страницата ΠΈ Π΄Π° сС Π΄ΠΎΠ±ΠΈΠ΅ ΠΏΡ€ΠΎΡ†Π΅Π½ΠΊΠ° Π½Π° ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Π°Ρ‚Π°. Π’Π°ΠΊΠ²ΠΎΡ‚ΠΎ ΠΏΡ€ΠΈΠΌΠΈΡ‚ΠΈΠ²Π½ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ Π΄Π°Π²Π° Π½Π΅ само 74% Ρ‚ΠΎΡ‡Π½ΠΈ ΠΎΠ΄Π³ΠΎΠ²ΠΎΡ€ΠΈ Π²ΠΎ Ρ˜Π°Π²Π½ΠΎΡΡ‚Π°, Ρ‚ΡƒΠΊΡƒ ΠΈ ΠΎΠ΄Ρ€Π΅Π΄Π΅Π½ импулс Π²ΠΎ Data Science. ΠΠ°Ρ˜Ρ™ΡƒΠ±ΠΎΠΏΠΈΡ‚Π½ΠΈΡ‚Π΅ ΠΌΠΎΠΆΠ°Ρ‚ Π²ΠΎ сСкоС Π²Ρ€Π΅ΠΌΠ΅ Π΄Π° ΠΌΠΈ ΠΏΠΈΡˆΠ°Ρ‚ Π²ΠΎ ΠΏΡ€ΠΈΠ²Π°Ρ‚Π½ΠΈ ΠΏΠΎΡ€Π°ΠΊΠΈ ΠΈ Π΄Π° постават ΠΏΡ€Π°ΡˆΠ°ΡšΠ΅. Π’ΠΈ Π±Π»Π°Π³ΠΎΠ΄Π°Ρ€Π°ΠΌ Π½Π° ситС!

Π˜Π·Π²ΠΎΡ€: www.habr.com

Π”ΠΎΠ΄Π°Π΄Π΅Ρ‚Π΅ ΠΊΠΎΠΌΠ΅Π½Ρ‚Π°Ρ€