เดกเดพเดฑเตเดฑเดพ เดธเดฏเตปเดธเดฟเดฒเต† เดจเดฟเด™เตเด™เดณเตเดŸเต† เด†เดฆเตเดฏ เดšเตเดตเดŸเต. เดŸเตˆเดฑเตเดฑเดพเดจเดฟเด•เต

เด’เดฐเต เดšเต†เดฑเดฟเดฏ เด†เดฎเตเด– เดตเดพเด•เตเด•เต

เดŽเดจเตเดคเตเดšเต†เดฏเตเดฏเดฃเดฎเต†เดจเตเดจเตเด‚ เดŽเด™เตเด™เดจเต† เดšเต†เดฏเตเดฏเดฃเดฎเต†เดจเตเดจเตเด‚ เดžเด™เตเด™เดณเต‹เดŸเต เดชเดฑเดฏเตเดจเตเดจ เด˜เดŸเตเดŸเด‚ เด˜เดŸเตเดŸเดฎเดพเดฏเตเดณเตเดณ เดจเดฟเตผเดฆเตเดฆเต‡เดถเด™เตเด™เตพ เดจเตฝเด•เดฟเดฏเดพเตฝ เด•เต‚เดŸเตเดคเตฝ เด•เดพเดฐเตเดฏเด™เตเด™เตพ เดšเต†เดฏเตเดฏเดพเตป เด•เดดเดฟเดฏเตเดฎเต†เดจเตเดจเต เดžเดพเตป เดตเดฟเดถเตเดตเดธเดฟเด•เตเด•เตเดจเตเดจเต. เดŽเดจเดฟเด•เตเด•เต เดŽเดจเตเดคเต†เด™เตเด•เดฟเดฒเตเด‚ เด†เดฐเด‚เดญเดฟเด•เตเด•เดพเตป เด•เดดเดฟเดฏเดพเดคเตเดค เดจเดฟเดฎเดฟเดทเด™เตเด™เตพ เดžเดพเตป เดคเดจเตเดจเต† เด“เตผเด•เตเด•เตเดจเตเดจเต, เด•เดพเดฐเดฃเด‚ เดŽเดตเดฟเดŸเต† เดคเตเดŸเด™เตเด™เดฃเดฎเต†เดจเตเดจเต เดฎเดจเดธเดฟเดฒเดพเด•เตเด•เดพเตป เดชเตเดฐเดฏเดพเดธเดฎเดพเดฃเต. เด’เดฐเตเดชเด•เตเดทเต‡, เด’เดฐเดฟเด•เตเด•เตฝ เด‡เตปเดฑเตผเดจเต†เดฑเตเดฑเดฟเตฝ เดจเดฟเด™เตเด™เตพ "เดกเดพเดฑเตเดฑ เดธเดฏเตปเดธเต" เดŽเดจเตเดจ เดตเดพเด•เตเด•เตเด•เตพ เด•เดพเดฃเตเด•เดฏเตเด‚ เดจเดฟเด™เตเด™เตพ เด‡เดคเดฟเตฝ เดจเดฟเดจเตเดจเต เดตเดณเดฐเต† เด…เด•เดฒเต†เดฏเดพเดฃเต†เดจเตเดจเตเด‚ เด‡เดคเต เดšเต†เดฏเตเดฏเตเดจเตเดจ เด†เดณเตเด•เตพ เดŽเดตเดฟเดŸเต†เดฏเต‹ เดฎเดฑเตเดฑเตŠเดฐเต เดฒเต‹เด•เดคเตเดคเดพเดฃเต†เดจเตเดจเตเด‚ เดคเต€เดฐเตเดฎเดพเดจเดฟเดšเตเดšเต. เด‡เดฒเตเดฒ, เด…เดตเตผ เด‡เดตเดฟเดŸเต† เดคเดจเตเดจเต†เดฏเตเดฃเตเดŸเต. เด•เต‚เดŸเดพเดคเต†, เด’เดฐเตเดชเด•เตเดทเต‡, เดˆ เดซเต€เตฝเดกเดฟเตฝ เดจเดฟเดจเตเดจเตเดณเตเดณ เด†เดณเตเด•เตพเด•เตเด•เต เดจเดจเตเดฆเดฟ, เดจเดฟเด™เตเด™เดณเตเดŸเต† เดซเต€เดกเดฟเตฝ เด’เดฐเต เดฒเต‡เด–เดจเด‚ เดชเตเดฐเดคเตเดฏเด•เตเดทเดชเตเดชเต†เดŸเตเดŸเต. เดˆ เด•เตเดฐเดพเดซเตเดฑเตเดฑเต เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเดจเตเดจเดคเดฟเดจเต เดจเดฟเด™เตเด™เดณเต† เดธเดนเดพเดฏเดฟเด•เตเด•เตเดจเตเดจ เดงเดพเดฐเดพเดณเด‚ เด•เต‹เดดเตเดธเตเด•เตพ เด‰เดฃเตเดŸเต, เดŽเดจเตเดจเดพเตฝ เด†เดฆเตเดฏเดชเดŸเดฟ เดธเตเดตเต€เด•เดฐเดฟเด•เตเด•เดพเตป เดžเดพเตป เดจเดฟเด™เตเด™เดณเต† เดธเดนเดพเดฏเดฟเด•เตเด•เตเด‚.

เดถเดฐเดฟ, เดจเดฟเด™เตเด™เตพ เดคเดฏเตเดฏเดพเดฑเดพเดฃเต‹? เดจเดฟเด™เตเด™เตพ เดชเตˆเดคเตเดคเตบ 3 เด…เดฑเดฟเดฏเต‡เดฃเตเดŸเดคเตเดฃเตเดŸเต†เดจเตเดจเต เดžเดพเตป เด‰เดŸเตป เดคเดจเตเดจเต† เดจเดฟเด™เตเด™เดณเต‹เดŸเต เดชเดฑเดฏเดŸเตเดŸเต†, เด•เดพเดฐเดฃเด‚ เด…เดคเดพเดฃเต เดžเดพเตป เด‡เดตเดฟเดŸเต† เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเดจเตเดจเดคเต. เดœเต‚เดชเตเดชเดฟเดฑเตเดฑเตผ เดจเต‹เดŸเตเดŸเตเดฌเตเด•เตเด•เดฟเตฝ เด‡เดคเต เดฎเตเตปเด•เต‚เดŸเตเดŸเดฟ เด‡เตปเดธเตเดฑเตเดฑเดพเตพ เดšเต†เดฏเตเดฏเดพเตป เดžเดพเตป เดจเดฟเด™เตเด™เดณเต† เด‰เดชเดฆเต‡เดถเดฟเด•เตเด•เตเดจเตเดจเต เด…เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ เด—เต‚เด—เดฟเตพ เด•เต‹เดณเดพเดฌเต เดŽเด™เตเด™เดจเต† เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เดพเดฎเต†เดจเตเดจเต เด•เดพเดฃเตเด•.

เดธเตเดฑเตเดฑเต†เดชเตเดชเต เด’เดจเตเดจเต

เดกเดพเดฑเตเดฑเดพ เดธเดฏเตปเดธเดฟเดฒเต† เดจเดฟเด™เตเด™เดณเตเดŸเต† เด†เดฆเตเดฏ เดšเตเดตเดŸเต. เดŸเตˆเดฑเตเดฑเดพเดจเดฟเด•เต

เดˆ เดตเดฟเดทเดฏเดคเตเดคเดฟเตฝ เดจเดฟเด™เตเด™เดณเตเดŸเต† เดชเตเดฐเดงเดพเดจ เดธเดนเดพเดฏเดฟเดฏเดพเดฃเต เด•เด—เตเด—เตเดฒเต†. เดคเดคเตเดตเดคเตเดคเดฟเตฝ, เดจเดฟเด™เตเด™เตพเด•เตเด•เต เด‡เดคเต เด•เต‚เดŸเดพเดคเต† เดšเต†เดฏเตเดฏเดพเตป เด•เดดเดฟเดฏเตเด‚, เดŽเดจเตเดจเดพเตฝ เดžเดพเตป เด‡เดคเดฟเดจเต†เด•เตเด•เตเดฑเดฟเดšเตเดšเต เดฎเดฑเตเดฑเตŠเดฐเต เดฒเต‡เด–เดจเดคเตเดคเดฟเตฝ เดธเด‚เดธเดพเดฐเดฟเด•เตเด•เตเด‚. เดกเดพเดฑเตเดฑเดพ เดธเดฏเตปเดธเต เดฎเดคเตเดธเดฐเด™เตเด™เตพ เดธเด‚เด˜เดŸเดฟเดชเตเดชเดฟเด•เตเด•เตเดจเตเดจ เด’เดฐเต เดชเตเดฒเดพเดฑเตเดฑเตเดซเต‹เดฎเดพเดฃเต เด‡เดคเต. เด…เดคเตเดคเดฐเด‚ เด“เดฐเต‹ เดฎเดคเตเดธเดฐเดคเตเดคเดฟเดฒเตเด‚, เดชเตเดฐเดพเดฐเด‚เดญ เด˜เดŸเตเดŸเดคเตเดคเดฟเตฝ, เดตเดฟเดตเดฟเดง เดคเดฐเดคเตเดคเดฟเดฒเตเดณเตเดณ เดชเตเดฐเดถเตเดจเด™เตเด™เตพ เดชเดฐเดฟเดนเดฐเดฟเด•เตเด•เตเดจเตเดจเดคเดฟเตฝ เดจเดฟเด™เตเด™เตพเด•เตเด•เต เด…เดฏเดฅเดพเตผเดคเตเดฅเดฎเดพเดฏ เด…เดจเตเดญเดตเด‚ เดฒเดญเดฟเด•เตเด•เตเด‚, เดตเดฟเด•เดธเดจ เด…เดจเตเดญเดตเด‚, เด’เดฐเต เดŸเต€เดฎเดฟเตฝ เดœเต‹เดฒเดฟ เดšเต†เดฏเตเดฏเตเดจเตเดจ เด…เดจเตเดญเดตเด‚, เด…เดคเต เดจเดฎเตเดฎเตเดŸเต† เด•เดพเดฒเด˜เดŸเตเดŸเดคเตเดคเดฟเตฝ เดชเตเดฐเดงเดพเดจเดฎเดพเดฃเต.

เดžเด™เตเด™เตพ เด…เดตเดฟเดŸเต† เดจเดฟเดจเตเดจเต เดžเด™เตเด™เดณเตเดŸเต† เดšเตเดฎเดคเดฒ เดเดฑเตเดฑเต†เดŸเตเด•เตเด•เตเด‚. "เดŸเตˆเดฑเตเดฑเดพเดจเดฟเด•เต" เดŽเดจเตเดจเดพเดฃเต เด‡เดคเดฟเดจเตเดฑเต† เดชเต‡เดฐเต. เดตเตเดฏเดตเดธเตเดฅ เด‡เดคเดพเดฃเต: เด“เดฐเต‹ เดตเตเดฏเด•เตเดคเดฟเดฏเตเด‚ เด…เดคเดฟเดœเต€เดตเดฟเด•เตเด•เตเดฎเต‹ เดŽเดจเตเดจเต เดชเตเดฐเดตเดšเดฟเด•เตเด•เตเด•. เดชเตŠเดคเตเดตเดพเดฏเดฟ เดชเดฑเดžเตเดžเดพเตฝ, DS-เตฝ เด‰เตพเดชเตเดชเต†เดŸเตเดŸเดฟเดฐเดฟเด•เตเด•เตเดจเตเดจ เด’เดฐเต เดตเตเดฏเด•เตเดคเดฟเดฏเตเดŸเต† เดšเตเดฎเดคเดฒ เดกเดพเดฑเตเดฑ เดถเต‡เด–เดฐเดฟเด•เตเด•เตเด•, เดชเตเดฐเต‹เดธเดธเตเดธเต เดšเต†เดฏเตเดฏเตเด•, เด’เดฐเต เดฎเดพเดคเตƒเด•เดฏเต† เดชเดฐเดฟเดถเต€เดฒเดฟเดชเตเดชเดฟเด•เตเด•เตเด•, เดชเตเดฐเดตเดšเดจเด‚ เดจเดŸเดคเตเดคเตเด• เดคเตเดŸเด™เตเด™เดฟเดฏเดตเดฏเดพเดฃเต. เด•เด—เตเด—เดฟเตฝ, เดกเดพเดฑเตเดฑเดพ เดถเต‡เด–เดฐเดฃ เด˜เดŸเตเดŸเด‚ เด’เดดเดฟเดตเดพเด•เตเด•เดพเตป เดžเด™เตเด™เดณเต† เด…เดจเตเดตเดฆเดฟเดšเตเดšเดฟเดฐเดฟเด•เตเด•เตเดจเตเดจเต - เด…เดต เดชเตเดฒเดพเดฑเตเดฑเตโ€Œเดซเต‹เดฎเดฟเตฝ เด…เดตเดคเดฐเดฟเดชเตเดชเดฟเด•เตเด•เตเดจเตเดจเต. เดžเด™เตเด™เตพเด•เตเด•เต เด…เดต เดกเต—เตบเดฒเต‹เดกเต เดšเต†เดฏเตเดฏเต‡เดฃเตเดŸเดคเตเดฃเตเดŸเต, เดจเดฎเตเด•เตเด•เต เด†เดฐเด‚เดญเดฟเด•เตเด•เดพเด‚!

เดจเดฟเด™เตเด™เตพเด•เตเด•เต เด‡เดคเต เด‡เดจเดฟเดชเตเดชเดฑเดฏเตเดจเตเดจ เดฐเต€เดคเดฟเดฏเดฟเตฝ เดšเต†เดฏเตเดฏเดพเตป เด•เดดเดฟเดฏเตเด‚:

เดกเดพเดฑเตเดฑ เดŸเดพเดฌเดฟเตฝ เดกเดพเดฑเตเดฑ เด…เดŸเด™เตเด™เตเดจเตเดจ เดซเดฏเดฒเตเด•เตพ เด…เดŸเด™เตเด™เดฟเดฏเดฟเดฐเดฟเด•เตเด•เตเดจเตเดจเต

เดกเดพเดฑเตเดฑเดพ เดธเดฏเตปเดธเดฟเดฒเต† เดจเดฟเด™เตเด™เดณเตเดŸเต† เด†เดฆเตเดฏ เดšเตเดตเดŸเต. เดŸเตˆเดฑเตเดฑเดพเดจเดฟเด•เต

เดกเดพเดฑเตเดฑเดพ เดธเดฏเตปเดธเดฟเดฒเต† เดจเดฟเด™เตเด™เดณเตเดŸเต† เด†เดฆเตเดฏ เดšเตเดตเดŸเต. เดŸเตˆเดฑเตเดฑเดพเดจเดฟเด•เต

เดžเด™เตเด™เตพ เดกเดพเดฑเตเดฑ เดกเต—เตบเดฒเต‹เดกเต เดšเต†เดฏเตเดคเต, เดžเด™เตเด™เดณเตเดŸเต† เดœเต‚เดชเตเดชเดฟเดฑเตเดฑเตผ เดจเต‹เดŸเตเดŸเตเดฌเตเด•เตเด•เตเด•เตพ เดคเดฏเตเดฏเดพเดฑเดพเด•เตเด•เดฟ...

เด˜เดŸเตเดŸเด‚ เดฐเดฃเตเดŸเต

เด‡เดชเตเดชเต‹เตพ เดŽเด™เตเด™เดจเต†เดฏเดพเดฃเต เดˆ เดกเดพเดฑเตเดฑ เดฒเต‹เดกเต เดšเต†เดฏเตเดฏเตเด•?

เด†เดฆเตเดฏเด‚, เดจเดฎเตเด•เตเด•เต เด†เดตเดถเตเดฏเดฎเดพเดฏ เดฒเตˆเดฌเตเดฐเดฑเดฟเด•เตพ เด‡เดฑเด•เตเด•เตเดฎเดคเดฟ เดšเต†เดฏเตเดฏเดพเด‚:

import pandas as pd
import numpy as np

เด•เต‚เดŸเตเดคเตฝ เดชเตเดฐเต‹เดธเดธเตเดธเดฟเด‚เด—เดฟเดจเดพเดฏเดฟ .csv เดซเดฏเดฒเตเด•เตพ เดกเต—เตบเดฒเต‹เดกเต เดšเต†เดฏเตเดฏเดพเตป เดชเดพเดฃเตเดŸเด•เตพ เดžเด™เตเด™เดณเต† เด…เดจเตเดตเดฆเดฟเด•เตเด•เตเด‚.

เดธเด‚เด–เตเดฏเด•เดณเตเดณเตเดณ เด’เดฐเต เดฎเดพเดŸเตเดฐเดฟเด•เตโ€Œเดธเต เด†เดฏเดฟ เดžเด™เตเด™เดณเตเดŸเต† เดกเดพเดฑเตเดฑเดพ เดŸเต‡เดฌเดฟเดณเดฟเดจเต† เดชเตเดฐเดคเดฟเดจเดฟเดงเต€เด•เดฐเดฟเด•เตเด•เดพเตป Numpy เด†เดตเดถเตเดฏเดฎเดพเดฃเต.
เดฎเตเดจเตเดจเต‡เดพเดŸเตเดŸเตเดชเต‡เดพเด•เตเด•. เดจเดฎเตเด•เตเด•เต train.csv เดซเดฏเตฝ เดŽเดŸเตเดคเตเดคเต เดžเด™เตเด™เดณเดฟเดฒเต‡เด•เตเด•เต เด…เดชเตโ€Œเดฒเต‹เดกเต เดšเต†เดฏเตเดฏเดพเด‚:

dataset = pd.read_csv('train.csv')

เดกเดพเดฑเตเดฑเดพเดธเต†เดฑเตเดฑเต เดตเต‡เดฐเดฟเดฏเดฌเดฟเดณเดฟเดฒเต‚เดŸเต† เดžเด™เตเด™เตพ เดžเด™เตเด™เดณเตเดŸเต† train.csv เดกเดพเดฑเตเดฑ เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เตฝ เดชเดฐเดพเดฎเตผเดถเดฟเด•เตเด•เตเด‚. เด…เดตเดฟเดŸเต† เดŽเดจเตเดคเดพเดฃเต†เดจเตเดจเต เดจเต‹เด•เตเด•เดพเด‚:

dataset.head()

เดกเดพเดฑเตเดฑเดพ เดธเดฏเตปเดธเดฟเดฒเต† เดจเดฟเด™เตเด™เดณเตเดŸเต† เด†เดฆเตเดฏ เดšเตเดตเดŸเต. เดŸเตˆเดฑเตเดฑเดพเดจเดฟเด•เต

เดนเต†เดกเต() เดซเด‚เด—เตเดทเตป เด’เดฐเต เดกเดพเดฑเตเดฑเดพเดซเตเดฐเต†เดฏเดฟเดฎเดฟเดจเตเดฑเต† เด†เดฆเตเดฏ เด•เตเดฑเดšเตเดšเต เดตเดฐเดฟเด•เตพ เดจเต‹เด•เตเด•เดพเตป เดจเดฎเตเดฎเต† เด…เดจเตเดตเดฆเดฟเด•เตเด•เตเดจเตเดจเต.

เดˆ เดกเดพเดฑเตเดฑเดพเดซเตเดฐเต†เดฏเดฟเดฎเดฟเตฝ เด…เดฑเดฟเดฏเดชเตเดชเต†เดŸเตเดจเตเดจ เดžเด™เตเด™เดณเตเดŸเต† เดซเดฒเด™เตเด™เดณเดพเดฃเต เด…เดคเดฟเดœเต€เดตเดฟเดšเตเดš เดจเดฟเดฐเด•เตพ. เดŸเดพเดธเตโ€Œเด•เต เดšเต‹เดฆเตเดฏเดคเตเดคเดฟเดจเต, test.csv เดกเดพเดฑเตเดฑเดฏเตโ€Œเด•เตเด•เดพเดฏเตเดณเตเดณ เด…เดคเดฟเดœเต€เดตเดฟเดšเตเดš เด•เต‹เดณเด‚ เดžเด™เตเด™เตพ เดชเตเดฐเดตเดšเดฟเด•เตเด•เต‡เดฃเตเดŸเดคเตเดฃเตเดŸเต. เดˆ เดกเดพเดฑเตเดฑ เดŸเตˆเดฑเตเดฑเดพเดจเดฟเด•เตเด•เดฟเดฒเต† เดฎเดฑเตเดฑเต เดฏเดพเดคเตเดฐเด•เตเด•เดพเดฐเต†เด•เตเด•เตเดฑเดฟเดšเตเดšเตเดณเตเดณ เดตเดฟเดตเดฐเด™เตเด™เตพ เดธเด‚เดญเดฐเดฟเด•เตเด•เตเดจเตเดจเต, เด…เดคเดฟเดจเดพเดฏเดฟ เดžเด™เตเด™เตพ, เดชเตเดฐเดถเตเดจเด‚ เดชเดฐเดฟเดนเดฐเดฟเด•เตเด•เตเดจเตเดจเต, เดซเดฒเด‚ เด…เดฑเดฟเดฏเดฟเดฒเตเดฒ.

เด…เดคเดฟเดจเดพเตฝ, เดจเดฎเตเด•เตเด•เต เดจเดฎเตเดฎเตเดŸเต† เดชเดŸเตเดŸเดฟเด•เดฏเต† เด†เดถเตเดฐเดฟเดคเดตเตเด‚ เดธเตเดตเดคเดจเตเดคเตเดฐเดตเตเดฎเดพเดฏ เดกเดพเดฑเตเดฑเดฏเดพเดฏเดฟ เดตเดฟเดญเดœเดฟเด•เตเด•เดพเด‚. เด‡เดตเดฟเดŸเต† เดŽเดฒเตเดฒเดพเด‚ เดฒเดณเดฟเดคเดฎเดพเดฃเต. เดซเดฒเด™เตเด™เดณเดฟเดฒเตเดณเตเดณ เดธเตเดตเดคเดจเตเดคเตเดฐ เดกเดพเดฑเตเดฑเดฏเต† เด†เดถเตเดฐเดฏเดฟเดšเตเดšเดฟเดฐเดฟเด•เตเด•เตเดจเตเดจ เดกเดพเดฑเตเดฑเดฏเดพเดฃเต เด†เดถเตเดฐเดฟเดค เดกเดพเดฑเตเดฑ. เดซเดฒเดคเตเดคเต† เดธเตเดตเดพเดงเต€เดจเดฟเด•เตเด•เตเดจเตเดจ เดกเดพเดฑเตเดฑเดฏเดพเดฃเต เดธเตเดตเดคเดจเตเดคเตเดฐ เดกเดพเดฑเตเดฑ.

เด‰เดฆเดพเดนเดฐเดฃเดคเตเดคเดฟเดจเต, เดžเด™เตเด™เตพเด•เตเด•เต เด‡เดจเดฟเดชเตเดชเดฑเดฏเตเดจเตเดจ เดกเดพเดฑเตเดฑ เดธเต†เดฑเตเดฑเต เด‰เดฃเตเดŸเต:

โ€œเดตเต‹เดต เด•เดฎเตเดชเตเดฏเต‚เดŸเตเดŸเตผ เดธเดฏเตปเดธเต เดชเด เดฟเดชเตเดชเดฟเดšเตเดšเต - เด‡เดฒเตเดฒ.
เด•เดฎเตเดชเตเดฏเต‚เดŸเตเดŸเตผ เดธเดฏเตปเดธเดฟเตฝ เดตเต‹เดตเดฏเตเด•เตเด•เต 2 เดฒเดญเดฟเดšเตเดšเต.

เด•เดฎเตเดชเตเดฏเต‚เดŸเตเดŸเตผ เดธเดฏเตปเดธเดฟเดฒเต† เด—เตเดฐเต‡เดกเต เดšเต‹เดฆเตเดฏเดคเตเดคเดฟเดจเตเดณเตเดณ เด‰เดคเตเดคเดฐเดคเตเดคเต† เด†เดถเตเดฐเดฏเดฟเดšเตเดšเดฟเดฐเดฟเด•เตเด•เตเดจเตเดจเต: เดตเต‹เดต เด•เดฎเตเดชเตเดฏเต‚เดŸเตเดŸเตผ เดธเดฏเตปเดธเต เดชเด เดฟเดšเตเดšเต‹? เดตเตเดฏเด•เตเดคเดฎเดพเดฃเต‹? เดจเดฎเตเด•เตเด•เต เดฎเตเดจเตเดจเต‹เดŸเตเดŸเต เดชเต‹เด•เดพเด‚, เดžเด™เตเด™เตพ เด‡เดคเดฟเดจเด•เด‚ เดฒเด•เตเดทเตเดฏเดคเตเดคเดฟเดฒเต‡เด•เตเด•เต เด…เดŸเตเดคเตเดคเดฟเดฐเดฟเด•เตเด•เตเดจเตเดจเต!

เดธเตเดตเดคเดจเตเดคเตเดฐ เดกเดพเดฑเตเดฑเดฏเตเด•เตเด•เตเดณเตเดณ เดชเดฐเดฎเตเดชเดฐเดพเด—เดค เดตเต‡เดฐเดฟเดฏเดฌเดฟเตพ X เด†เดฃเต. เด†เดถเตเดฐเดฟเดค เดกเดพเดฑเตเดฑเดฏเตเด•เตเด•เต, y.

เดžเด™เตเด™เตพ เด‡เดจเดฟเดชเตเดชเดฑเดฏเตเดจเตเดจเดต เดšเต†เดฏเตเดฏเตเดจเตเดจเต:

X = dataset.iloc[ : , 2 : ]
y = dataset.iloc[ : , 1 : 2 ]

เด…เดคเต เดŽเดจเตเดคเดพเดฃเต? iloc[:, 2: ] เดŽเดจเตเดจ เดซเด‚เด—เตโ€Œเดทเตป เด‰เดชเดฏเต‹เด—เดฟเดšเตเดšเต เดžเด™เตเด™เตพ เดชเตˆเดคเตเดคเดฃเดฟเดจเต‹เดŸเต เดชเดฑเดฏเตเดจเตเดจเต: เดฐเดฃเตเดŸเดพเดฎเดคเตเดคเต† เดจเดฟเดฐเดฏเดฟเตฝ เดจเดฟเดจเตเดจเต เด†เดฐเด‚เดญเดฟเด•เตเด•เตเดจเตเดจ เดกเดพเดฑเตเดฑ เดตเต‡เดฐเดฟเดฏเดฌเดฟเดณเดฟเตฝ X-เตฝ เด•เดพเดฃเดพเตป เดžเดพเตป เด†เด—เตเดฐเดนเดฟเด•เตเด•เตเดจเตเดจเต (เดŽเดฃเตเดฃเตฝ เดชเต‚เดœเตเดฏเดคเตเดคเดฟเตฝ เดจเดฟเดจเตเดจเต เด†เดฐเด‚เดญเดฟเด•เตเด•เตเดจเตเดจเดคเต เด‰เตพเดชเตเดชเต†เดŸเต†). เดฐเดฃเตเดŸเดพเดฎเดคเตเดคเต† เดตเดฐเดฟเดฏเดฟเตฝ, เด†เดฆเตเดฏเดคเตเดคเต† เด•เต‹เดณเดคเตเดคเดฟเดฒเต† เดกเดพเดฑเตเดฑ เด•เดพเดฃเดพเตป เดžเด™เตเด™เตพ เด†เด—เตเดฐเดนเดฟเด•เตเด•เตเดจเตเดจเตเดตเต†เดจเตเดจเต เดžเด™เตเด™เตพ เดชเดฑเดฏเตเดจเตเดจเต.

[a:b, c:d ] เดŽเดจเตเดจเดคเต เดชเดฐเดพเตปเดคเต€เดธเดฟเดธเดฟเตฝ เดจเดฎเตเดฎเตพ เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเดจเตเดจเดคเดฟเดจเตเดฑเต† เดจเดฟเตผเดฎเตเดฎเดพเดฃเดฎเดพเดฃเต. เดจเดฟเด™เตเด™เตพ เดตเต‡เดฐเดฟเดฏเดฌเดฟเดณเตเด•เดณเตŠเดจเตเดจเตเด‚ เดตเตเดฏเด•เตเดคเดฎเดพเด•เตเด•เดฟเดฏเดฟเดŸเตเดŸเดฟเดฒเตเดฒเต†เด™เตเด•เดฟเตฝ, เด…เดต เดธเตเดฅเดฟเดฐเดธเตเดฅเดฟเดคเดฟเดฏเดพเดฏเดฟ เดธเด‚เดฐเด•เตเดทเดฟเด•เตเด•เดชเตเดชเต†เดŸเตเด‚. เด…เดคเดพเดฏเดคเต, เดจเดฎเตเด•เตเด•เต [:,: d] เดตเตเดฏเด•เตเดคเดฎเดพเด•เตเด•เดพเด‚, เดคเตเดŸเตผเดจเตเดจเต เดกเดพเดฑเตเดฑเดพเดซเตเดฐเต†เดฏเดฟเดฎเดฟเดฒเต† เดŽเดฒเตเดฒเดพ เด•เต‹เดณเด™เตเด™เดณเตเด‚ เดฒเดญเดฟเด•เตเด•เตเด‚, เดจเดฎเตเดชเตผ d เดฎเตเดคเตฝ เดฎเตเดจเตเดจเต‹เดŸเตเดŸเต เดชเต‹เด•เตเดจเตเดจเดต เด’เดดเดฟเด•เต†. a, b เดŽเดจเตเดจเต€ เดตเต‡เดฐเดฟเดฏเดฌเดฟเดณเตเด•เตพ เดธเตเดŸเตเดฐเดฟเด‚เด—เตเด•เดณเต† เดจเดฟเตผเดตเดšเดฟเด•เตเด•เตเดจเตเดจเต, เดชเด•เตเดทเต‡ เดจเดฎเตเด•เตเด•เต เด…เดตเดฏเต†เดฒเตเดฒเดพเด‚ เด†เดตเดถเตเดฏเดฎเดพเดฃเต, เด…เดคเดฟเดจเดพเตฝ เดžเด™เตเด™เตพ เด‡เดคเต เดธเตเดฅเดฟเดฐเดธเตเดฅเดฟเดคเดฟเดฏเดพเดฏเดฟ เด‰เดชเต‡เด•เตเดทเดฟเด•เตเด•เตเดจเตเดจเต.

เดจเดฎเตเด•เตเด•เต เดŽเดจเตเดคเดพเดฃเต เดฒเดญเดฟเดšเตเดšเดคเต†เดจเตเดจเต เดจเต‹เด•เตเด•เดพเด‚:

X.head()

เดกเดพเดฑเตเดฑเดพ เดธเดฏเตปเดธเดฟเดฒเต† เดจเดฟเด™เตเด™เดณเตเดŸเต† เด†เดฆเตเดฏ เดšเตเดตเดŸเต. เดŸเตˆเดฑเตเดฑเดพเดจเดฟเด•เต

y.head()

เดกเดพเดฑเตเดฑเดพ เดธเดฏเตปเดธเดฟเดฒเต† เดจเดฟเด™เตเด™เดณเตเดŸเต† เด†เดฆเตเดฏ เดšเตเดตเดŸเต. เดŸเตˆเดฑเตเดฑเดพเดจเดฟเด•เต

เดˆ เดšเต†เดฑเดฟเดฏ เดชเดพเด เด‚ เดฒเดณเดฟเดคเดฎเดพเด•เตเด•เตเดจเตเดจเดคเดฟเดจเต, เดชเตเดฐเดคเตเดฏเต‡เด• เดชเดฐเดฟเดšเดฐเดฃเด‚ เด†เดตเดถเตเดฏเดฎเตเดณเตเดณ เด…เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ เด…เดคเดฟเดœเต€เดตเดจเดคเตเดคเต† เดฌเดพเดงเดฟเด•เตเด•เดพเดคเตเดค เดจเดฟเดฐเด•เตพ เดžเด™เตเด™เตพ เดจเต€เด•เตเด•เด‚ เดšเต†เดฏเตเดฏเตเด‚. เด…เดตเดฏเดฟเตฝ str เดŸเตˆเดชเตเดชเดฟเดจเตเดฑเต† เดกเดพเดฑเตเดฑ เด…เดŸเด™เตเด™เดฟเดฏเดฟเดฐเดฟเด•เตเด•เตเดจเตเดจเต.

count = ['Name', 'Ticket', 'Cabin', 'Embarked']
X.drop(count, inplace=True, axis=1)

เดธเต‚เดชเตเดชเตผ! เดจเดฎเตเด•เตเด•เต เด…เดŸเตเดคเตเดค เด˜เดŸเตเดŸเดคเตเดคเดฟเดฒเต‡เด•เตเด•เต เด•เดŸเด•เตเด•เดพเด‚.

เด˜เดŸเตเดŸเด‚ เดฎเต‚เดจเตเดจเต

เด‡เดตเดฟเดŸเต† เดžเด™เตเด™เตพ เดžเด™เตเด™เดณเตเดŸเต† เดกเดพเดฑเตเดฑ เดŽเตปเด•เต‹เดกเต เดšเต†เดฏเตเดฏเต‡เดฃเตเดŸเดคเตเดฃเตเดŸเต, เด…เดคเตเดตเดดเดฟ เดˆ เดกเดพเดฑเตเดฑ เดซเดฒเดคเตเดคเต† เดŽเด™เตเด™เดจเต† เดฌเดพเดงเดฟเด•เตเด•เตเดจเตเดจเตเดตเต†เดจเตเดจเต เดฎเต†เดทเต€เตป เดจเดจเตเดจเดพเดฏเดฟ เดฎเดจเดธเตเดธเดฟเดฒเดพเด•เตเด•เตเดจเตเดจเต. เดŽเดจเตเดจเดพเตฝ เดžเด™เตเด™เตพ เดŽเดฒเตเดฒเดพเด‚ เดŽเตปเด•เต‹เดกเต เดšเต†เดฏเตเดฏเดฟเดฒเตเดฒ, เดชเด•เตเดทเต‡ เดžเด™เตเด™เตพ เด‰เดชเต‡เด•เตเดทเดฟเดšเตเดš str เดกเดพเดฑเตเดฑ เดฎเดพเดคเตเดฐเด‚. เด•เต‹เดณเด‚ "เดธเต†เด•เตเดธเต". เดžเด™เตเด™เตพ เดŽเด™เตเด™เดจเต†เดฏเดพเดฃเต เด•เต‹เดกเต เดšเต†เดฏเตเดฏเดพเตป เด†เด—เตเดฐเดนเดฟเด•เตเด•เตเดจเตเดจเดคเต? เด’เดฐเต เดตเต†เด•เตโ€ŒเดŸเดฑเดพเดฏเดฟ เด’เดฐเต เดตเตเดฏเด•เตเดคเดฟเดฏเตเดŸเต† เดฒเดฟเด‚เด—เดคเตเดคเต†เด•เตเด•เตเดฑเดฟเดšเตเดšเตเดณเตเดณ เดกเดพเดฑเตเดฑ เดชเตเดฐเดคเดฟเดจเดฟเดงเต€เด•เดฐเดฟเด•เตเด•เดพเด‚: 10 - เดชเตเดฐเตเดทเตป, 01 - เดธเตเดคเตเดฐเต€.

เด†เดฆเตเดฏเด‚, เดจเดฎเตเด•เตเด•เต เดจเดฎเตเดฎเตเดŸเต† เดชเดŸเตเดŸเดฟเด•เด•เตพ เด’เดฐเต NumPy เดฎเดพเดŸเตเดฐเดฟเด•เตเดธเดฟเดฒเต‡เด•เตเด•เต เดชเดฐเดฟเดตเตผเดคเตเดคเดจเด‚ เดšเต†เดฏเตเดฏเดพเด‚:

X = np.array(X)
y = np.array(y)

เด‡เดจเดฟ เดจเดฎเตเด•เตเด•เต เดจเต‹เด•เตเด•เดพเด‚:

from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import OneHotEncoder

ct = ColumnTransformer(transformers=[('encoder', OneHotEncoder(), [1])],
                       remainder='passthrough')
X = np.array(ct.fit_transform(X))

เดกเดพเดฑเตเดฑเดพ เดธเดฏเตปเดธเดฟเตฝ เดชเต‚เตผเดฃเตเดฃเดฎเดพเดฏ เดœเต‹เดฒเดฟ เดšเต†เดฏเตเดฏเดพเตป เดžเด™เตเด™เดณเต† เด…เดจเตเดตเดฆเดฟเด•เตเด•เตเดจเตเดจ เด’เดฐเต เดฐเดธเด•เดฐเดฎเดพเดฏ เดฒเตˆเดฌเตเดฐเดฑเดฟเดฏเดพเดฃเต sklearn เดฒเตˆเดฌเตเดฐเดฑเดฟ. เด‡เดคเดฟเตฝ เดงเดพเดฐเดพเดณเด‚ เดฐเดธเด•เดฐเดฎเดพเดฏ เดฎเต†เดทเต€เตป เดฒเต‡เดฃเดฟเด‚เด—เต เดฎเต‹เดกเดฒเตเด•เตพ เด…เดŸเด™เตเด™เดฟเดฏเดฟเดฐเดฟเด•เตเด•เตเดจเตเดจเต เด•เต‚เดŸเดพเดคเต† เดกเดพเดฑเตเดฑ เดคเดฏเตเดฏเดพเดฑเดพเด•เตเด•เดพเดจเตเด‚ เดžเด™เตเด™เดณเต† เด…เดจเตเดตเดฆเดฟเด•เตเด•เตเดจเตเดจเต.

เดžเด™เตเด™เตพ เดตเดฟเดตเดฐเดฟเดšเตเดšเดคเตเดชเต‹เดฒเต†, เด† เดชเตเดฐเดพเดคเดฟเดจเดฟเดงเตเดฏเดคเตเดคเดฟเตฝ เด’เดฐเต เดตเตเดฏเด•เตเดคเดฟเดฏเตเดŸเต† เดฒเดฟเด‚เด—เดญเต‡เดฆเด‚ เดŽเตปเด•เต‹เดกเต เดšเต†เดฏเตเดฏเดพเตป OneHotEncoder เดžเด™เตเด™เดณเต† เด…เดจเตเดตเดฆเดฟเด•เตเด•เตเด‚. 2 เด•เตเดฒเดพเดธเตเด•เตพ เดธเตƒเดทเตเดŸเดฟเด•เตเด•เตเด‚: เดชเตเดฐเตเดทเตป, เดธเตเดคเตเดฐเต€. เดตเตเดฏเด•เตเดคเดฟ เด’เดฐเต เดชเตเดฐเตเดทเดจเดพเดฃเต†เด™เตเด•เดฟเตฝ, เดฏเดฅเดพเด•เตเดฐเดฎเด‚ 1 "เดชเตเดฐเตเดทเตป" เด•เต‹เดณเดคเตเดคเดฟเดฒเตเด‚ 0 "เดธเตเดคเตเดฐเต€" เด•เต‹เดณเดคเตเดคเดฟเดฒเตเด‚ เดŽเดดเตเดคเดชเตเดชเต†เดŸเตเด‚.

OneHotEncoder() เดจเต เดถเต‡เดทเด‚ [1] เด‰เดฃเตเดŸเต - เด‡เดคเดฟเดจเตผเดคเตเดฅเด‚ เด•เต‹เดณเด‚ เดจเดฎเตเดชเตผ 1 เดŽเตปเด•เต‹เดกเต เดšเต†เดฏเตเดฏเดพเตป เดžเด™เตเด™เตพ เด†เด—เตเดฐเดนเดฟเด•เตเด•เตเดจเตเดจเต เดŽเดจเตเดจเดพเดฃเต (เดชเต‚เดœเตเดฏเด‚ เดฎเตเดคเตฝ เดŽเดฃเตเดฃเตเดจเตเดจเดคเต).

เดธเต‚เดชเตเดชเตผ. เดจเดฎเตเด•เตเด•เต เด‡เดจเดฟเดฏเตเด‚ เดฎเตเดจเตเดจเต‹เดŸเตเดŸเต เดชเต‹เด•เดพเด‚!

เดšเดŸเตเดŸเด‚ เดชเต‹เดฒเต†, เดšเดฟเดฒ เดกเดพเดฑเตเดฑ เดถเต‚เดจเตเดฏเดฎเดพเดฏเดฟ เด…เดตเดถเต‡เดทเดฟเด•เตเด•เตเดจเตเดจเต (เด…เดคเดพเดฏเดคเต, NaN - เด’เดฐเต เดธเด‚เด–เตเดฏเดฏเดฒเตเดฒ). เด‰เดฆเดพเดนเดฐเดฃเดคเตเดคเดฟเดจเต, เด’เดฐเต เดตเตเดฏเด•เตเดคเดฟเดฏเต†เด•เตเด•เตเดฑเดฟเดšเตเดšเตเดณเตเดณ เดตเดฟเดตเดฐเด™เตเด™เตพ เด‰เดฃเตเดŸเต: เด…เดตเดจเตเดฑเต† เดชเต‡เดฐเต, เดฒเดฟเด‚เด—เดญเต‡เดฆเด‚. เดŽเดจเตเดจเดพเตฝ เด‡เดฏเดพเดณเตเดŸเต† เดชเตเดฐเดพเดฏเดคเตเดคเต† เด•เตเดฑเดฟเดšเตเดšเต เดตเดฟเดตเดฐเดฎเดฟเดฒเตเดฒ. เดˆ เดธเดพเดนเดšเดฐเตเดฏเดคเตเดคเดฟเตฝ, เดžเด™เตเด™เตพ เด‡เดจเดฟเดชเตเดชเดฑเดฏเตเดจเตเดจ เดฐเต€เดคเดฟ เดชเตเดฐเดฏเต‹เด—เดฟเด•เตเด•เตเด‚: เดŽเดฒเตเดฒเดพ เด•เต‹เดณเด™เตเด™เดณเดฟเดฒเตเด‚ เดžเด™เตเด™เตพ เด—เดฃเดฟเดค เดถเดฐเดพเดถเดฐเดฟ เด•เดฃเตเดŸเต†เดคเตเดคเตเด‚, เด•เต‹เดณเดคเตเดคเดฟเตฝ เด•เตเดฑเดšเตเดšเต เดกเดพเดฑเตเดฑ เด‡เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ, เดžเด™เตเด™เตพ เด—เดฃเดฟเดค เดถเดฐเดพเดถเดฐเดฟ เด‰เดชเดฏเต‹เด—เดฟเดšเตเดšเต เดถเต‚เดจเตเดฏเดค เดชเต‚เดฐเดฟเดชเตเดชเดฟเด•เตเด•เตเด‚.

from sklearn.impute import SimpleImputer
imputer = SimpleImputer(missing_values=np.nan, strategy='mean')
imputer.fit(X)
X = imputer.transform(X)

เดกเดพเดฑเตเดฑ เดตเดณเดฐเต† เดตเดฒเตเดคเดพเดฏเดฟเดฐเดฟเด•เตเด•เตเดฎเตเดชเต‹เตพ เดธเดพเดนเดšเดฐเตเดฏเด™เตเด™เตพ เดธเด‚เดญเดตเดฟเด•เตเด•เตเดจเตเดจเตเดตเต†เดจเตเดจเต เด‡เดชเตเดชเต‹เตพ เดจเดฎเตเด•เตเด•เต เด•เดฃเด•เตเด•เดฟเดฒเต†เดŸเตเด•เตเด•เดพเด‚. เดšเดฟเดฒ เดกเดพเดฑเตเดฑ เด‡เดŸเดตเต‡เดณเดฏเดฟเดฒเดพเดฃเต [0:1], เดšเดฟเดฒเดคเต เดจเต‚เดฑเตเด•เดฃเด•เตเด•เดฟเดจเต เด†เดฏเดฟเดฐเด•เตเด•เดฃเด•เตเด•เดฟเดจเต เด•เดตเดฟเดžเตเดžเต‡เด•เตเด•เดพเด‚. เด…เดคเตเดคเดฐเด‚ เดธเตเด•เดพเดฑเตเดฑเตผ เด‡เดฒเตเดฒเดพเดคเดพเด•เตเด•เดพเดจเตเด‚ เด•เดฎเตเดชเตเดฏเต‚เดŸเตเดŸเตผ เด…เดคเดฟเดจเตเดฑเต† เด•เดฃเด•เตเด•เตเด•เต‚เดŸเตเดŸเดฒเตเด•เดณเดฟเตฝ เด•เต‚เดŸเตเดคเตฝ เด•เตƒเดคเตเดฏเดคเดฏเตเดณเตเดณเดคเดพเด•เตเด•เดพเดจเตเด‚, เดžเด™เตเด™เตพ เดกเดพเดฑเตเดฑ เดธเตเด•เดพเตป เดšเต†เดฏเตเดฏเตเด•เดฏเตเด‚ เด…เดคเต เดธเตเด•เต†เดฏเดฟเตฝ เดšเต†เดฏเตเดฏเตเด•เดฏเตเด‚ เดšเต†เดฏเตเดฏเตเด‚. เดŽเดฒเตเดฒเดพ เด…เด•เตเด•เด™เตเด™เดณเตเด‚ เดฎเต‚เดจเตเดจเดฟเตฝ เด•เต‚เดŸเดฐเตเดคเต. เด‡เดคเต เดšเต†เดฏเตเดฏเตเดจเตเดจเดคเดฟเดจเต, เดžเด™เตเด™เตพ StandardScaler เดซเด‚เด—เตเดทเตป เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเด‚.

from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X[:, 2:] = sc.fit_transform(X[:, 2:])

เด‡เดชเตเดชเต‹เตพ เดžเด™เตเด™เดณเตเดŸเต† เดกเดพเดฑเตเดฑ เด‡เดคเตเดชเต‹เดฒเต† เด•เดพเดฃเดชเตเดชเต†เดŸเตเดจเตเดจเต:

เดกเดพเดฑเตเดฑเดพ เดธเดฏเตปเดธเดฟเดฒเต† เดจเดฟเด™เตเด™เดณเตเดŸเต† เด†เดฆเตเดฏ เดšเตเดตเดŸเต. เดŸเตˆเดฑเตเดฑเดพเดจเดฟเด•เต

เด•เตเดฒเดพเดธเต. เดžเด™เตเด™เตพ เด‡เดคเดฟเดจเด•เด‚ เดžเด™เตเด™เดณเตเดŸเต† เดฒเด•เตเดทเตเดฏเดคเตเดคเดฟเดจเดŸเตเดคเตเดคเดพเดฃเต!

เด˜เดŸเตเดŸเด‚ เดจเดพเดฒเต

เดจเดฎเตเด•เตเด•เต เดจเดฎเตเดฎเตเดŸเต† เด†เดฆเตเดฏ เดฎเต‹เดกเดฒเดฟเดจเต† เดชเดฐเดฟเดถเต€เดฒเดฟเดชเตเดชเดฟเด•เตเด•เดพเด‚! เดธเตเด•เตเดฒเต‡เตบ เดฒเตˆเดฌเตเดฐเดฑเดฟเดฏเดฟเตฝ เดจเดฟเดจเตเดจเต เดจเดฎเตเด•เตเด•เต เดฐเดธเด•เดฐเดฎเดพเดฏ เดจเดฟเดฐเดตเดงเดฟ เด•เดพเดฐเตเดฏเด™เตเด™เตพ เด•เดฃเตเดŸเต†เดคเตเดคเดพเตป เด•เดดเดฟเดฏเตเด‚. เดˆ เดชเตเดฐเดถเตเดจเดคเตเดคเดฟเดจเต เดžเดพเตป เด—เตเดฐเต‡เดกเดฟเดฏเดจเตเดฑเต เดฌเต‚เดธเตเดฑเตเดฑเดฟเด‚เด—เต เด•เตเดฒเดพเดธเดฟเดซเดฏเตผ เดฎเต‹เดกเตฝ เดชเตเดฐเดฏเต‹เด—เดฟเดšเตเดšเต. เดžเด™เตเด™เดณเตเดŸเต† เดŸเดพเดธเตโ€Œเด•เต เด’เดฐเต เด•เตเดฒเดพเดธเดฟเดซเดฟเด•เตเด•เต‡เดทเตป เดŸเดพเดธเตโ€Œเด•เต เด†เดฏเดคเดฟเดจเดพเตฝ เดžเด™เตเด™เตพ เดŽ เด•เตเดฒเดพเดธเดฟเดซเดฏเตผ เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเดจเตเดจเต. เดชเตเดฐเดตเดšเดจเด‚ 1 (เด…เดคเดฟเดœเต€เดตเดฟเดšเตเดšเดคเต) เด…เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ 0 (เด…เดคเดฟเดœเต€เดตเดฟเดšเตเดšเดฟเดฒเตเดฒ) เด…เดธเตˆเตป เดšเต†เดฏเตเดฏเดฃเด‚.

from sklearn.ensemble import GradientBoostingClassifier
gbc = GradientBoostingClassifier(learning_rate=0.5, max_depth=5, n_estimators=150)
gbc.fit(X, y)

เดซเดฟเดฑเตเดฑเต เดซเด‚เด—เตโ€Œเดทเตป เดชเตˆเดคเตเดคเดฃเดฟเดจเต‹เดŸเต เดชเดฑเดฏเตเดจเตเดจเต: X, y เดŽเดจเตเดจเดฟเดตเดฏเตโ€Œเด•เตเด•เดฟเดŸเดฏเดฟเดฒเตเดณเตเดณ เดกเดฟเดชเตปเดกเตปเดธเดฟเด•เตพเด•เตเด•เดพเดฏเดฟ เดฎเต‹เดกเตฝ เดจเต‹เด•เตเด•เดŸเตเดŸเต†.

เด’เดฐเต เดธเต†เด•เตเด•เตปเดกเดฟเตฝ เด•เตเดฑเดตเต, เดฎเต‹เดกเตฝ เดคเดฏเตเดฏเดพเดฑเดพเดฃเต.

เดกเดพเดฑเตเดฑเดพ เดธเดฏเตปเดธเดฟเดฒเต† เดจเดฟเด™เตเด™เดณเตเดŸเต† เด†เดฆเตเดฏ เดšเตเดตเดŸเต. เดŸเตˆเดฑเตเดฑเดพเดจเดฟเด•เต

เด…เดคเต เดŽเด™เตเด™เดจเต† เดชเตเดฐเดฏเต‹เด—เดฟเด•เตเด•เดพเด‚? เดจเดฎเตเด•เตเด•เต เด‡เดชเตเดชเต‹เตพ เด•เดพเดฃเดพเด‚!

เด˜เดŸเตเดŸเด‚ เด…เดžเตเดšเต. เด‰เดชเดธเด‚เดนเดพเดฐเด‚

เด‡เดชเตเดชเต‹เตพ เดจเดฎเตเด•เตเด•เต เด’เดฐเต เดชเตเดฐเดตเดšเดจเด‚ เดจเดŸเดคเตเดคเต‡เดฃเตเดŸ เดŸเต†เดธเตเดฑเตเดฑเต เดกเดพเดฑเตเดฑเดฏเตเดณเตเดณ เด’เดฐเต เดŸเต‡เดฌเดฟเตพ เดฒเต‹เดกเต เดšเต†เดฏเตเดฏเต‡เดฃเตเดŸเดคเตเดฃเตเดŸเต. เดˆ เดชเดŸเตเดŸเดฟเด• เด‰เดชเดฏเต‹เด—เดฟเดšเตเดšเต เดžเด™เตเด™เตพ X-เดจเต เดšเต†เดฏเตเดค เด…เดคเต‡ เดชเตเดฐเดตเตผเดคเตเดคเดจเด™เตเด™เดณเต†เดฒเตเดฒเดพเด‚ เดšเต†เดฏเตเดฏเตเด‚.

X_test = pd.read_csv('test.csv', index_col=0)

count = ['Name', 'Ticket', 'Cabin', 'Embarked']
X_test.drop(count, inplace=True, axis=1)

X_test = np.array(X_test)

from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import OneHotEncoder
ct = ColumnTransformer(transformers=[('encoder', OneHotEncoder(), [1])],
                       remainder='passthrough')
X_test = np.array(ct.fit_transform(X_test))

from sklearn.impute import SimpleImputer
imputer = SimpleImputer(missing_values=np.nan, strategy='mean')
imputer.fit(X_test)
X_test = imputer.transform(X_test)

from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_test[:, 2:] = sc.fit_transform(X_test[:, 2:])

เดจเดฎเตเด•เตเด•เต เด‡เดชเตเดชเต‹เตพ เดจเดฎเตเดฎเตเดŸเต† เดฎเดพเดคเตƒเด• เดชเตเดฐเดฏเต‹เด—เดฟเด•เตเด•เดพเด‚!

gbc_predict = gbc.predict(X_test)

เดŽเดฒเตเดฒเดพเด‚. เดžเด™เตเด™เตพ เด’เดฐเต เดชเตเดฐเดตเดšเดจเด‚ เดจเดŸเดคเตเดคเดฟ. เด‡เดจเดฟ เด…เดคเต csv เดฏเดฟเตฝ เดฐเต‡เด–เดชเตเดชเต†เดŸเตเดคเตเดคเดฟ เดตเต†เดฌเตเดธเตˆเดฑเตเดฑเดฟเดฒเต‡เด•เตเด•เต เด…เดฏเด•เตเด•เต‡เดฃเตเดŸเดคเตเดฃเตเดŸเต.

np.savetxt('my_gbc_predict.csv', gbc_predict, delimiter=",", header = 'Survived')

เดคเดฏเตเดฏเดพเดฑเดพเดฃเต. เด“เดฐเต‹ เดฏเดพเดคเตเดฐเด•เตเด•เดพเดฐเดจเตเดฑเต†เดฏเตเด‚ เดชเตเดฐเดตเดšเดจเด™เตเด™เตพ เด…เดŸเด™เตเด™เดฟเดฏ เด’เดฐเต เดซเดฏเตฝ เดžเด™เตเด™เตพเด•เตเด•เต เดฒเดญเดฟเดšเตเดšเต. เดˆ เดชเดฐเดฟเดนเดพเดฐเด™เตเด™เตพ เดตเต†เดฌเตโ€Œเดธเตˆเดฑเตเดฑเดฟเดฒเต‡เด•เตเด•เต เด…เดชเตโ€Œเดฒเต‹เดกเต เดšเต†เดฏเตเดฏเตเด•เดฏเตเด‚ เดชเตเดฐเดตเดšเดจเดคเตเดคเดฟเดจเตเดฑเต† เด’เดฐเต เดตเดฟเดฒเดฏเดฟเดฐเตเดคเตเดคเตฝ เดจเต‡เดŸเตเด•เดฏเตเด‚ เดšเต†เดฏเตเดฏเตเด• เดŽเดจเตเดจเดคเดพเดฃเต เด…เดตเดถเต‡เดทเดฟเด•เตเด•เตเดจเตเดจเดคเต. เด…เดคเตเดคเดฐเดฎเตŠเดฐเต เดชเตเดฐเดพเด•เตƒเดค เดชเดฐเดฟเดนเดพเดฐเด‚ เดชเตŠเดคเตเดœเดจเด™เตเด™เดณเดฟเตฝ 74% เดถเดฐเดฟเดฏเดพเดฏ เด‰เดคเตเดคเดฐเด™เตเด™เตพ เดฎเดพเดคเตเดฐเดฎเดฒเตเดฒ, เดกเดพเดฑเตเดฑเดพ เดธเดฏเตปเดธเดฟเตฝ เดšเดฟเดฒ เดชเตเดฐเดšเต‹เดฆเดจเดตเตเด‚ เดจเตฝเด•เตเดจเตเดจเต. เดเดฑเตเดฑเดตเตเด‚ เดœเดฟเดœเตเดžเดพเดธเดฏเตเดณเตเดณเดตเตผเด•เตเด•เต เดŽเดชเตเดชเต‹เตพ เดตเต‡เดฃเดฎเต†เด™เตเด•เดฟเดฒเตเด‚ เดŽเดจเดฟเด•เตเด•เต เดธเตเดตเด•เดพเดฐเตเดฏ เดธเดจเตเดฆเต‡เดถเด™เตเด™เดณเดฟเตฝ เดŽเดดเตเดคเดพเดจเตเด‚ เด’เดฐเต เดšเต‹เดฆเตเดฏเด‚ เดšเต‹เดฆเดฟเด•เตเด•เดพเดจเตเด‚ เด•เดดเดฟเดฏเตเด‚. เดŽเดฒเตเดฒเดพเดตเตผเด•เตเด•เตเด‚เดจเดจเตเดฆเดฟ!

เด…เดตเดฒเด‚เดฌเด‚: www.habr.com

เด’เดฐเต เด…เดญเดฟเดชเตเดฐเดพเดฏเด‚ เดšเต‡เตผเด•เตเด•เตเด•