เจกเจพเจŸเจพ เจธเจพเจ‡เฉฐเจธ เจตเจฟเฉฑเจš เจคเฉเจนเจพเจกเจพ เจชเจนเจฟเจฒเจพ เจ•เจฆเจฎเฅค เจŸเจพเจ‡เจŸเฉˆเจจเจฟเจ•

เจ‡เฉฑเจ• เจ›เฉ‹เจŸเจพ เจธเจผเฉเจฐเฉ‚เจ†เจคเฉ€ เจธเจผเจฌเจฆ

เจฎเฉ‡เจฐเจพ เจฎเฉฐเจจเจฃเจพ เจนเฉˆ เจ•เจฟ เจ…เจธเฉ€เจ‚ เจนเฉ‹เจฐ เจšเฉ€เจœเจผเจพเจ‚ เจ•เจฐ เจธเจ•เจฆเฉ‡ เจนเจพเจ‚ เจœเฉ‡เจ•เจฐ เจธเจพเจจเฉ‚เฉฐ เจ•เจฆเจฎ-เจฆเจฐ-เจ•เจฆเจฎ เจนเจฟเจฆเจพเจ‡เจคเจพเจ‚ เจชเฉเจฐเจฆเจพเจจ เจ•เฉ€เจคเฉ€เจ†เจ‚ เจœเจพเจ‚เจฆเฉ€เจ†เจ‚ เจนเจจ เจœเฉ‹ เจธเจพเจจเฉ‚เฉฐ เจ‡เจน เจฆเฉฑเจธเจฃเจ—เฉ€เจ†เจ‚ เจ•เจฟ เจ•เฉ€ เจ•เจฐเจจเจพ เจนเฉˆ เจ…เจคเฉ‡ เจ‡เจน เจ•เจฟเจตเฉ‡เจ‚ เจ•เจฐเจจเจพ เจนเฉˆเฅค เจฎเฉˆเจจเฉ‚เฉฐ เจ†เจชเจฃเฉ€ เจœเจผเจฟเฉฐเจฆเจ—เฉ€ เจฆเฉ‡ เจ‰เจน เจชเจฒ เจฏเจพเจฆ เจนเจจ เจœเจฆเฉ‹เจ‚ เจฎเฉˆเจ‚ เจ•เฉเจ เจธเจผเฉเจฐเฉ‚ เจจเจนเฉ€เจ‚ เจ•เจฐ เจธเจ•เจฆเจพ เจธเฉ€ เจ•เจฟเจ‰เจ‚เจ•เจฟ เจ‡เจน เจธเจฎเจเจฃเจพ เจฎเฉเจธเจผเจ•เจฒ เจธเฉ€ เจ•เจฟ เจ•เจฟเฉฑเจฅเฉ‹เจ‚ เจธเจผเฉเจฐเฉ‚ เจ•เจฐเจจเจพ เจนเฉˆเฅค เจธเจผเจพเจ‡เจฆ, เจ‡เฉฑเจ• เจตเจพเจฐ เจ‡เฉฐเจŸเจฐเจจเฉˆเฉฑเจŸ 'เจคเฉ‡ เจคเฉเจธเฉ€เจ‚ "เจกเฉ‡เจŸเจพ เจธเจพเจ‡เฉฐเจธ" เจธเจผเจฌเจฆ เจฆเฉ‡เจ–เฉ‡ เจ…เจคเฉ‡ เจซเฉˆเจธเจฒเจพ เจ•เฉ€เจคเจพ เจ•เจฟ เจคเฉเจธเฉ€เจ‚ เจ‡เจธ เจคเฉ‹เจ‚ เจฌเจนเฉเจค เจฆเฉ‚เจฐ เจนเฉ‹, เจ…เจคเฉ‡ เจœเฉ‹ เจฒเฉ‹เจ• เจ…เจœเจฟเจนเจพ เจ•เจฐเจฆเฉ‡ เจนเจจ เจ‰เจน เจ•เจฟเจคเฉ‡ เจฌเจพเจนเจฐ, เจ•เจฟเจธเฉ‡ เจนเฉ‹เจฐ เจธเฉฐเจธเจพเจฐ เจตเจฟเฉฑเจš เจธเจจ. เจจเจนเฉ€เจ‚, เจ‰เจน เจ‡เฉฑเจฅเฉ‡ เจนเฉ€ เจนเจจเฅค เจ…เจคเฉ‡, เจธเจผเจพเจ‡เจฆ, เจ‡เจธ เจ–เฉ‡เจคเจฐ เจฆเฉ‡ เจฒเฉ‹เจ•เจพเจ‚ เจฆเจพ เจงเฉฐเจจเจตเจพเจฆ, เจคเฉเจนเจพเจกเฉ€ เจซเฉ€เจก 'เจคเฉ‡ เจ‡เฉฑเจ• เจฒเฉ‡เจ– เจชเฉเจฐเจ—เจŸ เจนเฉ‹เจ‡เจ†. เจ‡เฉฑเจฅเฉ‡ เจฌเจนเฉเจค เจธเจพเจฐเฉ‡ เจ•เฉ‹เจฐเจธ เจนเจจ เจœเฉ‹ เจคเฉเจนเจพเจจเฉ‚เฉฐ เจ‡เจธ เจ•เจฒเจพ เจฆเฉ€ เจ†เจฆเจค เจชเจพเจ‰เจฃ เจตเจฟเฉฑเจš เจฎเจฆเจฆ เจ•เจฐเจจเจ—เฉ‡, เจชเจฐ เจ‡เฉฑเจฅเฉ‡ เจฎเฉˆเจ‚ เจคเฉเจนเจพเจจเฉ‚เฉฐ เจชเจนเจฟเจฒเจพ เจ•เจฆเจฎ เจšเฉเฉฑเจ•เจฃ เจตเจฟเฉฑเจš เจฎเจฆเจฆ เจ•เจฐเจพเจ‚เจ—เจพเฅค

เจ–เฉˆเจฐ, เจ•เฉ€ เจคเฉเจธเฉ€เจ‚ เจคเจฟเจ†เจฐ เจนเฉ‹? เจฎเฉˆเจ‚ เจคเฉเจนเจพเจจเฉ‚เฉฐ เจคเฉเจฐเฉฐเจค เจฆเฉฑเจธเจฆเจพ เจนเจพเจ‚ เจ•เจฟ เจคเฉเจนเจพเจจเฉ‚เฉฐ เจชเจพเจˆเจฅเจจ 3 เจจเฉ‚เฉฐ เจœเจพเจฃเจจ เจฆเฉ€ เจœเจผเจฐเฉ‚เจฐเจค เจนเฉ‹เจเจ—เฉ€, เจ•เจฟเจ‰เจ‚เจ•เจฟ เจฎเฉˆเจ‚ เจ‡เฉฑเจฅเฉ‡ เจ‡เจนเฉ€ เจตเจฐเจค เจฐเจฟเจนเจพ เจนเจพเจ‚เฅค เจฎเฉˆเจ‚ เจคเฉเจนเจพเจจเฉ‚เฉฐ เจ‡เจน เจตเฉ€ เจธเจฒเจพเจน เจฆเจฟเฉฐเจฆเจพ เจนเจพเจ‚ เจ•เจฟ เจคเฉเจธเฉ€เจ‚ เจ‡เจธเจจเฉ‚เฉฐ เจชเจนเจฟเจฒเจพเจ‚ เจคเฉ‹เจ‚ เจœเฉเจชเฉ€เจŸเจฐ เจจเฉ‹เจŸเจฌเฉเฉฑเจ• 'เจคเฉ‡ เจธเจฅเจพเจชเจฟเจค เจ•เจฐเฉ‹ เจœเจพเจ‚ เจ—เฉ‚เจ—เจฒ เจ•เฉ‹เจฒเจฌ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฟเจตเฉ‡เจ‚ เจ•เจฐเฉ€เจเฅค

เจชเจนเจฟเจฒเจพ เจ•เจฆเจฎ

เจกเจพเจŸเจพ เจธเจพเจ‡เฉฐเจธ เจตเจฟเฉฑเจš เจคเฉเจนเจพเจกเจพ เจชเจนเจฟเจฒเจพ เจ•เจฆเจฎเฅค เจŸเจพเจ‡เจŸเฉˆเจจเจฟเจ•

เจ•เจพเจ—เจฒ เจ‡เจธ เจฎเจพเจฎเจฒเฉ‡ เจตเจฟเฉฑเจš เจคเฉเจนเจพเจกเจพ เจฎเจนเฉฑเจคเจตเจชเฉ‚เจฐเจจ เจธเจนเจพเจ‡เจ• เจนเฉˆเฅค เจธเจฟเจงเจพเจ‚เจค เจตเจฟเฉฑเจš, เจคเฉเจธเฉ€เจ‚ เจ‡เจธ เจคเฉ‹เจ‚ เจฌเจฟเจจเจพเจ‚ เจ•เจฐ เจธเจ•เจฆเฉ‡ เจนเฉ‹, เจชเจฐ เจฎเฉˆเจ‚ เจ‡เจธ เจฌเจพเจฐเฉ‡ เจ‡เฉฑเจ• เจนเฉ‹เจฐ เจฒเฉ‡เจ– เจตเจฟเฉฑเจš เจ—เฉฑเจฒ เจ•เจฐเจพเจ‚เจ—เจพ. เจ‡เจน เจ‡เฉฑเจ• เจชเจฒเฉ‡เจŸเจซเจพเจฐเจฎ เจนเฉˆ เจœเฉ‹ เจกเฉ‡เจŸเจพ เจธเจพเจ‡เฉฐเจธ เจฎเฉเจ•เจพเจฌเจฒเจฟเจ†เจ‚ เจฆเฉ€ เจฎเฉ‡เจœเจผเจฌเจพเจจเฉ€ เจ•เจฐเจฆเจพ เจนเฉˆเฅค เจ…เจœเจฟเจนเฉ‡ เจนเจฐเฉ‡เจ• เจฎเฉเจ•เจพเจฌเจฒเฉ‡ เจตเจฟเฉฑเจš, เจธเจผเฉเจฐเฉ‚เจ†เจคเฉ€ เจชเฉœเจพเจตเจพเจ‚ เจตเจฟเฉฑเจš เจคเฉเจธเฉ€เจ‚ เจตเฉฑเจ–-เจตเฉฑเจ– เจ•เจฟเจธเจฎเจพเจ‚ เจฆเฉ€เจ†เจ‚ เจธเจฎเฉฑเจธเจฟเจ†เจตเจพเจ‚ เจจเฉ‚เฉฐ เจนเฉฑเจฒ เจ•เจฐเจจ, เจตเจฟเจ•เจพเจธ เจ…เจจเฉเจญเจต เจ…เจคเฉ‡ เจ‡เฉฑเจ• เจŸเฉ€เจฎ เจตเจฟเฉฑเจš เจ•เฉฐเจฎ เจ•เจฐเจจ เจฆเจพ เจคเจœเจฐเจฌเจพ, เจœเฉ‹ เจ•เจฟ เจธเจพเจกเฉ‡ เจธเจฎเฉ‡เจ‚ เจตเจฟเฉฑเจš เจฎเจนเฉฑเจคเจตเจชเฉ‚เจฐเจจ เจนเฉˆ, เจตเจฟเฉฑเจš เจฌเจนเฉเจค เจœเจผเจฟเจ†เจฆเจพ เจ…เจจเฉเจญเจต เจชเฉเจฐเจพเจชเจค เจ•เจฐเฉ‹เจ—เฉ‡เฅค

เจ…เจธเฉ€เจ‚ เจ‰เจฅเฉ‹เจ‚ เจ†เจชเจฃเจพ เจ•เฉฐเจฎ เจฒเจตเจพเจ‚เจ—เฉ‡เฅค เจ‡เจธเจจเฉ‚เฉฐ "เจŸเจพเจˆเจŸเฉˆเจจเจฟเจ•" เจ•เจฟเจนเจพ เจœเจพเจ‚เจฆเจพ เจนเฉˆเฅค เจธเจผเจฐเจค เจ‡เจน เจนเฉˆ: เจญเจตเจฟเฉฑเจ–เจฌเจพเจฃเฉ€ เจ•เจฐเฉ‹ เจ•เจฟ เจ•เฉ€ เจนเจฐเฉ‡เจ• เจตเจฟเจ…เจ•เจคเฉ€ เจฌเจšเฉ‡เจ—เจพ เจœเจพเจ‚ เจจเจนเฉ€เจ‚เฅค เจ†เจฎ เจคเฉŒเจฐ 'เจคเฉ‡, DS เจตเจฟเฉฑเจš เจธเจผเจพเจฎเจฒ เจ‡เฉฑเจ• เจตเจฟเจ…เจ•เจคเฉ€ เจฆเจพ เจ•เฉฐเจฎ เจกเฉ‡เจŸเจพ เจ‡เจ•เฉฑเจ เจพ เจ•เจฐเจจเจพ, เจ‡เจธเจฆเฉ€ เจชเฉเจฐเจ•เจฟเจฐเจฟเจ† เจ•เจฐเจจเจพ, เจ‡เฉฑเจ• เจฎเจพเจกเจฒ เจจเฉ‚เฉฐ เจธเจฟเจ–เจฒเจพเจˆ เจฆเฉ‡เจฃเจพ, เจชเฉ‚เจฐเจต เจ…เจจเฉเจฎเจพเจจ เจฒเจ—เจพเจ‰เจฃเจพ เจ…เจคเฉ‡ เจนเฉ‹เจฐ เจฌเจนเฉเจค เจ•เฉเจ เจนเฉˆเฅค เจ•เจพเจ—เจฒ เจตเจฟเฉฑเจš, เจธเจพเจจเฉ‚เฉฐ เจกเฉ‡เจŸเจพ เจ‡เจ•เฉฑเจคเจฐ เจ•เจฐเจจ เจฆเฉ‡ เจชเฉœเจพเจ… เจจเฉ‚เฉฐ เจ›เฉฑเจกเจฃ เจฆเฉ€ เจ‡เจœเจพเจœเจผเจค เจฆเจฟเฉฑเจคเฉ€ เจœเจพเจ‚เจฆเฉ€ เจนเฉˆ - เจ‰เจน เจชเจฒเฉ‡เจŸเจซเจพเจฐเจฎ 'เจคเฉ‡ เจชเฉ‡เจธเจผ เจ•เฉ€เจคเฉ‡ เจœเจพเจ‚เจฆเฉ‡ เจนเจจเฅค เจธเจพเจจเฉ‚เฉฐ เจ‰เจนเจจเจพเจ‚ เจจเฉ‚เฉฐ เจกเจพเจŠเจจเจฒเฉ‹เจก เจ•เจฐเจจ เจฆเฉ€ เจฒเฉ‹เฉœ เจนเฉˆ เจ…เจคเฉ‡ เจ…เจธเฉ€เจ‚ เจธเจผเฉเจฐเฉ‚เจ†เจค เจ•เจฐ เจธเจ•เจฆเฉ‡ เจนเจพเจ‚!

เจคเฉเจธเฉ€เจ‚ เจ‡เจน เจ‡เจธ เจคเจฐเฉเจนเจพเจ‚ เจ•เจฐ เจธเจ•เจฆเฉ‡ เจนเฉ‹:

เจกเฉ‡เจŸเจพ เจŸเฉˆเจฌ เจตเจฟเฉฑเจš เจ‰เจน เจซเจพเจˆเจฒเจพเจ‚ เจนเฉเฉฐเจฆเฉ€เจ†เจ‚ เจนเจจ เจœเจฟเจนเจจเจพเจ‚ เจตเจฟเฉฑเจš เจกเฉ‡เจŸเจพ เจนเฉเฉฐเจฆเจพ เจนเฉˆ

เจกเจพเจŸเจพ เจธเจพเจ‡เฉฐเจธ เจตเจฟเฉฑเจš เจคเฉเจนเจพเจกเจพ เจชเจนเจฟเจฒเจพ เจ•เจฆเจฎเฅค เจŸเจพเจ‡เจŸเฉˆเจจเจฟเจ•

เจกเจพเจŸเจพ เจธเจพเจ‡เฉฐเจธ เจตเจฟเฉฑเจš เจคเฉเจนเจพเจกเจพ เจชเจนเจฟเจฒเจพ เจ•เจฆเจฎเฅค เจŸเจพเจ‡เจŸเฉˆเจจเจฟเจ•

เจ…เจธเฉ€เจ‚ เจกเจพเจŸเจพ เจกเจพเจŠเจจเจฒเฉ‹เจก เจ•เฉ€เจคเจพ, เจธเจพเจกเฉ€เจ†เจ‚ เจœเฉเจชเฉ€เจŸเจฐ เจจเฉ‹เจŸเจฌเฉเฉฑเจ•เจพเจ‚ เจคเจฟเจ†เจฐ เจ•เฉ€เจคเฉ€เจ†เจ‚ เจ…เจคเฉ‡...

เจฆเฉ‚เจœเจพ เจ•เจฆเจฎ

เจนเฉเจฃ เจ…เจธเฉ€เจ‚ เจ‡เจธ เจกเฉ‡เจŸเจพ เจจเฉ‚เฉฐ เจ•เจฟเจตเฉ‡เจ‚ เจฒเฉ‹เจก เจ•เจฐเจฆเฉ‡ เจนเจพเจ‚?

เจชเจนเจฟเจฒเจพเจ‚, เจ†เจ“ เจฒเฉ‹เฉœเฉ€เจ‚เจฆเฉ€เจ†เจ‚ เจฒเจพเจ‡เจฌเฉเจฐเฉ‡เจฐเฉ€เจ†เจ‚ เจจเฉ‚เฉฐ เจ†เจฏเจพเจค เจ•เจฐเฉ€เจ:

import pandas as pd
import numpy as np

Pandas เจธเจพเจจเฉ‚เฉฐ เจ…เฉฑเจ—เฉ‡ เจฆเฉ€ เจชเฉเจฐเจ•เจฟเจฐเจฟเจ† เจฒเจˆ .csv เจซเจพเจˆเจฒเจพเจ‚ เจจเฉ‚เฉฐ เจกเจพเจŠเจจเจฒเฉ‹เจก เจ•เจฐเจจ เจฆเฉ€ เจ‡เจœเจพเจœเจผเจค เจฆเฉ‡เจตเฉ‡เจ—เจพเฅค

เจจเฉฐเจฌเจฐเจพเจ‚ เจฆเฉ‡ เจจเจพเจฒ เจ‡เฉฑเจ• เจฎเฉˆเจŸเฉเจฐเจฟเจ•เจธ เจฆเฉ‡ เจฐเฉ‚เจช เจตเจฟเฉฑเจš เจธเจพเจกเฉ€ เจกเฉ‡เจŸเจพ เจธเจพเจฐเจฃเฉ€ เจจเฉ‚เฉฐ เจฆเจฐเจธเจพเจ‰เจฃ เจฒเจˆ Numpy เจฆเฉ€ เจฒเฉ‹เฉœ เจนเฉเฉฐเจฆเฉ€ เจนเฉˆเฅค
เจฒเฉฐเจ— เจœเจพเจ“. เจšเจฒเฉ‹ เจซเจพเจˆเจฒ train.csv เจฒเฉˆ เจ•เฉ‡ เจ‡เจธเจจเฉ‚เฉฐ เจธเจพเจกเฉ‡ เจฒเจˆ เจ…เจชเจฒเฉ‹เจก เจ•เจฐเฉ€เจ:

dataset = pd.read_csv('train.csv')

เจ…เจธเฉ€เจ‚ เจกเฉ‡เจŸเจพเจธเฉ‡เจŸ เจตเฉ‡เจฐเฉ€เจเจฌเจฒ เจฆเฉเจ†เจฐเจพ เจธเจพเจกเฉ€ train.csv เจกเฉ‡เจŸเจพ เจšเฉ‹เจฃ เจฆเจพ เจนเจตเจพเจฒเจพ เจฆเฉ‡เจตเจพเจ‚เจ—เฉ‡เฅค เจ†เจ“ เจฆเฉ‡เจ–เฉ€เจ เจ•เจฟ เจ‰เฉฑเจฅเฉ‡ เจ•เฉ€ เจนเฉˆ:

dataset.head()

เจกเจพเจŸเจพ เจธเจพเจ‡เฉฐเจธ เจตเจฟเฉฑเจš เจคเฉเจนเจพเจกเจพ เจชเจนเจฟเจฒเจพ เจ•เจฆเจฎเฅค เจŸเจพเจ‡เจŸเฉˆเจจเจฟเจ•

head() เจซเฉฐเจ•เจธเจผเจจ เจธเจพเจจเฉ‚เฉฐ เจกเฉ‡เจŸเจพเจซเฉเจฐเฉ‡เจฎ เจฆเฉ€เจ†เจ‚ เจชเจนเจฟเจฒเฉ€เจ†เจ‚ เจ•เฉเจ เจ•เจคเจพเจฐเจพเจ‚ เจจเฉ‚เฉฐ เจตเฉ‡เจ–เจฃ เจฆเฉ€ เจ†เจ—เจฟเจ† เจฆเจฟเฉฐเจฆเจพ เจนเฉˆเฅค

เจฌเจšเฉ‡ เจนเฉ‹เจ เจ•เจพเจฒเจฎ เจฌเจฟเจฒเจ•เฉเจฒ เจธเจพเจกเฉ‡ เจจเจคเฉ€เจœเฉ‡ เจนเจจ, เจœเฉ‹ เจ‡เจธ เจกเฉ‡เจŸเจพเจซเฉเจฐเฉ‡เจฎ เจตเจฟเฉฑเจš เจœเจพเจฃเฉ‡ เจœเจพเจ‚เจฆเฉ‡ เจนเจจเฅค เจ•เจพเจฐเจœ เจชเฉเจฐเจธเจผเจจ เจฒเจˆ, เจธเจพเจจเฉ‚เฉฐ test.csv เจกเฉ‡เจŸเจพ เจฒเจˆ เจฌเจšเฉ‡ เจนเฉ‹เจ เจ•เจพเจฒเจฎ เจฆเฉ€ เจญเจตเจฟเฉฑเจ–เจฌเจพเจฃเฉ€ เจ•เจฐเจจ เจฆเฉ€ เจฒเฉ‹เฉœ เจนเฉˆเฅค เจ‡เจน เจกเฉ‡เจŸเจพ เจŸเจพเจˆเจŸเฉˆเจจเจฟเจ• เจฆเฉ‡ เจนเฉ‹เจฐ เจฏเจพเจคเจฐเฉ€เจ†เจ‚ เจฌเจพเจฐเฉ‡ เจœเจพเจฃเจ•เจพเจฐเฉ€ เจธเจŸเฉ‹เจฐ เจ•เจฐเจฆเจพ เจนเฉˆ, เจœเจฟเจธ เจฒเจˆ เจ…เจธเฉ€เจ‚, เจธเจฎเฉฑเจธเจฟเจ† เจจเฉ‚เฉฐ เจนเฉฑเจฒ เจ•เจฐเจฆเฉ‡ เจนเฉ‹เจ, เจจเจคเฉ€เจœเจพ เจจเจนเฉ€เจ‚ เจœเจพเจฃเจฆเฉ‡ เจนเจพเจ‚เฅค

เจ‡เจธ เจฒเจˆ, เจ†เจ“ เจ†เจชเจฃเฉ€ เจธเจพเจฐเจฃเฉ€ เจจเฉ‚เฉฐ เจจเจฟเจฐเจญเจฐ เจ…เจคเฉ‡ เจธเฉเจคเฉฐเจคเจฐ เจกเฉ‡เจŸเจพ เจตเจฟเฉฑเจš เจตเฉฐเจกเฉ€เจเฅค เจ‡เฉฑเจฅเฉ‡ เจธเจญ เจ•เฉเจ เจธเจงเจพเจฐเจจ เจนเฉˆ. เจจเจฟเจฐเจญเจฐ เจกเฉ‡เจŸเจพ เจ‰เจน เจกเฉ‡เจŸเจพ เจนเฉเฉฐเจฆเฉ‡ เจนเจจ เจœเฉ‹ เจจเจคเฉ€เจœเจฟเจ†เจ‚ เจตเจฟเฉฑเจš เจธเฉเจคเฉฐเจคเจฐ เจกเฉ‡เจŸเจพ เจคเฉ‡ เจจเจฟเจฐเจญเจฐ เจ•เจฐเจฆเฉ‡ เจนเจจเฅค เจธเฉเจคเฉฐเจคเจฐ เจกเฉ‡เจŸเจพ เจ‰เจน เจกเฉ‡เจŸเจพ เจนเฉเฉฐเจฆเฉ‡ เจนเจจ เจœเฉ‹ เจจเจคเฉ€เจœเจฟเจ†เจ‚ เจจเฉ‚เฉฐ เจชเฉเจฐเจญเจพเจตเจค เจ•เจฐเจฆเฉ‡ เจนเจจเฅค

เจ‰เจฆเจพเจนเจฐเจจ เจฒเจˆ, เจธเจพเจกเฉ‡ เจ•เฉ‹เจฒ เจนเฉ‡เจ เจพเจ‚ เจฆเจฟเฉฑเจคเฉ‡ เจกเฉ‡เจŸเจพ เจธเฉˆเฉฑเจŸ เจนเจจ:

โ€œเจตเฉ‹เจตเจพ เจจเฉ‡ เจ•เฉฐเจชเจฟเจŠเจŸเจฐ เจตเจฟเจ—เจฟเจ†เจจ เจชเฉœเฉเจนเจพเจ‡เจ† - เจจเจนเฉ€เจ‚เฅค
เจตเฉ‹เจตเจพ เจจเฉ‡ เจ•เฉฐเจชเจฟเจŠเจŸเจฐ เจธเจพเจ‡เฉฐเจธ เจตเจฟเฉฑเจš 2 เจชเฉเจฐเจพเจชเจค เจ•เฉ€เจคเฉ‡เฅค

เจ•เฉฐเจชเจฟเจŠเจŸเจฐ เจตเจฟเจ—เจฟเจ†เจจ เจตเจฟเฉฑเจš เจ—เฉเจฐเฉ‡เจก เจธเจตเจพเจฒ เจฆเฉ‡ เจœเจตเจพเจฌ 'เจคเฉ‡ เจจเจฟเจฐเจญเจฐ เจ•เจฐเจฆเจพ เจนเฉˆ: เจ•เฉ€ เจตเฉ‹เจตเจพ เจจเฉ‡ เจ•เฉฐเจชเจฟเจŠเจŸเจฐ เจตเจฟเจ—เจฟเจ†เจจ เจฆเจพ เจ…เจงเจฟเจเจจ เจ•เฉ€เจคเจพ? เจ•เฉ€ เจ‡เจน เจธเจชเฉฑเจธเจผเจŸ เจนเฉˆ? เจ†เจ“ เจ…เฉฑเจ—เฉ‡ เจตเจงเฉ€เจ, เจ…เจธเฉ€เจ‚ เจชเจนเจฟเจฒเจพเจ‚ เจนเฉ€ เจŸเฉ€เจšเฉ‡ เจฆเฉ‡ เจจเฉ‡เฉœเฉ‡ เจนเจพเจ‚!

เจธเฉเจคเฉฐเจคเจฐ เจกเฉ‡เจŸเจพ เจฒเจˆ เจฐเจตเจพเจ‡เจคเฉ€ เจตเฉ‡เจฐเฉ€เจเจฌเจฒ X เจนเฉˆเฅค เจจเจฟเจฐเจญเจฐ เจกเฉ‡เจŸเจพ เจฒเจˆ, y.

เจ…เจธเฉ€เจ‚ เจนเฉ‡เจ  เจฒเจฟเจ–เฉ‡ เจ•เฉฐเจฎ เจ•เจฐเจฆเฉ‡ เจนเจพเจ‚:

X = dataset.iloc[ : , 2 : ]
y = dataset.iloc[ : , 1 : 2 ]

เจ‡เจน เจ•เฉ€ เจนเฉˆ? เจซเฉฐเจ•เจธเจผเจจ iloc[:, 2: ] เจจเจพเจฒ เจ…เจธเฉ€เจ‚ Python เจจเฉ‚เฉฐ เจฆเฉฑเจธเจฆเฉ‡ เจนเจพเจ‚: เจฎเฉˆเจ‚ เจตเฉ‡เจฐเฉ€เจเจฌเจฒ X เจตเจฟเฉฑเจš เจฆเฉ‚เจœเฉ‡ เจ•เจพเจฒเจฎ เจคเฉ‹เจ‚ เจธเจผเฉเจฐเฉ‚ เจนเฉ‹เจฃ เจตเจพเจฒเฉ‡ เจกเฉ‡เจŸเจพ เจจเฉ‚เฉฐ เจฆเฉ‡เจ–เจฃเจพ เจšเจพเจนเฉเฉฐเจฆเจพ เจนเจพเจ‚ (เจธเจฎเฉ‡เจค เจ…เจคเฉ‡ เจฌเจธเจผเจฐเจคเฉ‡ เจ•เจฟ เจ—เจฟเจฃเจคเฉ€ เจœเจผเฉ€เจฐเฉ‹ เจคเฉ‹เจ‚ เจธเจผเฉเจฐเฉ‚ เจนเฉ‹เจตเฉ‡)เฅค เจฆเฉ‚เจœเฉ€ เจฒเจพเจˆเจจ เจตเจฟเฉฑเจš เจ…เจธเฉ€เจ‚ เจ•เจนเจฟเฉฐเจฆเฉ‡ เจนเจพเจ‚ เจ•เจฟ เจ…เจธเฉ€เจ‚ เจชเจนเจฟเจฒเฉ‡ เจ•เจพเจฒเจฎ เจตเจฟเฉฑเจš เจกเฉ‡เจŸเจพ เจฆเฉ‡เจ–เจฃเจพ เจšเจพเจนเฉเฉฐเจฆเฉ‡ เจนเจพเจ‚เฅค

[a:b, c:d] เจ‰เจธ เจšเฉ€เจœเจผ เจฆเจพ เจจเจฟเจฐเจฎเจพเจฃ เจนเฉˆ เจœเฉ‹ เจ…เจธเฉ€เจ‚ เจฌเจฐเฉˆเจ•เจŸเจพเจ‚ เจตเจฟเฉฑเจš เจตเจฐเจคเจฆเฉ‡ เจนเจพเจ‚เฅค เจœเฉ‡เจ•เจฐ เจคเฉเจธเฉ€เจ‚ เจ•เฉ‹เจˆ เจตเฉ‡เจฐเฉ€เจเจฌเจฒ เจจเจฟเจฐเจงเจพเจฐเจค เจจเจนเฉ€เจ‚ เจ•เจฐเจฆเฉ‡ เจนเฉ‹, เจคเจพเจ‚ เจ‰เจนเจจเจพเจ‚ เจจเฉ‚เฉฐ เจกเจฟเจซเฉŒเจฒเจŸ เจตเจœเฉ‹เจ‚ เจธเฉเจฐเฉฑเจ–เจฟเจ…เจค เจ•เฉ€เจคเจพ เจœเจพเจตเฉ‡เจ—เจพเฅค เจญเจพเจต, เจ…เจธเฉ€เจ‚ [:,:d] เจจเฉ‚เฉฐ เจจเจฟเจฐเจงเจพเจฐเจฟเจค เจ•เจฐ เจธเจ•เจฆเฉ‡ เจนเจพเจ‚ เจ…เจคเฉ‡ เจซเจฟเจฐ เจ…เจธเฉ€เจ‚ เจกเฉ‡เจŸเจพเจซเฉเจฐเฉ‡เจฎ เจตเจฟเฉฑเจš เจธเจพเจฐเฉ‡ เจ•เจพเจฒเจฎ เจชเฉเจฐเจพเจชเจค เจ•เจฐเจพเจ‚เจ—เฉ‡, เจ‰เจนเจจเจพเจ‚ เจจเฉ‚เฉฐ เจ›เฉฑเจก เจ•เฉ‡ เจœเฉ‹ เจจเฉฐเจฌเจฐ d เจคเฉ‹เจ‚ เจ…เฉฑเจ—เฉ‡ เจœเจพเจ‚เจฆเฉ‡ เจนเจจเฅค เจตเฉ‡เจฐเฉ€เจเจฌเจฒ a เจ…เจคเฉ‡ b เจธเจคเจฐ เจจเฉ‚เฉฐ เจชเจฐเจฟเจญเจพเจธเจผเจฟเจค เจ•เจฐเจฆเฉ‡ เจนเจจ, เจชเจฐ เจธเจพเจจเฉ‚เฉฐ เจ‰เจนเจจเจพเจ‚ เจธเจพเจฐเจฟเจ†เจ‚ เจฆเฉ€ เจฒเฉ‹เฉœ เจนเฉˆ, เจ‡เจธเจฒเจˆ เจ…เจธเฉ€เจ‚ เจ‡เจธเจจเฉ‚เฉฐ เจกเจฟเจซเฉŒเจฒเจŸ เจฆเฉ‡ เจคเฉŒเจฐ เจคเฉ‡ เจ›เฉฑเจก เจฆเจฟเฉฐเจฆเฉ‡ เจนเจพเจ‚เฅค

เจ†เจ“ เจฆเฉ‡เจ–เฉ€เจ เจ•เจฟ เจธเจพเจจเฉ‚เฉฐ เจ•เฉ€ เจฎเจฟเจฒเจฟเจ†:

X.head()

เจกเจพเจŸเจพ เจธเจพเจ‡เฉฐเจธ เจตเจฟเฉฑเจš เจคเฉเจนเจพเจกเจพ เจชเจนเจฟเจฒเจพ เจ•เจฆเจฎเฅค เจŸเจพเจ‡เจŸเฉˆเจจเจฟเจ•

y.head()

เจกเจพเจŸเจพ เจธเจพเจ‡เฉฐเจธ เจตเจฟเฉฑเจš เจคเฉเจนเจพเจกเจพ เจชเจนเจฟเจฒเจพ เจ•เจฆเจฎเฅค เจŸเจพเจ‡เจŸเฉˆเจจเจฟเจ•

เจ‡เจธ เจ›เฉ‹เจŸเฉ‡ เจชเจพเจ  เจจเฉ‚เฉฐ เจธเจฐเจฒ เจฌเจฃเจพเจ‰เจฃ เจฒเจˆ, เจ…เจธเฉ€เจ‚ เจ‰เจนเจจเจพเจ‚ เจ•เจพเจฒเจฎเจพเจ‚ เจจเฉ‚เฉฐ เจนเจŸเจพ เจฆเฉ‡เจตเจพเจ‚เจ—เฉ‡ เจœเจฟเจจเฉเจนเจพเจ‚ เจจเฉ‚เฉฐ เจตเจฟเจธเจผเฉ‡เจธเจผ เจฆเฉ‡เจ–เจญเจพเจฒ เจฆเฉ€ เจฒเฉ‹เฉœ เจนเฉเฉฐเจฆเฉ€ เจนเฉˆ เจœเจพเจ‚ เจฌเจšเจฃ เจฆเฉ€ เจธเจฎเจฐเฉฑเจฅเจพ เจจเฉ‚เฉฐ เจฌเจฟเจฒเจ•เฉเจฒ เจตเฉ€ เจชเฉเจฐเจญเจพเจตเจฟเจค เจจเจนเฉ€เจ‚ เจ•เจฐเจฆเฉ‡เฅค เจ‰เจนเจจเจพเจ‚ เจตเจฟเฉฑเจš str เจ•เจฟเจธเจฎ เจฆเจพ เจกเฉ‡เจŸเจพ เจนเฉเฉฐเจฆเจพ เจนเฉˆเฅค

count = ['Name', 'Ticket', 'Cabin', 'Embarked']
X.drop(count, inplace=True, axis=1)

เจธเฉเจชเจฐ! เจ†เจ“ เจ…เจ—เจฒเฉ‡ เจชเฉœเจพเจ… 'เจคเฉ‡ เจšเฉฑเจฒเฉ€เจเฅค

เจคเฉ€เจœเจพ เจ•เจฆเจฎ

เจ‡เฉฑเจฅเฉ‡ เจธเจพเจจเฉ‚เฉฐ เจ†เจชเจฃเฉ‡ เจกเฉ‡เจŸเจพ เจจเฉ‚เฉฐ เจเจจเจ•เฉ‹เจก เจ•เจฐเจจ เจฆเฉ€ เจฒเฉ‹เฉœ เจนเฉˆ เจคเจพเจ‚ เจ•เจฟ เจฎเจธเจผเฉ€เจจ เจจเฉ‚เฉฐ เจšเฉฐเจ—เฉ€ เจคเจฐเฉเจนเจพเจ‚ เจธเจฎเจ เจธเจ•เฉ‡ เจ•เจฟ เจ‡เจน เจกเฉ‡เจŸเจพ เจจเจคเฉ€เจœเฉ‡ เจจเฉ‚เฉฐ เจ•เจฟเจตเฉ‡เจ‚ เจชเฉเจฐเจญเจพเจตเจฟเจค เจ•เจฐเจฆเจพ เจนเฉˆเฅค เจชเจฐ เจ…เจธเฉ€เจ‚ เจนเจฐ เจšเฉ€เจœเจผ เจจเฉ‚เฉฐ เจเจจเจ•เฉ‹เจก เจจเจนเฉ€เจ‚ เจ•เจฐเจพเจ‚เจ—เฉ‡, เจชเจฐ เจธเจฟเจฐเจซ str เจกเฉ‡เจŸเจพ เจœเฉ‹ เจ…เจธเฉ€เจ‚ เจ›เฉฑเจกเจฟเจ† เจนเฉˆ. เจ•เจพเจฒเจฎ "เจธเฉˆเจ•เจธ". เจ…เจธเฉ€เจ‚ เจ•เฉ‹เจก เจ•เจฟเจตเฉ‡เจ‚ เจ•เจฐเจจเจพ เจšเจพเจนเฉเฉฐเจฆเฉ‡ เจนเจพเจ‚? เจ†เจ‰ เจ‡เฉฑเจ• เจตเฉˆเจ•เจŸเจฐ เจฆเฉ‡ เจฐเฉ‚เจช เจตเจฟเฉฑเจš เจ‡เฉฑเจ• เจตเจฟเจ…เจ•เจคเฉ€ เจฆเฉ‡ เจฒเจฟเฉฐเจ— เจฌเจพเจฐเฉ‡ เจกเฉ‡เจŸเจพ เจจเฉ‚เฉฐ เจฆเจฐเจธเจพเจ‰เจ‚เจฆเฉ‡ เจนเจพเจ‚: 10 - เจชเฉเจฐเจธเจผ, 01 - เจฎเจพเจฆเจพเฅค

เจชเจนเจฟเจฒเจพเจ‚, เจ†เจ“ เจ†เจชเจฃเฉ€เจ†เจ‚ เจŸเฉ‡เจฌเจฒเจพเจ‚ เจจเฉ‚เฉฐ NumPy เจฎเฉˆเจŸเจฐเจฟเจ•เจธ เจตเจฟเฉฑเจš เจฌเจฆเจฒเฉ€เจ:

X = np.array(X)
y = np.array(y)

เจ…เจคเฉ‡ เจนเฉเจฃ เจ†เจ“ เจฆเฉ‡เจ–เฉ€เจ:

from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import OneHotEncoder

ct = ColumnTransformer(transformers=[('encoder', OneHotEncoder(), [1])],
                       remainder='passthrough')
X = np.array(ct.fit_transform(X))

เจธเจ•เจฒเฉ‡เจฐเจจ เจฒเจพเจ‡เจฌเฉเจฐเฉ‡เจฐเฉ€ เจ…เจœเจฟเจนเฉ€ เจตเจงเฉ€เจ† เจฒเจพเจ‡เจฌเฉเจฐเฉ‡เจฐเฉ€ เจนเฉˆ เจœเฉ‹ เจธเจพเจจเฉ‚เฉฐ เจกเฉ‡เจŸเจพ เจธเจพเจ‡เฉฐเจธ เจตเจฟเฉฑเจš เจชเฉ‚เจฐเจพ เจ•เฉฐเจฎ เจ•เจฐเจจ เจฆเฉ€ เจ†เจ—เจฟเจ† เจฆเจฟเฉฐเจฆเฉ€ เจนเฉˆเฅค เจ‡เจธ เจตเจฟเฉฑเจš เจตเฉฑเจกเฉ€ เจ—เจฟเจฃเจคเฉ€ เจตเจฟเฉฑเจš เจฆเจฟเจฒเจšเจธเจช เจฎเจธเจผเฉ€เจจ เจธเจฟเจ–เจฒเจพเจˆ เจฎเจพเจกเจฒ เจธเจผเจพเจฎเจฒ เจนเจจ เจ…เจคเฉ‡ เจ‡เจน เจธเจพเจจเฉ‚เฉฐ เจกเจพเจŸเจพ เจคเจฟเจ†เจฐ เจ•เจฐเจจ เจฆเฉ€ เจ†เจ—เจฟเจ† เจตเฉ€ เจฆเจฟเฉฐเจฆเจพ เจนเฉˆเฅค

OneHotEncoder เจธเจพเจจเฉ‚เฉฐ เจ‰เจธ เจชเฉเจฐเจคเฉ€เจจเจฟเจงเจคเจพ เจตเจฟเฉฑเจš เจ‡เฉฑเจ• เจตเจฟเจ…เจ•เจคเฉ€ เจฆเฉ‡ เจฒเจฟเฉฐเจ— เจจเฉ‚เฉฐ เจเจจเจ•เฉ‹เจก เจ•เจฐเจจ เจฆเฉ€ เจ‡เจœเจพเจœเจผเจค เจฆเฉ‡เจตเฉ‡เจ—เจพ, เจœเจฟเจตเฉ‡เจ‚ เจ•เจฟ เจ…เจธเฉ€เจ‚ เจฆเฉฑเจธเจฟเจ† เจนเฉˆเฅค 2 เจ•เจฒเจพเจธเจพเจ‚ เจฌเจฃเจพเจˆเจ†เจ‚ เจœเจพเจฃเจ—เฉ€เจ†เจ‚: เจฎเจฐเจฆ, เจ”เจฐเจคเฅค เจœเฉ‡เจ•เจฐ เจตเจฟเจ…เจ•เจคเฉ€ เจฎเจฐเจฆ เจนเฉˆ, เจคเจพเจ‚ เจ•เฉเจฐเจฎเจตเจพเจฐ "เจชเฉเจฐเจธเจผ" เจ•เจพเจฒเจฎ เจตเจฟเฉฑเจš 1 เจ…เจคเฉ‡ "เจ”เจฐเจค" เจ•เจพเจฒเจฎ เจตเจฟเฉฑเจš 0 เจฒเจฟเจ–เจฟเจ† เจœเจพเจตเฉ‡เจ—เจพเฅค

OneHotEncoder() เจคเฉ‹เจ‚ เจฌเจพเจ…เจฆ [1] เจนเฉˆ - เจ‡เจธเจฆเจพ เจฎเจคเจฒเจฌ เจนเฉˆ เจ•เจฟ เจ…เจธเฉ€เจ‚ เจ•เจพเจฒเจฎ เจจเฉฐเจฌเจฐ 1 (เจœเจผเฉ€เจฐเฉ‹ เจคเฉ‹เจ‚ เจ—เจฟเจฃเจฆเฉ‡ เจนเฉ‹เจ) เจจเฉ‚เฉฐ เจเจจเจ•เฉ‹เจก เจ•เจฐเจจเจพ เจšเจพเจนเฉเฉฐเจฆเฉ‡ เจนเจพเจ‚เฅค

เจธเฉเจชเจฐเฅค เจ†เจ“ เจนเฉ‹เจฐ เจตเฉ€ เจ…เฉฑเจ—เฉ‡ เจตเจงเฉ€เจ!

เจ‡เฉฑเจ• เจจเจฟเจฏเจฎ เจฆเฉ‡ เจคเฉŒเจฐ เจคเฉ‡, เจ…เจœเจฟเจนเจพ เจนเฉเฉฐเจฆเจพ เจนเฉˆ เจ•เจฟ เจ•เฉเจ เจกเฉ‡เจŸเจพ เจ–เจพเจฒเฉ€ เจ›เฉฑเจก เจฆเจฟเฉฑเจคเจพ เจœเจพเจ‚เจฆเจพ เจนเฉˆ (เจ…เจฐเจฅเจพเจค, NaN - เจ‡เฉฑเจ• เจจเฉฐเจฌเจฐ เจจเจนเฉ€เจ‚)เฅค เจ‰เจฆเจพเจนเจฐเจจ เจฒเจˆ, เจ‡เฉฑเจ• เจตเจฟเจ…เจ•เจคเฉ€ เจฌเจพเจฐเฉ‡ เจœเจพเจฃเจ•เจพเจฐเฉ€ เจนเฉˆ: เจ‰เจธเจฆเจพ เจจเจพเจฎ, เจฒเจฟเฉฐเจ—เฅค เจชเจฐ เจ‰เจธเจฆเฉ€ เจ‰เจฎเจฐ เจฌเจพเจฐเฉ‡ เจ•เฉ‹เจˆ เจœเจพเจฃเจ•เจพเจฐเฉ€ เจจเจนเฉ€เจ‚ เจนเฉˆเฅค เจ‡เจธ เจธเจฅเจฟเจคเฉ€ เจตเจฟเฉฑเจš, เจ…เจธเฉ€เจ‚ เจนเฉ‡เจ เจพเจ‚ เจฆเจฟเฉฑเจคเฉ€ เจตเจฟเจงเฉ€ เจจเฉ‚เฉฐ เจฒเจพเจ—เฉ‚ เจ•เจฐเจพเจ‚เจ—เฉ‡: เจ…เจธเฉ€เจ‚ เจธเจพเจฐเฉ‡ เจ•เจพเจฒเจฎเจพเจ‚ เจตเจฟเฉฑเจš เจ…เฉฐเจ•เจ—เจฃเจฟเจค เจฆเจพ เจฎเจคเจฒเจฌ เจฒเฉฑเจญเจพเจ‚เจ—เฉ‡ เจ…เจคเฉ‡, เจœเฉ‡เจ•เจฐ เจ•เจพเจฒเจฎ เจตเจฟเฉฑเจš เจ•เฉเจ เจกเฉ‡เจŸเจพ เจ—เฉเฉฐเจฎ เจนเฉˆ, เจคเจพเจ‚ เจ…เจธเฉ€เจ‚ เจ—เจฃเจฟเจค เจฆเฉ‡ เจฎเฉฑเจงเจฎเจพเจจ เจจเจพเจฒ เจ–เจพเจฒเฉ€ เจฅเจพเจ‚ เจจเฉ‚เฉฐ เจญเจฐเจพเจ‚เจ—เฉ‡เฅค

from sklearn.impute import SimpleImputer
imputer = SimpleImputer(missing_values=np.nan, strategy='mean')
imputer.fit(X)
X = imputer.transform(X)

เจนเฉเจฃ เจ…เจธเฉ€เจ‚ เจ‡เจธ เจ—เฉฑเจฒ เจจเฉ‚เฉฐ เจงเจฟเจ†เจจ เจตเจฟเฉฑเจš เจฐเฉฑเจ–เจฆเฉ‡ เจนเจพเจ‚ เจ•เจฟ เจธเจฅเจฟเจคเฉ€เจ†เจ‚ เจ‰เจฆเฉ‹เจ‚ เจตเจพเจชเจฐเจฆเฉ€เจ†เจ‚ เจนเจจ เจœเจฆเฉ‹เจ‚ เจกเฉ‡เจŸเจพ เจฌเจนเฉเจค เจตเฉฑเจกเจพ เจนเฉเฉฐเจฆเจพ เจนเฉˆเฅค เจ•เฉเจ เจกเฉ‡เจŸเจพ เจ…เฉฐเจคเจฐเจพเจฒ เจตเจฟเฉฑเจš เจนเฉเฉฐเจฆเจพ เจนเฉˆ [0:1], เจœเจฆเฉ‹เจ‚ เจ•เจฟ เจ•เฉเจ เจธเฉˆเจ‚เจ•เฉœเฉ‡ เจ…เจคเฉ‡ เจนเจœเจผเจพเจฐเจพเจ‚ เจคเฉ‹เจ‚ เจชเจพเจฐ เจœเจพ เจธเจ•เจฆเจพ เจนเฉˆเฅค เจ…เจœเจฟเจนเฉ‡ เจธเจ•เฉˆเจŸเจฐ เจจเฉ‚เฉฐ เจ–เจคเจฎ เจ•เจฐเจจ เจฒเจˆ เจ…เจคเฉ‡ เจ•เฉฐเจชเจฟเจŠเจŸเจฐ เจจเฉ‚เฉฐ เจ‡เจธเจฆเฉ€ เจ—เจฃเจจเจพ เจตเจฟเฉฑเจš เจตเจงเฉ‡เจฐเฉ‡ เจธเจŸเฉ€เจ• เจฌเจฃเจพเจ‰เจฃ เจฒเจˆ, เจ…เจธเฉ€เจ‚ เจกเฉ‡เจŸเจพ เจจเฉ‚เฉฐ เจธเจ•เฉˆเจจ เจ•เจฐเจพเจ‚เจ—เฉ‡ เจ…เจคเฉ‡ เจธเจ•เฉ‡เจฒ เจ•เจฐเจพเจ‚เจ—เฉ‡เฅค เจธเจพเจฐเฉ‡ เจจเฉฐเจฌเจฐ เจคเจฟเฉฐเจจ เจคเฉ‹เจ‚ เจตเฉฑเจง เจจเจพ เจนเฉ‹เจฃ เจฆเจฟเจ“เฅค เจ…เจœเจฟเจนเจพ เจ•เจฐเจจ เจฒเจˆ, เจ…เจธเฉ€เจ‚ เจธเจŸเฉˆเจ‚เจกเจฐเจกเจธเจ•เฉ‡เจฒเจฐ เจซเฉฐเจ•เจธเจผเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจพเจ‚เจ—เฉ‡เฅค

from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X[:, 2:] = sc.fit_transform(X[:, 2:])

เจนเฉเจฃ เจธเจพเจกเจพ เจกเฉ‡เจŸเจพ เจ‡เจธ เจคเจฐเฉเจนเจพเจ‚ เจฆเจฟเจ–เจฆเจพ เจนเฉˆ:

เจกเจพเจŸเจพ เจธเจพเจ‡เฉฐเจธ เจตเจฟเฉฑเจš เจคเฉเจนเจพเจกเจพ เจชเจนเจฟเจฒเจพ เจ•เจฆเจฎเฅค เจŸเจพเจ‡เจŸเฉˆเจจเจฟเจ•

เจ•เจฒเจพเจธ. เจ…เจธเฉ€เจ‚ เจชเจนเจฟเจฒเจพเจ‚ เจนเฉ€ เจ†เจชเจฃเฉ‡ เจŸเฉ€เจšเฉ‡ เจฆเฉ‡ เจจเฉ‡เฉœเฉ‡ เจนเจพเจ‚!

เจ•เจฆเจฎ เจšเจพเจฐ

เจ†เจ“ เจ†เจชเจฃเฉ‡ เจชเจนเจฟเจฒเฉ‡ เจฎเจพเจกเจฒ เจจเฉ‚เฉฐ เจธเจฟเจ–เจฒเจพเจˆ เจฆเฉ‡เจˆเจ! เจธเจ•เจฒเฉˆเจฐเจจ เจฒเจพเจ‡เจฌเฉเจฐเฉ‡เจฐเฉ€ เจคเฉ‹เจ‚ เจ…เจธเฉ€เจ‚ เจฌเจนเฉเจค เจธเจพเจฐเฉ€เจ†เจ‚ เจฆเจฟเจฒเจšเจธเจช เจšเฉ€เจœเจผเจพเจ‚ เจฒเฉฑเจญ เจธเจ•เจฆเฉ‡ เจนเจพเจ‚เฅค เจฎเฉˆเจ‚ เจ‡เจธ เจธเจฎเฉฑเจธเจฟเจ† เจฒเจˆ เจ—เจฐเฉ‡เจกเฉ€เจเจ‚เจŸ เจฌเฉ‚เจธเจŸเจฟเฉฐเจ— เจ•เจฒเจพเจธเฉ€เจซเจพเจ‡เจฐ เจฎเจพเจกเจฒ เจจเฉ‚เฉฐ เจฒเจพเจ—เฉ‚ เจ•เฉ€เจคเจพ เจนเฉˆเฅค เจ…เจธเฉ€เจ‚ เจ เจ•เจฒเจพเจธเฉ€เจซเจพเจ‡เจฐ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจฆเฉ‡ เจนเจพเจ‚ เจ•เจฟเจ‰เจ‚เจ•เจฟ เจธเจพเจกเจพ เจ•เฉฐเจฎ เจ‡เฉฑเจ• เจตเจฐเจ—เฉ€เจ•เจฐเจจ เจฆเจพ เจ•เฉฐเจฎ เจนเฉˆเฅค เจชเฉ‚เจฐเจต-เจ…เจจเฉเจฎเจพเจจ เจจเฉ‚เฉฐ 1 (เจฌเจšเจฟเจ†) เจœเจพเจ‚ 0 (เจฌเจšเจฟเจ† เจจเจนเฉ€เจ‚) เจจเฉ‚เฉฐ เจจเจฟเจฐเจงเจพเจฐเจค เจ•เฉ€เจคเจพ เจœเจพเจฃเจพ เจšเจพเจนเฉ€เจฆเจพ เจนเฉˆเฅค

from sklearn.ensemble import GradientBoostingClassifier
gbc = GradientBoostingClassifier(learning_rate=0.5, max_depth=5, n_estimators=150)
gbc.fit(X, y)

เจซเจฟเจŸ เจซเฉฐเจ•เจธเจผเจจ เจชเจพเจˆเจฅเจจ เจจเฉ‚เฉฐ เจฆเฉฑเจธเจฆเจพ เจนเฉˆ: เจฎเจพเจกเจฒ เจจเฉ‚เฉฐ X เจ…เจคเฉ‡ y เจตเจฟเจšเจ•เจพเจฐ เจจเจฟเจฐเจญเจฐเจคเจพเจตเจพเจ‚ เจฆเฉ€ เจ–เฉ‹เจœ เจ•เจฐเจจ เจฆเจฟเจ“เฅค

เจ‡เฉฑเจ• เจธเจ•เจฟเฉฐเจŸ เจคเฉ‹เจ‚ เจตเฉ€ เจ˜เฉฑเจŸ เจ…เจคเฉ‡ เจฎเจพเจกเจฒ เจคเจฟเจ†เจฐ เจนเฉˆเฅค

เจกเจพเจŸเจพ เจธเจพเจ‡เฉฐเจธ เจตเจฟเฉฑเจš เจคเฉเจนเจพเจกเจพ เจชเจนเจฟเจฒเจพ เจ•เจฆเจฎเฅค เจŸเจพเจ‡เจŸเฉˆเจจเจฟเจ•

เจ‡เจธ เจจเฉ‚เฉฐ เจ•เจฟเจตเฉ‡เจ‚ เจฒเจพเจ—เฉ‚ เจ•เจฐเจจเจพ เจนเฉˆ? เจ…เจธเฉ€เจ‚ เจนเฉเจฃ เจฆเฉ‡เจ–เจพเจ‚เจ—เฉ‡!

เจ•เจฆเจฎ เจชเฉฐเจœ. เจธเจฟเฉฑเจŸเจพ

เจนเฉเจฃ เจธเจพเจจเฉ‚เฉฐ เจ†เจชเจฃเฉ‡ เจŸเฉˆเจธเจŸ เจกเฉ‡เจŸเจพ เจฆเฉ‡ เจจเจพเจฒ เจ‡เฉฑเจ• เจธเจพเจฐเจฃเฉ€ เจฒเฉ‹เจก เจ•เจฐเจจ เจฆเฉ€ เจฒเฉ‹เฉœ เจนเฉˆ เจœเจฟเจธ เจฒเจˆ เจธเจพเจจเฉ‚เฉฐ เจ‡เฉฑเจ• เจชเฉ‚เจฐเจต เจ…เจจเฉเจฎเจพเจจ เจฒเจ—เจพเจ‰เจฃ เจฆเฉ€ เจฒเฉ‹เฉœ เจนเฉˆเฅค เจ‡เจธ เจธเจพเจฐเจฃเฉ€ เจจเจพเจฒ เจ…เจธเฉ€เจ‚ เจ‰เจนเฉ€ เจธเจพเจฐเฉ€เจ†เจ‚ เจ•เจพเจฐเจตเจพเจˆเจ†เจ‚ เจ•เจฐเจพเจ‚เจ—เฉ‡ เจœเฉ‹ เจ…เจธเฉ€เจ‚ X เจฒเจˆ เจ•เฉ€เจคเฉ€เจ†เจ‚ เจนเจจเฅค

X_test = pd.read_csv('test.csv', index_col=0)

count = ['Name', 'Ticket', 'Cabin', 'Embarked']
X_test.drop(count, inplace=True, axis=1)

X_test = np.array(X_test)

from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import OneHotEncoder
ct = ColumnTransformer(transformers=[('encoder', OneHotEncoder(), [1])],
                       remainder='passthrough')
X_test = np.array(ct.fit_transform(X_test))

from sklearn.impute import SimpleImputer
imputer = SimpleImputer(missing_values=np.nan, strategy='mean')
imputer.fit(X_test)
X_test = imputer.transform(X_test)

from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_test[:, 2:] = sc.fit_transform(X_test[:, 2:])

เจ†เจ“ เจนเฉเจฃ เจธเจพเจกเฉ‡ เจฎเจพเจกเจฒ เจจเฉ‚เฉฐ เจฒเจพเจ—เฉ‚ เจ•เจฐเฉ€เจ!

gbc_predict = gbc.predict(X_test)

เจธเจพเจฐเฉ‡เฅค เจ…เจธเฉ€เจ‚ เจ‡เฉฑเจ• เจญเจตเจฟเฉฑเจ–เจฌเจพเจฃเฉ€ เจ•เฉ€เจคเฉ€. เจนเฉเจฃ เจ‡เจธเจจเฉ‚เฉฐ csv เจตเจฟเฉฑเจš เจฐเจฟเจ•เจพเจฐเจก เจ•เจฐเจ•เฉ‡ เจธเจพเจˆเจŸ เจคเฉ‡ เจญเฉ‡เจœเจฃ เจฆเฉ€ เจฒเฉ‹เฉœ เจนเฉˆเฅค

np.savetxt('my_gbc_predict.csv', gbc_predict, delimiter=",", header = 'Survived')

เจคเจฟเจ†เจฐ เจนเฉˆเฅค เจธเจพเจจเฉ‚เฉฐ เจนเจฐเฉ‡เจ• เจฏเจพเจคเจฐเฉ€ เจฒเจˆ เจญเจตเจฟเฉฑเจ–เจฌเจพเจฃเฉ€เจ†เจ‚ เจตเจพเจฒเฉ€ เจ‡เฉฑเจ• เจซเจพเจˆเจฒ เจชเฉเจฐเจพเจชเจค เจนเฉ‹เจˆ เจนเฉˆเฅค เจœเฉ‹ เจ•เฉเจ เจฌเจšเจฟเจ† เจนเฉˆ เจ‰เจน เจนเฉˆ เจ‡เจนเจจเจพเจ‚ เจนเฉฑเจฒเจพเจ‚ เจจเฉ‚เฉฐ เจตเฉˆเจฌเจธเจพเจˆเจŸ เจคเฉ‡ เจ…เจชเจฒเฉ‹เจก เจ•เจฐเจจเจพ เจ…เจคเฉ‡ เจชเฉ‚เจฐเจต เจ…เจจเฉเจฎเจพเจจ เจฆเจพ เจฎเฉเจฒเจพเจ‚เจ•เจฃ เจชเฉเจฐเจพเจชเจค เจ•เจฐเจจเจพเฅค เจ…เจœเจฟเจนเจพ เจฎเฉเฉฑเจขเจฒเจพ เจนเฉฑเจฒ เจจเจพ เจธเจฟเจฐเจซเจผ 74% เจฒเฉ‹เจ•เจพเจ‚ เจจเฉ‚เฉฐ เจธเจนเฉ€ เจœเจตเจพเจฌ เจฆเจฟเฉฐเจฆเจพ เจนเฉˆ, เจธเจ—เฉ‹เจ‚ เจกเจพเจŸเจพ เจธเจพเจ‡เฉฐเจธ เจตเจฟเฉฑเจš เจ•เฉเจ เจชเฉเจฐเฉ‡เจฐเจฃเจพ เจตเฉ€ เจฆเจฟเฉฐเจฆเจพ เจนเฉˆเฅค เจธเจญ เจคเฉ‹เจ‚ เจ‰เจคเจธเฉเจ• เจตเจฟเจ…เจ•เจคเฉ€ เจ•เจฟเจธเฉ‡ เจตเฉ€ เจธเจฎเฉ‡เจ‚ เจฎเฉˆเจจเฉ‚เฉฐ เจจเจฟเฉฑเจœเฉ€ เจธเฉฐเจฆเฉ‡เจธเจผเจพเจ‚ เจตเจฟเฉฑเจš เจฒเจฟเจ– เจธเจ•เจฆเฉ‡ เจนเจจ เจ…เจคเฉ‡ เจ‡เฉฑเจ• เจธเจตเจพเจฒ เจชเฉเฉฑเจ› เจธเจ•เจฆเฉ‡ เจนเจจเฅค เจธเจญ เจฆเจพ เจงเฉฐเจจเจตเจพเจฆ!

เจธเจฐเฉ‹เจค: www.habr.com

เจ‡เฉฑเจ• เจŸเจฟเฉฑเจชเจฃเฉ€ เจœเฉ‹เฉœเฉ‹