āĻĄā§‡āĻŸāĻž āĻ¸āĻžāĻ¯āĻŧā§‡āĻ¨ā§āĻ¸ā§‡ āĻ†āĻĒāĻ¨āĻžāĻ° āĻĒā§āĻ°āĻĨāĻŽ āĻ§āĻžāĻĒāĨ¤ āĻŸāĻžāĻ‡āĻŸāĻžāĻ¨āĻŋāĻ•

āĻāĻ•āĻŸāĻŋ āĻ¸āĻ‚āĻ•ā§āĻˇāĻŋāĻĒā§āĻ¤ āĻĒāĻ°āĻŋāĻšāĻžāĻ¯āĻŧāĻ• āĻļāĻŦā§āĻĻ

āĻ†āĻŽāĻŋ āĻŦāĻŋāĻļā§āĻŦāĻžāĻ¸ āĻ•āĻ°āĻŋ āĻ¯ā§‡ āĻ†āĻŽāĻ°āĻž āĻ†āĻ°āĻ“ āĻ•āĻŋāĻ›ā§ āĻ•āĻ°āĻ¤ā§‡ āĻĒāĻžāĻ°āĻ¤āĻžāĻŽ āĻ¯āĻĻāĻŋ āĻ†āĻŽāĻžāĻĻā§‡āĻ° āĻ§āĻžāĻĒā§‡ āĻ§āĻžāĻĒā§‡ āĻ¨āĻŋāĻ°ā§āĻĻā§‡āĻļāĻžāĻŦāĻ˛ā§€ āĻĻā§‡āĻ“āĻ¯āĻŧāĻž āĻšāĻ¯āĻŧ āĻ¯āĻž āĻ†āĻŽāĻžāĻĻā§‡āĻ°āĻ•ā§‡ āĻ•ā§€ āĻ•āĻ°āĻ¤ā§‡ āĻšāĻŦā§‡ āĻāĻŦāĻ‚ āĻ•ā§€āĻ­āĻžāĻŦā§‡ āĻāĻŸāĻŋ āĻ•āĻ°āĻ¤ā§‡ āĻšāĻŦā§‡ āĻ¤āĻž āĻœāĻžāĻ¨āĻžāĻŦā§‡āĨ¤ āĻ†āĻŽāĻŋ āĻ¨āĻŋāĻœā§‡āĻ‡ āĻ†āĻŽāĻžāĻ° āĻœā§€āĻŦāĻ¨ā§‡āĻ° āĻ¸ā§‡āĻ‡ āĻŽā§āĻšā§‚āĻ°ā§āĻ¤āĻ—ā§āĻ˛āĻŋ āĻŽāĻ¨ā§‡ āĻ•āĻ°āĻŋ āĻ¯āĻ–āĻ¨ āĻ†āĻŽāĻŋ āĻ•āĻŋāĻ›ā§ āĻļā§āĻ°ā§ āĻ•āĻ°āĻ¤ā§‡ āĻĒāĻžāĻ°āĻŋāĻ¨āĻŋ āĻ•āĻžāĻ°āĻŖ āĻ•ā§‹āĻĨāĻž āĻĨā§‡āĻ•ā§‡ āĻļā§āĻ°ā§ āĻ•āĻ°āĻŦ āĻ¤āĻž āĻŦā§‹āĻāĻž āĻ•āĻ āĻŋāĻ¨ āĻ›āĻŋāĻ˛āĨ¤ āĻ¸āĻŽā§āĻ­āĻŦāĻ¤, āĻāĻ•āĻŦāĻžāĻ° āĻ‡āĻ¨ā§āĻŸāĻžāĻ°āĻ¨ā§‡āĻŸā§‡ āĻ†āĻĒāĻ¨āĻŋ "āĻĄā§‡āĻŸāĻž āĻ¸āĻžāĻ¯āĻŧā§‡āĻ¨ā§āĻ¸" āĻļāĻŦā§āĻĻāĻ—ā§āĻ˛āĻŋ āĻĻā§‡āĻ–ā§‡āĻ›āĻŋāĻ˛ā§‡āĻ¨ āĻāĻŦāĻ‚ āĻ¸āĻŋāĻĻā§āĻ§āĻžāĻ¨ā§āĻ¤ āĻ¨āĻŋāĻ¯āĻŧā§‡āĻ›āĻŋāĻ˛ā§‡āĻ¨ āĻ¯ā§‡ āĻ†āĻĒāĻ¨āĻŋ āĻāĻŸāĻŋ āĻĨā§‡āĻ•ā§‡ āĻ…āĻ¨ā§‡āĻ• āĻĻā§‚āĻ°ā§‡ āĻ›āĻŋāĻ˛ā§‡āĻ¨ āĻāĻŦāĻ‚ āĻ¯āĻžāĻ°āĻž āĻāĻŸāĻŋ āĻ•āĻ°ā§‡ āĻ¤āĻžāĻ°āĻž āĻ…āĻ¨ā§āĻ¯ āĻ•ā§‹āĻĨāĻžāĻ“ āĻ•ā§‹āĻĨāĻžāĻ“ āĻ›āĻŋāĻ˛āĨ¤ āĻ¨āĻž, āĻ¤āĻžāĻ°āĻž āĻāĻ–āĻžāĻ¨ā§‡āĻ‡ āĻ†āĻ›ā§‡āĨ¤ āĻāĻŦāĻ‚ āĻ¸āĻŽā§āĻ­āĻŦāĻ¤, āĻāĻ‡ āĻ•ā§āĻˇā§‡āĻ¤ā§āĻ°ā§‡āĻ° āĻ˛ā§‹āĻ•ā§‡āĻĻā§‡āĻ° āĻ§āĻ¨ā§āĻ¯āĻŦāĻžāĻĻ, āĻāĻ•āĻŸāĻŋ āĻ¨āĻŋāĻŦāĻ¨ā§āĻ§ āĻ†āĻĒāĻ¨āĻžāĻ° āĻĢāĻŋāĻĄā§‡ āĻ‰āĻĒāĻ¸ā§āĻĨāĻŋāĻ¤ āĻšāĻ¯āĻŧā§‡āĻ›ā§‡āĨ¤ āĻĒā§āĻ°āĻšā§āĻ° āĻ•ā§‹āĻ°ā§āĻ¸ āĻ°āĻ¯āĻŧā§‡āĻ›ā§‡ āĻ¯āĻž āĻ†āĻĒāĻ¨āĻžāĻ•ā§‡ āĻāĻ‡ āĻ¨ā§ˆāĻĒā§āĻŖā§āĻ¯ā§‡ āĻ¸ā§āĻŦāĻžāĻšā§āĻ›āĻ¨ā§āĻĻā§āĻ¯ āĻĒā§‡āĻ¤ā§‡ āĻ¸āĻžāĻšāĻžāĻ¯ā§āĻ¯ āĻ•āĻ°āĻŦā§‡, āĻ•āĻŋāĻ¨ā§āĻ¤ā§ āĻāĻ–āĻžāĻ¨ā§‡ āĻ†āĻŽāĻŋ āĻ†āĻĒāĻ¨āĻžāĻ•ā§‡ āĻĒā§āĻ°āĻĨāĻŽ āĻĒāĻĻāĻ•ā§āĻˇā§‡āĻĒ āĻ¨āĻŋāĻ¤ā§‡ āĻ¸āĻžāĻšāĻžāĻ¯ā§āĻ¯ āĻ•āĻ°āĻŦāĨ¤

āĻ†āĻšā§āĻ›āĻž, āĻ¤ā§āĻŽāĻŋ āĻ•āĻŋ āĻĒā§āĻ°āĻ¸ā§āĻ¤ā§āĻ¤? āĻ†āĻŽāĻŋ āĻāĻ–āĻ¨āĻ‡ āĻ†āĻĒāĻ¨āĻžāĻ•ā§‡ āĻŦāĻ˛āĻŋ āĻ¯ā§‡ āĻ†āĻĒāĻ¨āĻžāĻ•ā§‡ āĻĒāĻžāĻ‡āĻĨāĻ¨ 3 āĻœāĻžāĻ¨āĻ¤ā§‡ āĻšāĻŦā§‡, āĻ¯ā§‡āĻšā§‡āĻ¤ā§ āĻ†āĻŽāĻŋ āĻāĻ–āĻžāĻ¨ā§‡ āĻāĻŸāĻŋ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻ•āĻ°āĻŦāĨ¤ āĻ†āĻŽāĻŋ āĻ†āĻĒāĻ¨āĻžāĻ•ā§‡ Jupyter Notebook āĻ āĻāĻŸāĻŋāĻ•ā§‡ āĻ†āĻ—ā§‡ āĻĨā§‡āĻ•ā§‡ āĻ‡āĻ¨āĻ¸ā§āĻŸāĻ˛ āĻ•āĻ°āĻžāĻ° āĻĒāĻ°āĻžāĻŽāĻ°ā§āĻļ āĻĻāĻŋāĻšā§āĻ›āĻŋ āĻ…āĻĨāĻŦāĻž āĻ•āĻŋāĻ­āĻžāĻŦā§‡ google colab āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻ•āĻ°āĻ¤ā§‡ āĻšāĻ¯āĻŧ āĻ¤āĻž āĻĻā§‡āĻ–ā§āĻ¨āĨ¤

āĻāĻ• āĻ§āĻžāĻĒ

āĻĄā§‡āĻŸāĻž āĻ¸āĻžāĻ¯āĻŧā§‡āĻ¨ā§āĻ¸ā§‡ āĻ†āĻĒāĻ¨āĻžāĻ° āĻĒā§āĻ°āĻĨāĻŽ āĻ§āĻžāĻĒāĨ¤ āĻŸāĻžāĻ‡āĻŸāĻžāĻ¨āĻŋāĻ•

āĻ•āĻžāĻ—āĻ˛ āĻāĻ‡ āĻŦāĻŋāĻˇāĻ¯āĻŧā§‡ āĻ†āĻĒāĻ¨āĻžāĻ° āĻ‰āĻ˛ā§āĻ˛ā§‡āĻ–āĻ¯ā§‹āĻ—ā§āĻ¯ āĻ¸āĻšāĻ•āĻžāĻ°ā§€āĨ¤ āĻ¨ā§€āĻ¤āĻŋāĻ—āĻ¤āĻ­āĻžāĻŦā§‡, āĻ†āĻĒāĻ¨āĻŋ āĻāĻŸāĻŋ āĻ›āĻžāĻĄāĻŧāĻž āĻ•āĻ°āĻ¤ā§‡ āĻĒāĻžāĻ°ā§‡āĻ¨, āĻ•āĻŋāĻ¨ā§āĻ¤ā§ āĻ†āĻŽāĻŋ āĻ…āĻ¨ā§āĻ¯ āĻ¨āĻŋāĻŦāĻ¨ā§āĻ§ā§‡ āĻāĻ‡ āĻ¸āĻŽā§āĻĒāĻ°ā§āĻ•ā§‡ āĻ•āĻĨāĻž āĻŦāĻ˛āĻ¤ā§‡ āĻšāĻŦā§‡āĨ¤ āĻāĻŸāĻŋ āĻāĻŽāĻ¨ āĻāĻ•āĻŸāĻŋ āĻĒā§āĻ˛ā§āĻ¯āĻžāĻŸāĻĢāĻ°ā§āĻŽ āĻ¯āĻž āĻĄā§‡āĻŸāĻž āĻ¸āĻžāĻ¯āĻŧā§‡āĻ¨ā§āĻ¸ āĻĒā§āĻ°āĻ¤āĻŋāĻ¯ā§‹āĻ—āĻŋāĻ¤āĻžāĻ° āĻ†āĻ¯āĻŧā§‹āĻœāĻ¨ āĻ•āĻ°ā§‡āĨ¤ āĻāĻ‡ āĻœāĻžāĻ¤ā§€āĻ¯āĻŧ āĻĒā§āĻ°āĻ¤āĻŋāĻŸāĻŋ āĻĒā§āĻ°āĻ¤āĻŋāĻ¯ā§‹āĻ—āĻŋāĻ¤āĻžāĻ¯āĻŧ, āĻĒā§āĻ°āĻžāĻĨāĻŽāĻŋāĻ• āĻĒāĻ°ā§āĻ¯āĻžāĻ¯āĻŧā§‡ āĻ†āĻĒāĻ¨āĻŋ āĻŦāĻŋāĻ­āĻŋāĻ¨ā§āĻ¨ āĻ§āĻ°āĻŖā§‡āĻ° āĻ¸āĻŽāĻ¸ā§āĻ¯āĻž āĻ¸āĻŽāĻžāĻ§āĻžāĻ¨ā§‡ āĻ…āĻŦāĻžāĻ¸ā§āĻ¤āĻŦ āĻĒāĻ°āĻŋāĻŽāĻžāĻŖā§‡ āĻ…āĻ­āĻŋāĻœā§āĻžāĻ¤āĻž āĻ…āĻ°ā§āĻœāĻ¨ āĻ•āĻ°āĻŦā§‡āĻ¨, āĻŦāĻŋāĻ•āĻžāĻļā§‡āĻ° āĻ…āĻ­āĻŋāĻœā§āĻžāĻ¤āĻž āĻāĻŦāĻ‚ āĻāĻ•āĻŸāĻŋ āĻĻāĻ˛ā§‡ āĻ•āĻžāĻœ āĻ•āĻ°āĻžāĻ° āĻ…āĻ­āĻŋāĻœā§āĻžāĻ¤āĻž, āĻ¯āĻž āĻ†āĻŽāĻžāĻĻā§‡āĻ° āĻ¸āĻŽāĻ¯āĻŧā§‡ āĻ—ā§āĻ°ā§āĻ¤ā§āĻŦāĻĒā§‚āĻ°ā§āĻŖāĨ¤

āĻ†āĻŽāĻ°āĻž āĻ¸ā§‡āĻ–āĻžāĻ¨ āĻĨā§‡āĻ•ā§‡ āĻ†āĻŽāĻžāĻĻā§‡āĻ° āĻĻāĻžāĻ¯āĻŧāĻŋāĻ¤ā§āĻŦ āĻ¨ā§‡āĻŦāĨ¤ āĻāĻ° āĻ¨āĻžāĻŽ ‘āĻŸāĻžāĻ‡āĻŸāĻžāĻ¨āĻŋāĻ•â€™āĨ¤ āĻļāĻ°ā§āĻ¤ āĻšāĻ˛: āĻĒā§āĻ°āĻ¤āĻŋāĻŸāĻŋ āĻŦā§āĻ¯āĻ•ā§āĻ¤āĻŋ āĻŦā§‡āĻāĻšā§‡ āĻĨāĻžāĻ•āĻŦā§‡ āĻ•āĻŋāĻ¨āĻž āĻ¤āĻž āĻ­āĻŦāĻŋāĻˇā§āĻ¯āĻĻā§āĻŦāĻžāĻŖā§€ āĻ•āĻ°ā§āĻ¨āĨ¤ āĻ¸āĻžāĻ§āĻžāĻ°āĻŖāĻ­āĻžāĻŦā§‡ āĻŦāĻ˛āĻ¤ā§‡ āĻ—ā§‡āĻ˛ā§‡, āĻĄāĻŋāĻāĻ¸-āĻāĻ° āĻ¸āĻžāĻĨā§‡ āĻœāĻĄāĻŧāĻŋāĻ¤ āĻāĻ•āĻœāĻ¨ āĻŦā§āĻ¯āĻ•ā§āĻ¤āĻŋāĻ° āĻ•āĻžāĻœ āĻšāĻ˛ āĻĄā§‡āĻŸāĻž āĻ¸āĻ‚āĻ—ā§āĻ°āĻš āĻ•āĻ°āĻž, āĻāĻŸāĻŋ āĻĒā§āĻ°āĻ•ā§āĻ°āĻŋāĻ¯āĻŧāĻž āĻ•āĻ°āĻž, āĻāĻ•āĻŸāĻŋ āĻŽāĻĄā§‡āĻ˛āĻ•ā§‡ āĻĒā§āĻ°āĻļāĻŋāĻ•ā§āĻˇāĻŖ āĻĻā§‡āĻ“āĻ¯āĻŧāĻž, āĻĒā§‚āĻ°ā§āĻŦāĻžāĻ­āĻžāĻ¸ āĻĻā§‡āĻ“āĻ¯āĻŧāĻž āĻ‡āĻ¤ā§āĻ¯āĻžāĻĻāĻŋāĨ¤ āĻ•āĻžāĻ—āĻ˛-āĻ, āĻ†āĻŽāĻžāĻĻā§‡āĻ° āĻĄā§‡āĻŸāĻž āĻ¸āĻ‚āĻ—ā§āĻ°āĻšā§‡āĻ° āĻĒāĻ°ā§āĻ¯āĻžāĻ¯āĻŧāĻŸāĻŋ āĻāĻĄāĻŧāĻŋāĻ¯āĻŧā§‡ āĻ¯āĻžāĻ“āĻ¯āĻŧāĻžāĻ° āĻ…āĻ¨ā§āĻŽāĻ¤āĻŋ āĻĻā§‡āĻ“āĻ¯āĻŧāĻž āĻšāĻ¯āĻŧ - āĻ¸ā§‡āĻ—ā§āĻ˛āĻŋ āĻĒā§āĻ˛ā§āĻ¯āĻžāĻŸāĻĢāĻ°ā§āĻŽā§‡ āĻ‰āĻĒāĻ¸ā§āĻĨāĻžāĻĒāĻ¨ āĻ•āĻ°āĻž āĻšāĻ¯āĻŧāĨ¤ āĻ†āĻŽāĻžāĻĻā§‡āĻ° āĻ¸ā§‡āĻ—ā§āĻ˛āĻŋ āĻĄāĻžāĻ‰āĻ¨āĻ˛ā§‹āĻĄ āĻ•āĻ°āĻ¤ā§‡ āĻšāĻŦā§‡ āĻāĻŦāĻ‚ āĻ†āĻŽāĻ°āĻž āĻļā§āĻ°ā§ āĻ•āĻ°āĻ¤ā§‡ āĻĒāĻžāĻ°āĻŋ!

āĻ†āĻĒāĻ¨āĻŋ āĻ¨āĻŋāĻŽā§āĻ¨āĻ˛āĻŋāĻ–āĻŋāĻ¤ āĻšāĻŋāĻ¸āĻžāĻŦā§‡ āĻāĻŸāĻŋ āĻ•āĻ°āĻ¤ā§‡ āĻĒāĻžāĻ°ā§‡āĻ¨:

āĻĄā§‡āĻŸāĻž āĻŸā§āĻ¯āĻžāĻŦā§‡ āĻĄā§‡āĻŸāĻž āĻĨāĻžāĻ•ā§‡ āĻāĻŽāĻ¨ āĻĢāĻžāĻ‡āĻ˛ āĻ°āĻ¯āĻŧā§‡āĻ›ā§‡

āĻĄā§‡āĻŸāĻž āĻ¸āĻžāĻ¯āĻŧā§‡āĻ¨ā§āĻ¸ā§‡ āĻ†āĻĒāĻ¨āĻžāĻ° āĻĒā§āĻ°āĻĨāĻŽ āĻ§āĻžāĻĒāĨ¤ āĻŸāĻžāĻ‡āĻŸāĻžāĻ¨āĻŋāĻ•

āĻĄā§‡āĻŸāĻž āĻ¸āĻžāĻ¯āĻŧā§‡āĻ¨ā§āĻ¸ā§‡ āĻ†āĻĒāĻ¨āĻžāĻ° āĻĒā§āĻ°āĻĨāĻŽ āĻ§āĻžāĻĒāĨ¤ āĻŸāĻžāĻ‡āĻŸāĻžāĻ¨āĻŋāĻ•

ЗаĐŗŅ€ŅƒĐˇĐ¸Đģи Đ´Đ°ĐŊĐŊŅ‹Đĩ, ĐŋОдĐŗĐžŅ‚ОвиĐģи ĐŊĐ°ŅˆĐ¸ Jupyter Ņ‚ĐĩŅ‚Ņ€Đ°Đ´Đēи иâ€Ļ

āĻ§āĻžāĻĒ āĻĻā§āĻ‡

āĻ†āĻŽāĻ°āĻž āĻāĻ–āĻ¨ āĻāĻ‡ āĻĄā§‡āĻŸāĻž āĻ•āĻŋāĻ­āĻžāĻŦā§‡ āĻ˛ā§‹āĻĄ āĻ•āĻ°āĻŦ?

āĻĒā§āĻ°āĻĨāĻŽā§‡, āĻ†āĻ¸ā§āĻ¨ āĻĒā§āĻ°āĻ¯āĻŧā§‹āĻœāĻ¨ā§€āĻ¯āĻŧ āĻ˛āĻžāĻ‡āĻŦā§āĻ°ā§‡āĻ°āĻŋāĻ—ā§āĻ˛āĻŋ āĻ†āĻŽāĻĻāĻžāĻ¨āĻŋ āĻ•āĻ°āĻŋ:

import pandas as pd
import numpy as np

āĻ†āĻ°āĻ“ āĻĒā§āĻ°āĻ•ā§āĻ°āĻŋāĻ¯āĻŧāĻžāĻ•āĻ°āĻŖā§‡āĻ° āĻœāĻ¨ā§āĻ¯ āĻĒāĻžāĻ¨ā§āĻĄāĻžāĻ¸ āĻ†āĻŽāĻžāĻĻā§‡āĻ° .csv āĻĢāĻžāĻ‡āĻ˛ āĻĄāĻžāĻ‰āĻ¨āĻ˛ā§‹āĻĄ āĻ•āĻ°āĻžāĻ° āĻ…āĻ¨ā§āĻŽāĻ¤āĻŋ āĻĻā§‡āĻŦā§‡āĨ¤

āĻ¸āĻ‚āĻ–ā§āĻ¯āĻž āĻ¸āĻš āĻāĻ•āĻŸāĻŋ āĻŽā§āĻ¯āĻžāĻŸā§āĻ°āĻŋāĻ•ā§āĻ¸ āĻšāĻŋāĻ¸āĻžāĻŦā§‡ āĻ†āĻŽāĻžāĻĻā§‡āĻ° āĻĄā§‡āĻŸāĻž āĻŸā§‡āĻŦāĻŋāĻ˛ā§‡āĻ° āĻĒā§āĻ°āĻ¤āĻŋāĻ¨āĻŋāĻ§āĻŋāĻ¤ā§āĻŦ āĻ•āĻ°āĻ¤ā§‡ Numpy āĻĒā§āĻ°āĻ¯āĻŧā§‹āĻœāĻ¨āĨ¤
āĻāĻ—āĻŋāĻ¯āĻŧā§‡ āĻ¯āĻžāĻ¨. āĻ†āĻ¸ā§āĻ¨ train.csv āĻĢāĻžāĻ‡āĻ˛āĻŸāĻŋ āĻ¨āĻŋāĻ¯āĻŧā§‡ āĻ†āĻŽāĻžāĻĻā§‡āĻ° āĻ•āĻžāĻ›ā§‡ āĻ†āĻĒāĻ˛ā§‹āĻĄ āĻ•āĻ°āĻŋ:

dataset = pd.read_csv('train.csv')

āĻ†āĻŽāĻ°āĻž āĻĄā§‡āĻŸāĻžāĻ¸ā§‡āĻŸ āĻ­ā§‡āĻ°āĻŋāĻ¯āĻŧā§‡āĻŦāĻ˛ā§‡āĻ° āĻŽāĻžāĻ§ā§āĻ¯āĻŽā§‡ āĻ†āĻŽāĻžāĻĻā§‡āĻ° train.csv āĻĄā§‡āĻŸāĻž āĻ¨āĻŋāĻ°ā§āĻŦāĻžāĻšāĻ¨āĻ•ā§‡ āĻ‰āĻ˛ā§āĻ˛ā§‡āĻ– āĻ•āĻ°āĻŦāĨ¤ āĻšāĻ˛ā§āĻ¨ āĻĻā§‡āĻ–āĻŋ āĻ¸ā§‡āĻ–āĻžāĻ¨ā§‡ āĻ•āĻŋ āĻ†āĻ›ā§‡:

dataset.head()

āĻĄā§‡āĻŸāĻž āĻ¸āĻžāĻ¯āĻŧā§‡āĻ¨ā§āĻ¸ā§‡ āĻ†āĻĒāĻ¨āĻžāĻ° āĻĒā§āĻ°āĻĨāĻŽ āĻ§āĻžāĻĒāĨ¤ āĻŸāĻžāĻ‡āĻŸāĻžāĻ¨āĻŋāĻ•

head() āĻĢāĻžāĻ‚āĻļāĻ¨ āĻ†āĻŽāĻžāĻĻā§‡āĻ° āĻāĻ•āĻŸāĻŋ āĻĄā§‡āĻŸāĻžāĻĢā§āĻ°ā§‡āĻŽā§‡āĻ° āĻĒā§āĻ°āĻĨāĻŽ āĻ•āĻ¯āĻŧā§‡āĻ•āĻŸāĻŋ āĻ¸āĻžāĻ°āĻŋ āĻĻā§‡āĻ–āĻ¤ā§‡ āĻĻā§‡āĻ¯āĻŧāĨ¤

āĻŦā§‡āĻāĻšā§‡ āĻĨāĻžāĻ•āĻž āĻ•āĻ˛āĻžāĻŽāĻ—ā§āĻ˛āĻŋ āĻšāĻ˛ āĻ†āĻŽāĻžāĻĻā§‡āĻ° āĻĢāĻ˛āĻžāĻĢāĻ˛, āĻ¯āĻž āĻāĻ‡ āĻĄā§‡āĻŸāĻžāĻĢā§āĻ°ā§‡āĻŽā§‡ āĻĒāĻ°āĻŋāĻšāĻŋāĻ¤āĨ¤ āĻŸāĻžāĻ¸ā§āĻ• āĻĒā§āĻ°āĻļā§āĻ¨ā§‡āĻ° āĻœāĻ¨ā§āĻ¯, test.csv āĻĄā§‡āĻŸāĻžāĻ° āĻœāĻ¨ā§āĻ¯ āĻ†āĻŽāĻžāĻĻā§‡āĻ° āĻŦā§‡āĻāĻšā§‡ āĻĨāĻžāĻ•āĻž āĻ•āĻ˛āĻžāĻŽā§‡āĻ° āĻĒā§‚āĻ°ā§āĻŦāĻžāĻ­āĻžāĻ¸ āĻĻāĻŋāĻ¤ā§‡ āĻšāĻŦā§‡āĨ¤ āĻāĻ‡ āĻĄā§‡āĻŸāĻž āĻŸāĻžāĻ‡āĻŸāĻžāĻ¨āĻŋāĻ•ā§‡āĻ° āĻ…āĻ¨ā§āĻ¯āĻžāĻ¨ā§āĻ¯ āĻ¯āĻžāĻ¤ā§āĻ°ā§€āĻĻā§‡āĻ° āĻ¸āĻŽā§āĻĒāĻ°ā§āĻ•ā§‡ āĻ¤āĻĨā§āĻ¯ āĻ¸āĻžā§āĻšāĻ¯āĻŧ āĻ•āĻ°ā§‡, āĻ¯āĻžāĻ° āĻœāĻ¨ā§āĻ¯ āĻ†āĻŽāĻ°āĻž āĻ¸āĻŽāĻ¸ā§āĻ¯āĻžāĻ° āĻ¸āĻŽāĻžāĻ§āĻžāĻ¨ āĻ•āĻ°āĻ›āĻŋ, āĻĢāĻ˛āĻžāĻĢāĻ˛āĻŸāĻŋ āĻœāĻžāĻ¨āĻŋ āĻ¨āĻžāĨ¤

āĻ¸ā§āĻ¤āĻ°āĻžāĻ‚, āĻ†āĻ¸ā§āĻ¨ āĻ†āĻŽāĻžāĻĻā§‡āĻ° āĻŸā§‡āĻŦāĻŋāĻ˛āĻŸāĻŋāĻ•ā§‡ āĻ¨āĻŋāĻ°ā§āĻ­āĻ°āĻļā§€āĻ˛ āĻāĻŦāĻ‚ āĻ¸ā§āĻŦāĻžāĻ§ā§€āĻ¨ āĻĄā§‡āĻŸāĻžāĻ¤ā§‡ āĻ­āĻžāĻ— āĻ•āĻ°āĻŋāĨ¤ āĻāĻ–āĻžāĻ¨ā§‡ āĻ¸āĻŦāĻ•āĻŋāĻ›ā§ āĻ¸āĻšāĻœ. āĻ¨āĻŋāĻ°ā§āĻ­āĻ°āĻļā§€āĻ˛ āĻĄā§‡āĻŸāĻž āĻšāĻ˛ āĻ¸ā§‡āĻ‡ āĻĄā§‡āĻŸāĻž āĻ¯āĻž āĻĢāĻ˛āĻžāĻĢāĻ˛ā§‡ āĻĨāĻžāĻ•āĻž āĻ¸ā§āĻŦāĻžāĻ§ā§€āĻ¨ āĻĄā§‡āĻŸāĻžāĻ° āĻ‰āĻĒāĻ° āĻ¨āĻŋāĻ°ā§āĻ­āĻ° āĻ•āĻ°ā§‡āĨ¤ āĻ¸ā§āĻŦāĻžāĻ§ā§€āĻ¨ āĻĄā§‡āĻŸāĻž āĻšāĻ˛ āĻ¸ā§‡āĻ‡ āĻĄā§‡āĻŸāĻž āĻ¯āĻž āĻĢāĻ˛āĻžāĻĢāĻ˛āĻ•ā§‡ āĻĒā§āĻ°āĻ­āĻžāĻŦāĻŋāĻ¤ āĻ•āĻ°ā§‡āĨ¤

āĻ‰āĻĻāĻžāĻšāĻ°āĻŖāĻ¸ā§āĻŦāĻ°ā§‚āĻĒ, āĻ†āĻŽāĻžāĻĻā§‡āĻ° āĻ•āĻžāĻ›ā§‡ āĻ¨āĻŋāĻŽā§āĻ¨āĻ˛āĻŋāĻ–āĻŋāĻ¤ āĻĄā§‡āĻŸāĻž āĻ¸ā§‡āĻŸ āĻ°āĻ¯āĻŧā§‡āĻ›ā§‡:

"āĻ­ā§‹āĻ­āĻž āĻ•āĻŽā§āĻĒāĻŋāĻ‰āĻŸāĻžāĻ° āĻ¸āĻžāĻ¯āĻŧā§‡āĻ¨ā§āĻ¸ āĻĒāĻĄāĻŧāĻžāĻ¤ā§‡āĻ¨ - āĻ¨āĻžāĨ¤
āĻ­ā§‹āĻ­āĻž āĻ•āĻŽā§āĻĒāĻŋāĻ‰āĻŸāĻžāĻ° āĻŦāĻŋāĻœā§āĻžāĻžāĻ¨ā§‡ 2 āĻĒā§‡āĻ¯āĻŧā§‡āĻ›ā§‡āĨ¤"

āĻ•āĻŽā§āĻĒāĻŋāĻ‰āĻŸāĻžāĻ° āĻŦāĻŋāĻœā§āĻžāĻžāĻ¨ā§‡āĻ° āĻ—ā§āĻ°ā§‡āĻĄ āĻĒā§āĻ°āĻļā§āĻ¨ā§‡āĻ° āĻ‰āĻ¤ā§āĻ¤āĻ°ā§‡āĻ° āĻ‰āĻĒāĻ° āĻ¨āĻŋāĻ°ā§āĻ­āĻ° āĻ•āĻ°ā§‡: āĻ­ā§‹āĻ­āĻž āĻ•āĻŋ āĻ•āĻŽā§āĻĒāĻŋāĻ‰āĻŸāĻžāĻ° āĻŦāĻŋāĻœā§āĻžāĻžāĻ¨ āĻ…āĻ§ā§āĻ¯āĻ¯āĻŧāĻ¨ āĻ•āĻ°ā§‡āĻ›āĻŋāĻ˛ā§‡āĻ¨? āĻāĻŸāĻž āĻ•āĻŋ āĻĒāĻ°āĻŋāĻ¸ā§āĻ•āĻžāĻ°? āĻšāĻ˛ā§āĻ¨ āĻāĻ—āĻŋāĻ¯āĻŧā§‡ āĻšāĻ˛ā§āĻ¨, āĻ†āĻŽāĻ°āĻž āĻ‡āĻ¤āĻŋāĻŽāĻ§ā§āĻ¯ā§‡ āĻ˛āĻ•ā§āĻˇā§āĻ¯ āĻ•āĻžāĻ›āĻžāĻ•āĻžāĻ›āĻŋ!

āĻ¸ā§āĻŦāĻžāĻ§ā§€āĻ¨ āĻĄā§‡āĻŸāĻžāĻ° āĻœāĻ¨ā§āĻ¯ āĻĒā§āĻ°āĻĨāĻžāĻ—āĻ¤ āĻĒāĻ°āĻŋāĻŦāĻ°ā§āĻ¤āĻ¨āĻļā§€āĻ˛ āĻšāĻ˛ XāĨ¤ āĻ¨āĻŋāĻ°ā§āĻ­āĻ°āĻļā§€āĻ˛ āĻĄā§‡āĻŸāĻžāĻ° āĻœāĻ¨ā§āĻ¯, yāĨ¤

āĻ†āĻŽāĻ°āĻž āĻ¨āĻŋāĻŽā§āĻ¨āĻ˛āĻŋāĻ–āĻŋāĻ¤ āĻ•āĻ°āĻŋ:

X = dataset.iloc[ : , 2 : ]
y = dataset.iloc[ : , 1 : 2 ]

āĻāĻŸāĻž āĻ•āĻŋ? iloc[:, 2: ] āĻĢāĻžāĻ‚āĻļāĻ¨ āĻĻāĻŋāĻ¯āĻŧā§‡ āĻ†āĻŽāĻ°āĻž āĻĒāĻžāĻ‡āĻĨāĻ¨āĻ•ā§‡ āĻŦāĻ˛āĻŋ: āĻ†āĻŽāĻŋ āĻĻā§āĻŦāĻŋāĻ¤ā§€āĻ¯āĻŧ āĻ•āĻ˛āĻžāĻŽ āĻĨā§‡āĻ•ā§‡ āĻļā§āĻ°ā§ āĻšāĻ“āĻ¯āĻŧāĻž āĻĄāĻžāĻŸāĻž X āĻĒāĻ°āĻŋāĻŦāĻ°ā§āĻ¤āĻ¨āĻļā§€āĻ˛ āĻĻā§‡āĻ–āĻ¤ā§‡ āĻšāĻžāĻ‡ (āĻ…āĻ¨ā§āĻ¤āĻ°ā§āĻ­ā§āĻ•ā§āĻ¤ āĻāĻŦāĻ‚ āĻļāĻ°ā§āĻ¤ āĻĨāĻžāĻ•ā§‡ āĻ¯ā§‡ āĻ—āĻŖāĻ¨āĻž āĻļā§‚āĻ¨ā§āĻ¯ āĻĨā§‡āĻ•ā§‡ āĻļā§āĻ°ā§ āĻšāĻ¯āĻŧ)āĨ¤ āĻĻā§āĻŦāĻŋāĻ¤ā§€āĻ¯āĻŧ āĻ˛āĻžāĻ‡āĻ¨ā§‡ āĻ†āĻŽāĻ°āĻž āĻŦāĻ˛āĻŋ āĻ¯ā§‡ āĻ†āĻŽāĻ°āĻž āĻĒā§āĻ°āĻĨāĻŽ āĻ•āĻ˛āĻžāĻŽā§‡ āĻĄā§‡āĻŸāĻž āĻĻā§‡āĻ–āĻ¤ā§‡ āĻšāĻžāĻ‡āĨ¤

[a:b, c:d] āĻšāĻ˛ āĻ†āĻŽāĻ°āĻž āĻŦāĻ¨ā§āĻ§āĻ¨ā§€āĻ¤ā§‡ āĻ¯āĻž āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻ•āĻ°āĻŋ āĻ¤āĻžāĻ° āĻ¨āĻŋāĻ°ā§āĻŽāĻžāĻŖāĨ¤ āĻ†āĻĒāĻ¨āĻŋ āĻ•ā§‹āĻ¨ā§‹ āĻ­ā§‡āĻ°āĻŋāĻ¯āĻŧā§‡āĻŦāĻ˛ āĻ¨āĻŋāĻ°ā§āĻĻāĻŋāĻˇā§āĻŸ āĻ¨āĻž āĻ•āĻ°āĻ˛ā§‡, āĻ¸ā§‡āĻ—ā§āĻ˛āĻŋ āĻĄāĻŋāĻĢāĻ˛ā§āĻŸ āĻšāĻŋāĻ¸āĻžāĻŦā§‡ āĻ¸āĻ‚āĻ°āĻ•ā§āĻˇāĻŖ āĻ•āĻ°āĻž āĻšāĻŦā§‡āĨ¤ āĻ…āĻ°ā§āĻĨāĻžā§Ž, āĻ†āĻŽāĻ°āĻž [:,:d] āĻ¨āĻŋāĻ°ā§āĻĻāĻŋāĻˇā§āĻŸ āĻ•āĻ°āĻ¤ā§‡ āĻĒāĻžāĻ°āĻŋ āĻāĻŦāĻ‚ āĻ¤āĻžāĻ°āĻĒāĻ°ā§‡ āĻ†āĻŽāĻ°āĻž āĻĄāĻžāĻŸāĻžāĻĢā§āĻ°ā§‡āĻŽā§‡āĻ° āĻ¸āĻŽāĻ¸ā§āĻ¤ āĻ•āĻ˛āĻžāĻŽ āĻĒāĻžāĻŦ, āĻ¯ā§‡āĻ—ā§āĻ˛āĻŋ d āĻĨā§‡āĻ•ā§‡ āĻ¸āĻ‚āĻ–ā§āĻ¯āĻžāĻ° āĻĻāĻŋāĻ•ā§‡ āĻ¯āĻžāĻ¯āĻŧ āĻŦāĻžāĻĻā§‡āĨ¤ āĻ­ā§‡āĻ°āĻŋāĻ¯āĻŧā§‡āĻŦāĻ˛ a āĻāĻŦāĻ‚ b āĻ¸ā§āĻŸā§āĻ°āĻŋāĻ‚āĻ—ā§āĻ˛āĻŋāĻ•ā§‡ āĻ¸āĻ‚āĻœā§āĻžāĻžāĻ¯āĻŧāĻŋāĻ¤ āĻ•āĻ°ā§‡, āĻ•āĻŋāĻ¨ā§āĻ¤ā§ āĻ†āĻŽāĻžāĻĻā§‡āĻ° āĻ¸ā§‡āĻ—ā§āĻ˛āĻŋ āĻ¸āĻŦ āĻĒā§āĻ°āĻ¯āĻŧā§‹āĻœāĻ¨, āĻ¤āĻžāĻ‡ āĻ†āĻŽāĻ°āĻž āĻāĻŸāĻŋāĻ•ā§‡ āĻĄāĻŋāĻĢāĻ˛ā§āĻŸ āĻšāĻŋāĻ¸āĻžāĻŦā§‡ āĻ°ā§‡āĻ–ā§‡ āĻĻāĻŋāĻ‡āĨ¤

āĻ†āĻ¸ā§āĻ¨ āĻĻā§‡āĻ–āĻŋ āĻ†āĻŽāĻ°āĻž āĻ•āĻŋ āĻĒā§‡āĻ¯āĻŧā§‡āĻ›āĻŋ:

X.head()

āĻĄā§‡āĻŸāĻž āĻ¸āĻžāĻ¯āĻŧā§‡āĻ¨ā§āĻ¸ā§‡ āĻ†āĻĒāĻ¨āĻžāĻ° āĻĒā§āĻ°āĻĨāĻŽ āĻ§āĻžāĻĒāĨ¤ āĻŸāĻžāĻ‡āĻŸāĻžāĻ¨āĻŋāĻ•

y.head()

āĻĄā§‡āĻŸāĻž āĻ¸āĻžāĻ¯āĻŧā§‡āĻ¨ā§āĻ¸ā§‡ āĻ†āĻĒāĻ¨āĻžāĻ° āĻĒā§āĻ°āĻĨāĻŽ āĻ§āĻžāĻĒāĨ¤ āĻŸāĻžāĻ‡āĻŸāĻžāĻ¨āĻŋāĻ•

āĻāĻ‡ āĻ›ā§‹āĻŸā§āĻŸ āĻĒāĻžāĻ āĻŸāĻŋāĻ•ā§‡ āĻ¸āĻšāĻœ āĻ•āĻ°āĻžāĻ° āĻœāĻ¨ā§āĻ¯, āĻ†āĻŽāĻ°āĻž āĻāĻŽāĻ¨ āĻ•āĻ˛āĻžāĻŽāĻ—ā§āĻ˛āĻŋ āĻ¸āĻ°āĻŋāĻ¯āĻŧā§‡ āĻĻā§‡āĻŦ āĻ¯ā§‡āĻ—ā§āĻ˛āĻŋāĻ° āĻŦāĻŋāĻļā§‡āĻˇ āĻ¯āĻ¤ā§āĻ¨ā§‡āĻ° āĻĒā§āĻ°āĻ¯āĻŧā§‹āĻœāĻ¨ āĻŦāĻž āĻŦā§‡āĻāĻšā§‡ āĻĨāĻžāĻ•āĻžāĻ° āĻ•ā§āĻˇāĻŽāĻ¤āĻžāĻ•ā§‡ āĻāĻ•ā§‡āĻŦāĻžāĻ°ā§‡āĻ‡ āĻĒā§āĻ°āĻ­āĻžāĻŦāĻŋāĻ¤ āĻ•āĻ°ā§‡ āĻ¨āĻžāĨ¤ āĻ¤āĻžāĻ°āĻž āĻŸāĻžāĻ‡āĻĒ str āĻ¤āĻĨā§āĻ¯ āĻ†āĻ›ā§‡.

count = ['Name', 'Ticket', 'Cabin', 'Embarked']
X.drop(count, inplace=True, axis=1)

āĻ¸ā§āĻĒāĻžāĻ°! āĻāĻ° āĻĒāĻ°āĻŦāĻ°ā§āĻ¤ā§€ āĻ§āĻžāĻĒā§‡ āĻāĻ—āĻŋāĻ¯āĻŧā§‡ āĻ¯āĻžāĻ“āĻ¯āĻŧāĻž āĻ¯āĻžāĻ•.

āĻ§āĻžāĻĒ āĻ¤āĻŋāĻ¨

āĻāĻ–āĻžāĻ¨ā§‡ āĻ†āĻŽāĻžāĻĻā§‡āĻ° āĻĄā§‡āĻŸāĻž āĻāĻ¨āĻ•ā§‹āĻĄ āĻ•āĻ°āĻ¤ā§‡ āĻšāĻŦā§‡ āĻ¯āĻžāĻ¤ā§‡ āĻŽā§‡āĻļāĻŋāĻ¨āĻŸāĻŋ āĻ†āĻ°āĻ“ āĻ­āĻžāĻ˛āĻ­āĻžāĻŦā§‡ āĻŦā§āĻāĻ¤ā§‡ āĻĒāĻžāĻ°ā§‡ āĻ¯ā§‡ āĻāĻ‡ āĻĄā§‡āĻŸāĻž āĻĢāĻ˛āĻžāĻĢāĻ˛āĻ•ā§‡ āĻ•ā§€āĻ­āĻžāĻŦā§‡ āĻĒā§āĻ°āĻ­āĻžāĻŦāĻŋāĻ¤ āĻ•āĻ°ā§‡āĨ¤ āĻ•āĻŋāĻ¨ā§āĻ¤ā§ āĻ†āĻŽāĻ°āĻž āĻ¸āĻŦāĻ•āĻŋāĻ›ā§ āĻāĻ¨āĻ•ā§‹āĻĄ āĻ•āĻ°āĻŦ āĻ¨āĻž, āĻļā§āĻ§ā§āĻŽāĻžāĻ¤ā§āĻ° str āĻĄā§‡āĻŸāĻž āĻ¯āĻž āĻ†āĻŽāĻ°āĻž āĻ°ā§‡āĻ–ā§‡āĻ›āĻŋāĨ¤ āĻ•āĻ˛āĻžāĻŽ "āĻ¸ā§‡āĻ•ā§āĻ¸"āĨ¤ āĻ†āĻŽāĻ°āĻž āĻ•āĻŋāĻ­āĻžāĻŦā§‡ āĻ•ā§‹āĻĄ āĻ•āĻ°āĻ¤ā§‡ āĻšāĻžāĻ‡? āĻ†āĻ¸ā§āĻ¨ āĻ­ā§‡āĻ•ā§āĻŸāĻ° āĻšāĻŋāĻ¸āĻžāĻŦā§‡ āĻāĻ•āĻœāĻ¨ āĻŦā§āĻ¯āĻ•ā§āĻ¤āĻŋāĻ° āĻ˛āĻŋāĻ™ā§āĻ— āĻ¸āĻŽā§āĻĒāĻ°ā§āĻ•ā§‡ āĻĄā§‡āĻŸāĻž āĻ‰āĻĒāĻ¸ā§āĻĨāĻžāĻĒāĻ¨ āĻ•āĻ°āĻŋ: 10 - āĻĒā§āĻ°ā§āĻˇ, 01 - āĻŽāĻšāĻŋāĻ˛āĻžāĨ¤

āĻĒā§āĻ°āĻĨāĻŽā§‡, āĻ†āĻ¸ā§āĻ¨ āĻ†āĻŽāĻžāĻĻā§‡āĻ° āĻŸā§‡āĻŦāĻŋāĻ˛āĻ—ā§āĻ˛āĻŋāĻ•ā§‡ āĻāĻ•āĻŸāĻŋ NumPy āĻŽā§āĻ¯āĻžāĻŸā§āĻ°āĻŋāĻ•ā§āĻ¸ā§‡ āĻ°ā§‚āĻĒāĻžāĻ¨ā§āĻ¤āĻ° āĻ•āĻ°āĻŋ:

X = np.array(X)
y = np.array(y)

āĻāĻŦāĻ‚ āĻāĻ–āĻ¨ āĻĻā§‡āĻ–āĻž āĻ¯āĻžāĻ•:

from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import OneHotEncoder

ct = ColumnTransformer(transformers=[('encoder', OneHotEncoder(), [1])],
                       remainder='passthrough')
X = np.array(ct.fit_transform(X))

āĻ¸ā§āĻ•āĻ˛āĻžāĻ°āĻ¨ āĻ˛āĻžāĻ‡āĻŦā§āĻ°ā§‡āĻ°āĻŋ āĻāĻŽāĻ¨ āĻāĻ•āĻŸāĻŋ āĻĻā§āĻ°ā§āĻĻāĻžāĻ¨ā§āĻ¤ āĻ˛āĻžāĻ‡āĻŦā§āĻ°ā§‡āĻ°āĻŋ āĻ¯āĻž āĻ†āĻŽāĻžāĻĻā§‡āĻ° āĻĄā§‡āĻŸāĻž āĻ¸āĻžāĻ¯āĻŧā§‡āĻ¨ā§āĻ¸ā§‡ āĻ¸āĻŽā§āĻĒā§‚āĻ°ā§āĻŖ āĻ•āĻžāĻœ āĻ•āĻ°āĻ¤ā§‡ āĻĻā§‡āĻ¯āĻŧāĨ¤ āĻāĻŸāĻŋāĻ¤ā§‡ āĻĒā§āĻ°āĻšā§āĻ° āĻ¸āĻ‚āĻ–ā§āĻ¯āĻ• āĻ†āĻ•āĻ°ā§āĻˇāĻŖā§€āĻ¯āĻŧ āĻŽā§‡āĻļāĻŋāĻ¨ āĻ˛āĻžāĻ°ā§āĻ¨āĻŋāĻ‚ āĻŽāĻĄā§‡āĻ˛ āĻ°āĻ¯āĻŧā§‡āĻ›ā§‡ āĻāĻŦāĻ‚ āĻāĻŸāĻŋ āĻ†āĻŽāĻžāĻĻā§‡āĻ° āĻĄā§‡āĻŸāĻž āĻĒā§āĻ°āĻ¸ā§āĻ¤ā§āĻ¤ āĻ•āĻ°āĻžāĻ° āĻ…āĻ¨ā§āĻŽāĻ¤āĻŋ āĻĻā§‡āĻ¯āĻŧāĨ¤

OneHotEncoder āĻ†āĻŽāĻžāĻĻā§‡āĻ°āĻ•ā§‡ āĻ¸ā§‡āĻ‡ āĻĒā§āĻ°āĻ¤āĻŋāĻ¨āĻŋāĻ§āĻŋāĻ¤ā§āĻŦā§‡ āĻāĻ•āĻœāĻ¨ āĻŦā§āĻ¯āĻ•ā§āĻ¤āĻŋāĻ° āĻ˛āĻŋāĻ™ā§āĻ— āĻāĻ¨āĻ•ā§‹āĻĄ āĻ•āĻ°āĻžāĻ° āĻ…āĻ¨ā§āĻŽāĻ¤āĻŋ āĻĻā§‡āĻŦā§‡, āĻ¯ā§‡āĻŽāĻ¨ āĻ†āĻŽāĻ°āĻž āĻŦāĻ°ā§āĻŖāĻ¨āĻž āĻ•āĻ°ā§‡āĻ›āĻŋāĨ¤ 2āĻŸāĻŋ āĻ•ā§āĻ˛āĻžāĻ¸ āĻ¤ā§ˆāĻ°āĻŋ āĻ•āĻ°āĻž āĻšāĻŦā§‡: āĻĒā§āĻ°ā§āĻˇ, āĻŽāĻšāĻŋāĻ˛āĻžāĨ¤ āĻ¯āĻĻāĻŋ āĻŦā§āĻ¯āĻ•ā§āĻ¤āĻŋāĻŸāĻŋ āĻāĻ•āĻœāĻ¨ āĻĒā§āĻ°ā§āĻˇ āĻšāĻ¯āĻŧ, āĻ¤āĻžāĻšāĻ˛ā§‡ āĻ¯āĻĨāĻžāĻ•ā§āĻ°āĻŽā§‡ "āĻĒā§āĻ°ā§āĻˇ" āĻ•āĻ˛āĻžāĻŽā§‡ 1 āĻāĻŦāĻ‚ "āĻŽāĻšāĻŋāĻ˛āĻž" āĻ•āĻ˛āĻžāĻŽā§‡ 0 āĻ˛ā§‡āĻ–āĻž āĻšāĻŦā§‡āĨ¤

OneHotEncoder() āĻāĻ° āĻĒāĻ°ā§‡ āĻ†āĻ›ā§‡ [1] - āĻāĻ° āĻŽāĻžāĻ¨ā§‡ āĻšāĻ˛ āĻ†āĻŽāĻ°āĻž āĻ•āĻ˛āĻžāĻŽ āĻ¨āĻŽā§āĻŦāĻ° 1 (āĻļā§‚āĻ¨ā§āĻ¯ āĻĨā§‡āĻ•ā§‡ āĻ—āĻŖāĻ¨āĻž) āĻāĻ¨āĻ•ā§‹āĻĄ āĻ•āĻ°āĻ¤ā§‡ āĻšāĻžāĻ‡āĨ¤

āĻ¸ā§āĻĒāĻžāĻ°. āĻāĻ° āĻ†āĻ°āĻ“ āĻāĻ—āĻŋāĻ¯āĻŧā§‡ āĻšāĻ˛ā§āĻ¨!

āĻāĻ•āĻŸāĻŋ āĻ¨āĻŋāĻ¯āĻŧāĻŽ āĻšāĻŋāĻ¸āĻžāĻŦā§‡, āĻāĻŸāĻŋ āĻ˜āĻŸā§‡ āĻ¯ā§‡ āĻ•āĻŋāĻ›ā§ āĻĄā§‡āĻŸāĻž āĻĢāĻžāĻāĻ•āĻž āĻ°āĻžāĻ–āĻž āĻšāĻ¯āĻŧ (āĻ…āĻ°ā§āĻĨāĻžā§Ž, NaN - āĻāĻ•āĻŸāĻŋ āĻ¸āĻ‚āĻ–ā§āĻ¯āĻž āĻ¨āĻ¯āĻŧ)āĨ¤ āĻ‰āĻĻāĻžāĻšāĻ°āĻŖāĻ¸ā§āĻŦāĻ°ā§‚āĻĒ, āĻāĻ•āĻœāĻ¨ āĻŦā§āĻ¯āĻ•ā§āĻ¤āĻŋāĻ° āĻ¸āĻŽā§āĻĒāĻ°ā§āĻ•ā§‡ āĻ¤āĻĨā§āĻ¯ āĻ°āĻ¯āĻŧā§‡āĻ›ā§‡: āĻ¤āĻžāĻ° āĻ¨āĻžāĻŽ, āĻ˛āĻŋāĻ™ā§āĻ—āĨ¤ āĻ¤āĻŦā§‡ āĻ¤āĻžāĻ° āĻŦāĻ¯āĻŧāĻ¸ āĻ¸āĻŽā§āĻĒāĻ°ā§āĻ•ā§‡ āĻ•ā§‹āĻ¨ā§‹ āĻ¤āĻĨā§āĻ¯ āĻ¨ā§‡āĻ‡āĨ¤ āĻāĻ‡ āĻ•ā§āĻˇā§‡āĻ¤ā§āĻ°ā§‡, āĻ†āĻŽāĻ°āĻž āĻ¨āĻŋāĻŽā§āĻ¨āĻ˛āĻŋāĻ–āĻŋāĻ¤ āĻĒāĻĻā§āĻ§āĻ¤āĻŋāĻŸāĻŋ āĻĒā§āĻ°āĻ¯āĻŧā§‹āĻ— āĻ•āĻ°āĻŦ: āĻ†āĻŽāĻ°āĻž āĻ¸āĻŽāĻ¸ā§āĻ¤ āĻ•āĻ˛āĻžāĻŽā§‡ āĻ—āĻžāĻŖāĻŋāĻ¤āĻŋāĻ• āĻ—āĻĄāĻŧ āĻ–ā§āĻāĻœā§‡ āĻĒāĻžāĻŦ āĻāĻŦāĻ‚, āĻ¯āĻĻāĻŋ āĻ•āĻ˛āĻžāĻŽā§‡ āĻ•āĻŋāĻ›ā§ āĻĄā§‡āĻŸāĻž āĻ…āĻ¨ā§āĻĒāĻ¸ā§āĻĨāĻŋāĻ¤ āĻĨāĻžāĻ•ā§‡, āĻ¤āĻžāĻšāĻ˛ā§‡ āĻ†āĻŽāĻ°āĻž āĻ—āĻžāĻŖāĻŋāĻ¤āĻŋāĻ• āĻ—āĻĄāĻŧ āĻĻāĻŋāĻ¯āĻŧā§‡ āĻļā§‚āĻ¨ā§āĻ¯āĻ¤āĻž āĻĒā§‚āĻ°āĻŖ āĻ•āĻ°āĻŦāĨ¤

from sklearn.impute import SimpleImputer
imputer = SimpleImputer(missing_values=np.nan, strategy='mean')
imputer.fit(X)
X = imputer.transform(X)

āĻāĻ–āĻ¨ āĻŦāĻŋāĻŦā§‡āĻšāĻ¨āĻž āĻ•āĻ°āĻž āĻ¯āĻžāĻ• āĻ¯ā§‡ āĻĒāĻ°āĻŋāĻ¸ā§āĻĨāĻŋāĻ¤āĻŋāĻ—ā§āĻ˛āĻŋ āĻ˜āĻŸā§‡ āĻ¯āĻ–āĻ¨ āĻĄā§‡āĻŸāĻž āĻ–ā§āĻŦ āĻŦāĻĄāĻŧ āĻšāĻ¯āĻŧāĨ¤ āĻ•āĻŋāĻ›ā§ āĻĄā§‡āĻŸāĻž āĻŦā§āĻ¯āĻŦāĻ§āĻžāĻ¨ā§‡ āĻ°āĻ¯āĻŧā§‡āĻ›ā§‡ [0:1], āĻ•āĻŋāĻ›ā§ āĻĄā§‡āĻŸāĻž āĻ•āĻ¯āĻŧā§‡āĻ•āĻļ āĻāĻŦāĻ‚ āĻšāĻžāĻœāĻžāĻ° āĻ›āĻžāĻĄāĻŧāĻŋāĻ¯āĻŧā§‡ āĻ¯ā§‡āĻ¤ā§‡ āĻĒāĻžāĻ°ā§‡āĨ¤ āĻāĻ‡ āĻ§āĻ°āĻ¨ā§‡āĻ° āĻŦāĻŋāĻ•ā§āĻˇāĻŋāĻĒā§āĻ¤āĻ•āĻ°āĻŖ āĻĻā§‚āĻ° āĻ•āĻ°āĻ¤ā§‡ āĻāĻŦāĻ‚ āĻ•āĻŽā§āĻĒāĻŋāĻ‰āĻŸāĻžāĻ°āĻ•ā§‡ āĻ¤āĻžāĻ° āĻ—āĻŖāĻ¨āĻžāĻ¯āĻŧ āĻ†āĻ°āĻ“ āĻ¨āĻŋāĻ°ā§āĻ­ā§āĻ˛ āĻ•āĻ°āĻ¤ā§‡, āĻ†āĻŽāĻ°āĻž āĻĄā§‡āĻŸāĻž āĻ¸ā§āĻ•ā§āĻ¯āĻžāĻ¨ āĻ•āĻ°āĻŦ āĻāĻŦāĻ‚ āĻ¸ā§āĻ•ā§‡āĻ˛ āĻ•āĻ°āĻŦāĨ¤ āĻ¸āĻŦ āĻ¸āĻ‚āĻ–ā§āĻ¯āĻž āĻ¤āĻŋāĻ¨ āĻ…āĻ¤āĻŋāĻ•ā§āĻ°āĻŽ āĻ¨āĻž āĻ•āĻ°āĻž āĻ¯āĻžāĻ•. āĻāĻŸāĻŋ āĻ•āĻ°āĻžāĻ° āĻœāĻ¨ā§āĻ¯, āĻ†āĻŽāĻ°āĻž StandardScaler āĻĢāĻžāĻ‚āĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻ•āĻ°āĻŦāĨ¤

from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X[:, 2:] = sc.fit_transform(X[:, 2:])

āĻāĻ–āĻ¨ āĻ†āĻŽāĻžāĻĻā§‡āĻ° āĻ¤āĻĨā§āĻ¯ āĻāĻ‡ āĻŽāĻ¤ āĻĻā§‡āĻ–āĻžāĻ¯āĻŧ:

āĻĄā§‡āĻŸāĻž āĻ¸āĻžāĻ¯āĻŧā§‡āĻ¨ā§āĻ¸ā§‡ āĻ†āĻĒāĻ¨āĻžāĻ° āĻĒā§āĻ°āĻĨāĻŽ āĻ§āĻžāĻĒāĨ¤ āĻŸāĻžāĻ‡āĻŸāĻžāĻ¨āĻŋāĻ•

āĻ•ā§āĻ˛āĻžāĻ¸āĨ¤ āĻ†āĻŽāĻ°āĻž āĻ‡āĻ¤āĻŋāĻŽāĻ§ā§āĻ¯ā§‡ āĻ†āĻŽāĻžāĻĻā§‡āĻ° āĻ˛āĻ•ā§āĻˇā§āĻ¯ āĻ•āĻžāĻ›āĻžāĻ•āĻžāĻ›āĻŋ!

āĻ§āĻžāĻĒ āĻšāĻžāĻ°

āĻ†āĻ¸ā§āĻ¨ āĻ†āĻŽāĻžāĻĻā§‡āĻ° āĻĒā§āĻ°āĻĨāĻŽ āĻŽāĻĄā§‡āĻ˛āĻ•ā§‡ āĻĒā§āĻ°āĻļāĻŋāĻ•ā§āĻˇāĻŖ āĻĻāĻŋāĻ‡! āĻ¸ā§āĻ•ā§āĻ˛āĻŋāĻ¯āĻŧāĻžāĻ° āĻ˛āĻžāĻ‡āĻŦā§āĻ°ā§‡āĻ°āĻŋ āĻĨā§‡āĻ•ā§‡ āĻ†āĻŽāĻ°āĻž āĻĒā§āĻ°āĻšā§āĻ° āĻ†āĻ•āĻ°ā§āĻˇāĻŖā§€āĻ¯āĻŧ āĻœāĻŋāĻ¨āĻŋāĻ¸ āĻ–ā§āĻāĻœā§‡ āĻĒā§‡āĻ¤ā§‡ āĻĒāĻžāĻ°āĻŋāĨ¤ āĻ†āĻŽāĻŋ āĻāĻ‡ āĻ¸āĻŽāĻ¸ā§āĻ¯āĻžāĻ° āĻœāĻ¨ā§āĻ¯ āĻ—ā§āĻ°ā§‡āĻĄāĻŋāĻ¯āĻŧā§‡āĻ¨ā§āĻŸ āĻŦā§āĻ¸ā§āĻŸāĻŋāĻ‚ āĻ•ā§āĻ˛āĻžāĻ¸āĻŋāĻĢāĻžāĻ¯āĻŧāĻžāĻ° āĻŽāĻĄā§‡āĻ˛ āĻĒā§āĻ°āĻ¯āĻŧā§‹āĻ— āĻ•āĻ°ā§‡āĻ›āĻŋāĨ¤ āĻ†āĻŽāĻ°āĻž āĻāĻ•āĻŸāĻŋ āĻ•ā§āĻ˛āĻžāĻ¸āĻŋāĻĢāĻžāĻ¯āĻŧāĻžāĻ° āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻ•āĻ°āĻŋ āĻ•āĻžāĻ°āĻŖ āĻ†āĻŽāĻžāĻĻā§‡āĻ° āĻ•āĻžāĻœāĻŸāĻŋ āĻāĻ•āĻŸāĻŋ āĻļā§āĻ°ā§‡āĻŖāĻŋāĻŦāĻĻā§āĻ§āĻ•āĻ°āĻŖā§‡āĻ° āĻ•āĻžāĻœāĨ¤ āĻĒā§‚āĻ°ā§āĻŦāĻžāĻ­āĻžāĻ¸āĻŸāĻŋ 1 (āĻŦā§‡āĻāĻšā§‡ āĻĨāĻžāĻ•āĻž) āĻŦāĻž 0 (āĻŦā§‡āĻāĻšā§‡ āĻ¯āĻžāĻ¯āĻŧāĻ¨āĻŋ) āĻ¨āĻŋāĻ°ā§āĻ§āĻžāĻ°āĻŖ āĻ•āĻ°āĻž āĻ‰āĻšāĻŋāĻ¤āĨ¤

from sklearn.ensemble import GradientBoostingClassifier
gbc = GradientBoostingClassifier(learning_rate=0.5, max_depth=5, n_estimators=150)
gbc.fit(X, y)

āĻĢāĻŋāĻŸ āĻĢāĻžāĻ‚āĻļāĻ¨āĻŸāĻŋ āĻĒāĻžāĻ‡āĻĨāĻ¨āĻ•ā§‡ āĻŦāĻ˛ā§‡: āĻŽāĻĄā§‡āĻ˛āĻŸāĻŋāĻ•ā§‡ X āĻāĻŦāĻ‚ y-āĻāĻ° āĻŽāĻ§ā§āĻ¯ā§‡ āĻ¨āĻŋāĻ°ā§āĻ­āĻ°āĻ¤āĻž āĻ–ā§āĻāĻœāĻ¤ā§‡ āĻĻāĻŋāĻ¨āĨ¤

āĻāĻ• āĻ¸ā§‡āĻ•ā§‡āĻ¨ā§āĻĄā§‡āĻ°āĻ“ āĻ•āĻŽ āĻāĻŦāĻ‚ āĻŽāĻĄā§‡āĻ˛ āĻĒā§āĻ°āĻ¸ā§āĻ¤ā§āĻ¤āĨ¤

āĻĄā§‡āĻŸāĻž āĻ¸āĻžāĻ¯āĻŧā§‡āĻ¨ā§āĻ¸ā§‡ āĻ†āĻĒāĻ¨āĻžāĻ° āĻĒā§āĻ°āĻĨāĻŽ āĻ§āĻžāĻĒāĨ¤ āĻŸāĻžāĻ‡āĻŸāĻžāĻ¨āĻŋāĻ•

āĻāĻŸāĻž āĻ•āĻŋāĻ­āĻžāĻŦā§‡ āĻĒā§āĻ°āĻ¯āĻŧā§‹āĻ— āĻ•āĻ°āĻŦā§‡āĻ¨? āĻ†āĻŽāĻ°āĻž āĻāĻ–āĻ¨ āĻĻā§‡āĻ–āĻŦ!

āĻ§āĻžāĻĒ āĻĒāĻžāĻāĻš. āĻ‰āĻĒāĻ¸āĻ‚āĻšāĻžāĻ°

āĻāĻ–āĻ¨ āĻ†āĻŽāĻžāĻĻā§‡āĻ° āĻĒāĻ°ā§€āĻ•ā§āĻˇāĻžāĻ° āĻĄā§‡āĻŸāĻž āĻ¸āĻš āĻāĻ•āĻŸāĻŋ āĻŸā§‡āĻŦāĻŋāĻ˛ āĻ˛ā§‹āĻĄ āĻ•āĻ°āĻ¤ā§‡ āĻšāĻŦā§‡ āĻ¯āĻžāĻ° āĻœāĻ¨ā§āĻ¯ āĻ†āĻŽāĻžāĻĻā§‡āĻ° āĻāĻ•āĻŸāĻŋ āĻĒā§‚āĻ°ā§āĻŦāĻžāĻ­āĻžāĻ¸ āĻ•āĻ°āĻ¤ā§‡ āĻšāĻŦā§‡āĨ¤ āĻāĻ‡ āĻŸā§‡āĻŦāĻŋāĻ˛ā§‡āĻ° āĻ¸āĻžāĻšāĻžāĻ¯ā§āĻ¯ā§‡ āĻ†āĻŽāĻ°āĻž X āĻāĻ° āĻœāĻ¨ā§āĻ¯ āĻ¯ā§‡ āĻ¸āĻŽāĻ¸ā§āĻ¤ āĻ•āĻžāĻœ āĻ•āĻ°ā§‡āĻ›āĻŋ āĻ¸ā§‡āĻ‡ āĻāĻ•āĻ‡ āĻ•āĻžāĻœ āĻ•āĻ°āĻŦāĨ¤

X_test = pd.read_csv('test.csv', index_col=0)

count = ['Name', 'Ticket', 'Cabin', 'Embarked']
X_test.drop(count, inplace=True, axis=1)

X_test = np.array(X_test)

from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import OneHotEncoder
ct = ColumnTransformer(transformers=[('encoder', OneHotEncoder(), [1])],
                       remainder='passthrough')
X_test = np.array(ct.fit_transform(X_test))

from sklearn.impute import SimpleImputer
imputer = SimpleImputer(missing_values=np.nan, strategy='mean')
imputer.fit(X_test)
X_test = imputer.transform(X_test)

from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_test[:, 2:] = sc.fit_transform(X_test[:, 2:])

āĻāĻ–āĻ¨ āĻ†āĻŽāĻžāĻĻā§‡āĻ° āĻŽāĻĄā§‡āĻ˛ āĻĒā§āĻ°āĻ¯āĻŧā§‹āĻ— āĻ•āĻ°āĻž āĻ¯āĻžāĻ•!

gbc_predict = gbc.predict(X_test)

āĻ¸āĻŦ āĻ†āĻŽāĻ°āĻž āĻāĻ•āĻŸāĻŋ āĻĒā§‚āĻ°ā§āĻŦāĻžāĻ­āĻžāĻ¸ āĻ•āĻ°ā§‡āĻ›āĻŋāĨ¤ āĻāĻ–āĻ¨ āĻāĻŸāĻŋ āĻ¸āĻŋāĻāĻ¸āĻ­āĻŋāĻ¤ā§‡ āĻ°ā§‡āĻ•āĻ°ā§āĻĄ āĻ•āĻ°ā§‡ āĻ“āĻ¯āĻŧā§‡āĻŦāĻ¸āĻžāĻ‡āĻŸā§‡ āĻĒāĻžāĻ āĻžāĻ¤ā§‡ āĻšāĻŦā§‡āĨ¤

np.savetxt('my_gbc_predict.csv', gbc_predict, delimiter=",", header = 'Survived')

āĻĒā§āĻ°āĻ¸ā§āĻ¤ā§āĻ¤. āĻ†āĻŽāĻ°āĻž āĻĒā§āĻ°āĻ¤āĻŋāĻŸāĻŋ āĻ¯āĻžāĻ¤ā§āĻ°ā§€āĻ° āĻœāĻ¨ā§āĻ¯ āĻĒā§‚āĻ°ā§āĻŦāĻžāĻ­āĻžāĻ¸ āĻ¸āĻŽā§āĻŦāĻ˛āĻŋāĻ¤ āĻāĻ•āĻŸāĻŋ āĻĢāĻžāĻ‡āĻ˛ āĻĒā§‡āĻ¯āĻŧā§‡āĻ›āĻŋāĨ¤ āĻ¯āĻž āĻ…āĻŦāĻļāĻŋāĻˇā§āĻŸ āĻĨāĻžāĻ•ā§‡ āĻ¤āĻž āĻšāĻ˛ āĻ“āĻ¯āĻŧā§‡āĻŦāĻ¸āĻžāĻ‡āĻŸā§‡ āĻāĻ‡ āĻ¸āĻŽāĻžāĻ§āĻžāĻ¨āĻ—ā§āĻ˛āĻŋ āĻ†āĻĒāĻ˛ā§‹āĻĄ āĻ•āĻ°āĻž āĻāĻŦāĻ‚ āĻĒā§‚āĻ°ā§āĻŦāĻžāĻ­āĻžāĻ¸ā§‡āĻ° āĻŽā§‚āĻ˛ā§āĻ¯āĻžāĻ¯āĻŧāĻ¨ āĻ•āĻ°āĻžāĨ¤ āĻāĻ‡ āĻ§āĻ°āĻ¨ā§‡āĻ° āĻāĻ•āĻŸāĻŋ āĻ†āĻĻāĻŋāĻŽ āĻ¸āĻŽāĻžāĻ§āĻžāĻ¨ āĻœāĻ¨āĻ¸āĻžāĻ§āĻžāĻ°āĻŖā§‡āĻ° āĻ•āĻžāĻ›ā§‡ āĻļā§āĻ§ā§āĻŽāĻžāĻ¤ā§āĻ° 74% āĻ¸āĻ āĻŋāĻ• āĻ‰āĻ¤ā§āĻ¤āĻ° āĻĻā§‡āĻ¯āĻŧ āĻ¨āĻž, āĻ•āĻŋāĻ¨ā§āĻ¤ā§ āĻĄā§‡āĻŸāĻž āĻ¸āĻžāĻ¯āĻŧā§‡āĻ¨ā§āĻ¸ā§‡ āĻ•āĻŋāĻ›ā§ āĻ…āĻ¨ā§āĻĒā§āĻ°ā§‡āĻ°āĻŖāĻžāĻ“ āĻĻā§‡āĻ¯āĻŧāĨ¤ āĻ¸āĻŦāĻšā§‡āĻ¯āĻŧā§‡ āĻ•ā§ŒāĻ¤ā§‚āĻšāĻ˛ā§€ āĻ¯ā§‡ āĻ•ā§‹āĻ¨ āĻ¸āĻŽāĻ¯āĻŧ āĻ†āĻŽāĻžāĻ•ā§‡ āĻŦā§āĻ¯āĻ•ā§āĻ¤āĻŋāĻ—āĻ¤ āĻŦāĻžāĻ°ā§āĻ¤āĻžāĻ¯āĻŧ āĻ˛āĻŋāĻ–āĻ¤ā§‡ āĻāĻŦāĻ‚ āĻāĻ•āĻŸāĻŋ āĻĒā§āĻ°āĻļā§āĻ¨ āĻœāĻŋāĻœā§āĻžāĻžāĻ¸āĻž āĻ•āĻ°āĻ¤ā§‡ āĻĒāĻžāĻ°ā§‡āĨ¤ āĻ¸āĻŦāĻžāĻ‡āĻ•ā§‡ āĻ§āĻ¨ā§āĻ¯āĻŦāĻžāĻĻ!

āĻ‰āĻ¤ā§āĻ¸: www.habr.com

āĻāĻ•āĻŸāĻŋ āĻŽāĻ¨ā§āĻ¤āĻŦā§āĻ¯ āĻœā§āĻĄāĻŧā§āĻ¨