
Teknologi Big Data kini digunakan di mana-mana—dalam industri, perubatan, perniagaan dan hiburan. Tanpa analisis data besar, peruncit besar tidak akan dapat beroperasi dengan betul, jualan Amazon akan menurun, dan ahli meteorologi tidak akan dapat meramalkan hari cuaca, minggu dan bulan lebih awal. Adalah logik bahawa pakar data besar mendapat permintaan tinggi, dengan permintaan yang semakin meningkat.
GeekBrains melatih profesional dalam bidang ini, menyediakan pelajar dengan kedua-dua pengetahuan teori dan pengalaman praktikal, menggunakan pakar yang berpengalaman. tahun ini Penganalisis Data Besar dari universiti dalam talian GeekUniversity dan X5 Retail Group, peruncit terbesar di Rusia, telah bekerjasama. Pakar syarikat, dengan pengetahuan dan pengalaman luas mereka, membantu mencipta kursus berjenama yang menyediakan pelajar dengan latihan teori dan pengalaman praktikal.
Kami bercakap dengan Valery Babushkin, Pengarah Pemodelan dan Analisis Data di Kumpulan Runcit X5. Dia adalah salah seorang saintis data di seluruh dunia (kedudukan ke-30 di dunia dalam pembelajaran mesin). Bersama-sama dengan pengajar lain, Valery mengajar pelajar GeekBrains tentang ujian A/B, statistik matematik yang mendasari kaedah ini, serta amalan pengiraan moden dan spesifikasi pelaksanaan ujian A/B dalam runcit luar talian.
Mengapa kita memerlukan ujian A/B sama sekali?
Ini ialah salah satu kaedah terbaik untuk mencari cara optimum untuk meningkatkan kadar penukaran, penunjuk ekonomi dan faktor tingkah laku. Kaedah lain wujud, tetapi ia lebih mahal dan kompleks. Kelebihan utama ujian A/B ialah kosnya yang agak rendah dan kebolehcapaian untuk perniagaan dalam sebarang saiz.
Ujian A/B ialah salah satu kaedah yang paling penting untuk mencari dan membuat keputusan perniagaan—keputusan yang memberi kesan kepada kedua-dua keuntungan dan pembangunan pelbagai produk syarikat. Pengujian membolehkan keputusan dibuat bukan sahaja berdasarkan teori dan hipotesis, tetapi juga pada pengetahuan praktikal tentang cara perubahan khusus mengubah interaksi pelanggan dengan rangkaian.
Adalah penting untuk diingat bahawa dalam runcit, segala-galanya perlu diuji—kempen pemasaran, pemesejan SMS, ujian pemesejan itu sendiri, peletakan produk di rak dan rak itu sendiri di kawasan jualan. Apabila bercakap tentang kedai dalam talian, anda boleh menguji reka letak elemen, reka bentuk, teks dan salinan.
Ujian A/B ialah alat yang membantu syarikat, seperti peruncit, kekal berdaya saing, mengenali perubahan dengan segera dan menyesuaikan diri dengan sewajarnya. Ini membolehkan perniagaan menjadi seefisien mungkin, memaksimumkan keuntungan.
Apakah nuansa kaedah ini?
Kuncinya adalah untuk mempunyai matlamat atau masalah yang akan menjadi asas untuk ujian. Sebagai contoh, masalahnya mungkin trafik pelanggan yang rendah di kedai batu bata atau kedai dalam talian. Matlamatnya adalah untuk meningkatkan trafik pelanggan. Hipotesisnya ialah jika kad produk di kedai dalam talian dibuat lebih besar dan foto lebih terang, lebih banyak pembelian akan dibuat. Seterusnya, ujian A/B dijalankan, keputusannya digunakan untuk menilai perubahan. Setelah keputusan semua ujian masuk, pelan tindakan untuk pengubahsuaian laman web boleh dibangunkan.
Anda tidak disyorkan untuk menjalankan ujian dengan proses bertindih, kerana ini akan menjadikan keputusan lebih sukar untuk dinilai. Adalah disyorkan untuk menjalankan ujian ke atas matlamat keutamaan tertinggi dan menyatakan hipotesis terlebih dahulu.
Ujian mesti berjalan cukup lama untuk keputusan dianggap boleh dipercayai. Berapa lama sebenarnya bergantung, tentu saja, pada ujian itu sendiri. Contohnya, pada Malam Tahun Baru, trafik ke kebanyakan kedai dalam talian meningkat. Jika reka bentuk kedai dalam talian diubah terlebih dahulu, ujian jangka pendek akan menunjukkan bahawa semuanya baik-baik saja, perubahan itu berjaya dan trafik semakin meningkat. Tetapi tidak kira apa yang anda lakukan sebelum cuti, trafik akan meningkat. Ujian itu tidak boleh diselesaikan sebelum atau sejurus selepas Tahun Baru; ia mestilah cukup panjang untuk mengenal pasti semua korelasi.
Kepentingan hubungan yang jelas antara matlamat dan metrik yang diukur. Sebagai contoh, selepas mereka bentuk semula tapak web kedai dalam talian, syarikat mungkin melihat peningkatan dalam pelawat atau pelanggan dan berpuas hati dengan hasilnya. Walau bagaimanapun, pada hakikatnya, nilai pesanan purata mungkin lebih rendah daripada biasa, menyebabkan hasil keseluruhan yang lebih rendah. Ini, tentu saja, tidak boleh dianggap sebagai hasil yang positif. Masalahnya ialah syarikat tidak mengukur secara serentak hubungan antara peningkatan pelawat, peningkatan pembelian dan purata nilai pesanan.
Adakah ujian hanya untuk kedai dalam talian?
Tidak sama sekali. Kaedah popular dalam runcit luar talian ialah melaksanakan saluran paip penuh untuk menguji hipotesis di luar talian. Ini ialah proses yang mengurangkan risiko tersalah memilih kumpulan untuk percubaan, mencari keseimbangan optimum antara bilangan kedai, masa perintis dan saiz kesan yang dinilai. Ia juga melibatkan penggunaan semula dan terus menambah baik metodologi pasca analisis untuk kesan. Kaedah ini diperlukan untuk mengurangkan kemungkinan positif palsu dan kesan terlepas, serta meningkatkan kepekaan, kerana walaupun kesan yang kecil boleh menjadi sangat ketara pada skala perniagaan yang besar. Oleh itu, adalah penting untuk dapat mengenal pasti walaupun perubahan yang sedikit dan meminimumkan risiko, termasuk membuat kesimpulan yang salah tentang keputusan eksperimen.
Runcit, Data Besar dan Kajian Kes Dunia Sebenar
Tahun lepas, pakar Kumpulan Peruncitan X5 menilai trend jualan untuk produk paling popular di kalangan peminat Piala Dunia 2018. Walaupun tiada kejutan, statistik itu tetap menarik.
Air, sebagai contoh, muncul sebagai "terlaris nombor satu." Di bandar yang menganjurkan Piala Dunia, jualan air meningkat kira-kira 46%, dengan Sochi mendahului, meningkatkan jualan sebanyak 87%. Pada hari perlawanan, jualan tertinggi dicatatkan di Saransk, di mana jualan meningkat sebanyak 160% berbanding hari biasa.
Selain air, peminat juga membeli bir. Dari 14 Jun hingga 15 Julai, jualan bir di bandar yang menganjurkan perlawanan meningkat secara purata 31,8%. Sochi juga mendahului, dengan jualan bir di sana meningkat 64%. Walau bagaimanapun, di St. Petersburg, peningkatan adalah sederhana—hanya 5,6%. Pada hari perlawanan, jualan bir di Saransk juga meningkat sebanyak 128%.
Penyelidikan juga dijalankan ke atas produk lain. Data yang diperoleh semasa hari penggunaan puncak membolehkan ramalan permintaan yang lebih tepat pada masa hadapan, dengan mengambil kira faktor peristiwa. Ramalan yang tepat memungkinkan untuk menjangka jangkaan pengguna.
Semasa ujian, Kumpulan Runcit X5 menggunakan dua kaedah:
Model siri masa struktur Bayesian dengan anggaran perbezaan kumulatif;
Analisis regresi dengan penilaian berat sebelah taburan ralat sebelum dan semasa kejohanan.
Apa lagi yang digunakan oleh runcit daripada Big Data?
- Terdapat banyak kaedah dan teknologi, tetapi di atas kepala saya, berikut adalah beberapa:
- Ramalan permintaan;
- Pengoptimuman matriks julat produk;
- Penglihatan komputer untuk mengenal pasti rak kosong dan mengesan membentuk baris gilir;
- Ramalan promosi.
Kekurangan pakar
Permintaan untuk pakar Data Besar sentiasa meningkat. Pada 2018, bilangan pembukaan kerja berkaitan data besar meningkat tujuh kali ganda berbanding 2015. Pada separuh pertama 2019, permintaan untuk pakar melebihi 65% daripada permintaan untuk keseluruhan 2018.
Syarikat besar amat memerlukan penganalisis Data Besar. Sebagai contoh, di Mail.ru Group, mereka diperlukan untuk mana-mana projek yang memproses data teks, kandungan multimedia, dan sintesis dan analisis pertuturan (terutamanya perkhidmatan awan, rangkaian sosial, permainan, dll.). Bilangan kekosongan syarikat telah meningkat tiga kali ganda sejak dua tahun lalu. Dalam lapan bulan pertama tahun ini, Mail.ru mengupah seberapa ramai pakar Data Besar seperti pada keseluruhan tahun sebelumnya. Di Ozon, jabatan Sains Data telah meningkat tiga kali ganda dalam tempoh dua tahun yang lalu. Megafon mengalami situasi yang sama: pasukan yang bertanggungjawab untuk analisis data telah berkembang beberapa kali ganda sejak dua setengah tahun yang lalu.
Tidak syak lagi bahawa permintaan untuk profesional Data Besar akan meningkat lebih banyak lagi pada masa hadapan. Jadi, jika anda berminat dalam bidang ini, tidak ada salahnya untuk mencubanya.
Sumber: www.habr.com
