Pendahuluan Panarjamah
Materi anu dipikaresep ku kuring, utamina kusabab tabel di handap ieu:

Nyandak kana akun kanyataan yén statistikawan (jeung leuwih Rusia, dina tingkat genetik), mun nempatkeun eta mildly, teu resep nanaon nu béda ti hubungan linier, ieu guys junun nyorong ngaliwatan pamakéan fungsi aktivasina dina formulir parabolic. nangtukeun darajat résiko ngagunakeun BigData dina statistik resmi. Saé. Alami, ahli statistik nambihkeun catetan sorangan kana karya ieu - "1 Kasalahan atanapi kalemahan mangrupikeun tanggung jawab pangarang. Pamadegan anu ditepikeun dina dokumén ieu mangrupikeun pribadi sareng henteu merta ngagambarkeun posisi resmi Komisi Éropa. Tapi karya ieu diterbitkeun. Jigana ieu cukup keur kiwari, sarta aranjeunna (pangarang) teu nyaram saha pikeun manggihan skala sorangan dina aspék ieu.
Dina cara anu cukup terstruktur, tiasa dipisahkeun dimana sareng kumaha metode statistik béda sareng metode panalungtikan pikeun Big Data. Dina pamanggih kuring, kauntungan anu paling hébat tina padamelan ieu nyaéta nalika ngobrol sareng palanggan sareng ngabantah pernyataan na sapertos:
- Sareng urang ngumpulkeun statistik sorangan, naon deui anu anjeun hoyong panalungtikan di dieu?
"Sareng anjeun nampilkeun kami hasil anjeun supados urang tiasa ngahijikeunana sareng statistik urang." Dina sual ieu, pangarang nyebutkeun yén éta bakal nice maca karya ieu (3 )
Dina karya ieu, pangarang nempatkeun handap visi maranéhanana ngeunaan tingkat resiko. Parameter ieu aya dina kurung, teu matak bingung sareng tautan ka sumber.
Panineungan kadua. Panulis nganggo istilah BDS - ieu mangrupikeun analog tina konsép BigData. (Tétéla unggeuk kana statistik resmi).
Mukadimah ku pangarang
Jumlah kantor statistik beuki ngajalajah ngagunakeun sumber data gedé pikeun ngahasilkeun statistik resmi. Ayeuna aya ngan sababaraha conto dimana sumber ieu geus terpadu pinuh kana produksi statistik sabenerna. Akibatna, extent pinuh konsékuansi disababkeun ku integrasi maranéhna teu acan dipikawanoh. Samentawis waktos, usaha munggaran parantos dilakukeun pikeun nganalisis kaayaan sareng dampak data ageung dina sagala rupa aspék produksi statistik, sapertos kualitas atanapi metodologi. Pasukan tugas nembe ngembangkeun kerangka kualitatif pikeun ngahasilkeun statistik basis data gedé dina kontéks Proyék Data Besar Komisi Ékonomi PBB pikeun Éropa (UNECE). Numutkeun kana Kodeu Praktek Statistik Éropa, panyadiaan inpormasi statistik kualitas luhur mangrupikeun tugas utama kantor statistik. Kusabab résiko dihartikeun salaku pangaruh kateupastian dina tujuan (contona ISO 31000), kami mendakan mangpaat pikeun ngagolongkeun résiko dumasar kana dimensi kualitas anu mangaruhanana.
Kerangka anu diusulkeun pikeun kualitas data statistik tina sumber data ageung nyayogikeun pandangan terstruktur ngeunaan kualitas anu aya hubunganana sareng sadaya tahapan prosés bisnis statistik sahingga tiasa janten dasar pikeun penilaian komprehensif sareng manajemén résiko anu aya hubunganana sareng sumber data anyar ieu. . Ieu ngenalkeun diménsi kualitatif anyar nu husus atawa (tina pentingna tinggi lamun) pamakéan data badag pikeun statistik resmi, kayaning lingkungan institusional/bisnis atawa pajeulitna. Ngagunakeun ukuran kualitatif anyar ieu, resiko pakait sareng pamakéan sumber data badag dina statistik resmi bisa dicirikeun leuwih sistematis.
Dina makalah ieu, kami tujuan pikeun ngaidentipikasi résiko anu ditimbulkeun ku pamakean data ageung dina konteks statistik resmi. Kami nyandak pendekatan sistematis pikeun ngaidentipikasi résiko dina konteks kerangka kualitas anu diusulkeun. Ku fokus kana dimensi kualitas anu nembe diusulkeun, urang tiasa ngajelaskeun résiko anu ayeuna henteu aya atanapi henteu aya dampak kana produksi statistik resmi. Dina waktos anu sami, urang tiasa ngaidentipikasi résiko ayeuna, anu bakal ditaksir sacara lengkep béda nalika ngagunakeun data ageung pikeun nyandak statistik. Urang teras ngalih deui kana siklus manajemén résiko sareng masihan penilaian ngeunaan kamungkinan sareng dampak résiko éta. Kusabab penilaian resiko ngalibatkeun subyektivitas dina ngaitkeun likelihood jeung dampak kana sagala rupa resiko, urang ngukur kasapukan diantara puluhan stakeholder béda, disadiakeun sacara mandiri. Kami teras ngajukeun pilihan pikeun ngirangan résiko ieu dumasar kana opat kategori utama: ngahindarkeun, ngirangan, ngabagi sareng nahan. Numutkeun kana ISO, salah sahiji prinsip manajemén résiko kedah nyiptakeun nilai, nyaéta sumber daya pikeun ngirangan résiko kedah langkung handap tibatan teu ngalakukeun nanaon. Luyu jeung prinsip ieu, urang tungtungna bakal assess dampak mungkin tina sababaraha ukuran mitigasi resiko dina kualitas hasil ahir, guna anjog ka assessment leuwih komprehensif ngeunaan pamakéan Big Data pikeun statistik resmi.
1. Pambuka
1.1. Latar
Ngembangkeun "data gedé" dicirikeun ku Kenneth Neil Cukier sareng Victor Mayer-Schoenberger dina tulisanna "The Rise of Big Data" (2. ) ku istilah "transfer data". Datafication digambarkeun salaku prosés "nyokot sagala aspek kahirupan tur ngarobahna kana data". Salaku conto. Facebook nyayogikeun jaringan pribadi, sénsor pikeun sagala jinis kaayaan lingkungan, smartphone pikeun komunikasi sareng gerakan pribadi, data anu tiasa dianggo pikeun lingkungan pribadi. Ieu nyababkeun pangumpulan sareng kasadiaan data ampir dimana-mana.
Sapertos dina seueur séktor sanés, statistik resmi nembé mimiti ngabahas masalah data gedé dina tingkat strategis. Henteu acan aya pamahaman umum sareng nyebar ngeunaan jalan ka hareup, naha éta tangtangan atanapi kasempetan, leutik atanapi ageung, jsb. tina Big Data dina Statistik Resmi: ), a A analisis SWOT munggaran dituturkeun ku resiko kasar / analisis kauntungan dilaksanakeun. Perhatikeun yén "analisa résiko komprehensif ogé bakal kalebet aspék sapertos probabilitas sareng dampak, sareng ogé tiasa diperpanjang pikeun ngaidentipikasi mitigasi résiko sareng strategi manajemén."
Sanajan dokumen ieu masih jauh ti analisis resiko lengkep, éta boga tujuan pikeun ngaronjatkeun kaayaan ku nyieun Tinjauan terstruktur munggaran. Kami hoyong negeskeun yén ulasan ieu kedah dianggap salaku titik awal pikeun merangsang diskusi umum dina Komunitas Statistik Resmi (OSC).
1.2. sphere
Artikel ieu museurkeun éksklusif kana resiko, kaasup teu ngan kaunggulan, tapi ogé kaunggulan, kalemahan, kasempetan jeung ancaman. Ieu ngandung harti yén "résiko omission" (misalna résiko yén OSC bakal ditinggalkeun kaluar kompetisi lamun teu dimodernisasi) teu aya dina wengkuan; Éta langkung ngancam. Gantina, urang neangan nyorot resiko nu bisa timbul (a) lamun OSC exploits kasempetan dibere ku data badag tur mimitian ngamekarkeun atawa ningkatkeun hiji husus "data basis data resmi produk statistik" (BOSP); (b) resiko keur anyar "usaha sakumaha biasa", nyaeta, resiko keur statistik resmi dumasar kana produksi "data badag". (Kusabab sadaya produksi statistik resmi ngalibatkeun résiko, urang ngabatesan diri pikeun (b) résiko khusus pikeun "data ageung", nyaéta résiko anu teu aya atanapi tiasa diabaikan pikeun prosés "tradisional" ngumpulkeun statistik resmi.)
1.3. Struktur
Dina Bagéan 2, kami nampilkeun prinsip dasar anu aya hubunganana sareng tugas ieu, dimimitian ku kerangka anu jelas dipikabutuh pikeun manajemén résiko sareng manajemén résiko (Bagian 2.1). Urang ogé nampilkeun kerangka kualitas awal pikeun statistik diturunkeun tina data badag (Bagian 2.2), saprak linking kerangka kualitas kana resiko boga dua tujuan:
- Éta netepkeun kontéks pikeun ngaidentipikasi résiko. Indikator kualitas tangtu, sareng ciri-ciri anu dianggap, nganyatakeun nilai-nilai hiji obyék anu dianggap penting sareng decisive pikeun nyayogikeun jasa ka klien sareng pangguna.
- Hal ieu ngamungkinkeun resiko husus bisa ditugaskeun ka dimensi kualitatif nu nested di hyperspaces umum tur numbu ka tahap husus dina prosés produksi produk statistik.
Dina bagian 3, 4, 5 sareng 6 kami nampilkeun résiko anu diidentifikasi sajauh ieu dina sababaraha kontéks (4 Dokumén kasus bisnis ESS (https://www.europeansocialsurvey.org/about/structure_and_governance.html) Proyék Data ageung ogé sakumaha dina Big Data ESSnets ngandung daptar resiko sawaréh patali jeung proyék jeung sawaréh ngagunakeun sumber data badag pikeun tujuan statistik Dokumén "A Disarankeun Framework pikeun Quality of Big Data" nyebutkeun sababaraha resiko patali dimensi kualitas. Dokumén Kasus Bisnis Proyék Data Besar ESS, ogé Jaringan Data Besar ESS, ngandung daptar résiko anu aya hubunganana sabagéan sareng proyék sareng sabagéan nganggo sumber data ageung pikeun tujuan statistik. "Nyebutkeun sababaraha résiko anu aya hubunganana sareng indikator kualitas). Di dieu kami nganggo klasifikasi aksés data, lingkungan hukum, privasi sareng kaamanan data, sareng kaahlian; reorganisasi nurutkeun struktur kualitatif statistik diturunkeun tina data badag (bagian 2.2) kudu dianggap pas struktur ieu ngahontal status leuwih lengkep. Pikeun unggal resiko nu dicirikeun, urang (i) nyadiakeun hiji assessment of likelihood ogé dampak (sakumaha per Bagéan 2.1.3) jeung (ii) ngajukeun mitigasi resiko jeung strategi manajemén (tingali Bagian 2.1.4).
Tungtungna, urang ngabahas papanggihan urang jeung outline sababaraha léngkah salajengna dina Bagian 7
2. Dasar
2.1. Résiko sareng manajemén résiko
Numutkeun ISO 31000: 20095, résiko dihartikeun salaku "pangaruh kateupastian dina tujuan anu dinyatakeun". Ieu ngandung harti yén tujuan kedah ditetepkeun atanapi dipikanyaho sateuacan résiko tiasa diidentifikasi. Tujuan ieu biasana didefinisikeun kalayan merhatikeun kontéks institusional organisasi anu dimaksud. Pertimbangan penting sanésna nyaéta yén résiko ngagaduhan ciri kateupastian, nyaéta, henteu écés naha kajadian anu dijelaskeun bakal kajantenan. Ku kituna, resiko diukur dina hal likelihood tina hiji kajadian kajadian jeung konsékuansi na, ie., dampak nu kajadian dina pencapaian tujuan set. Penilaian résiko kedah nyayogikeun inpormasi anu langkung obyektif anu pamustunganana bakal ngamungkinkeun kasaimbangan anu pas antara ngawujudkeun kasempetan kauntungan sareng ngaminimalkeun akibat anu ngarugikeun. Manajemén résiko mangrupikeun bagian integral tina prakték manajemén sareng unsur penting tina prakték perusahaan anu saé (6 Statistik Kanada: laporan 2014-2015 ngeunaan Rencana sareng Prioritas, ). Ieu mangrupikeun prosés iteratif anu idéal ngamungkinkeun pikeun perbaikan kontinyu dina pembuatan kaputusan sareng ngamajukeun perbaikan kontinyu dina pagelaran.
Résiko ogé pakait sareng kualitas. Aplikasi sistem kualitas kedah ngamungkinkeun ngagunakeun kasempetan anu disayogikeun ku sababaraha sumber sareng metodologi pikeun ngahontal hasil tina tingkat kualitas anu tangtu dina harti yén hasil ieu nyugemakeun kabutuhan pangguna. Kawas resiko, tingkat kualitas bisa diturunkeun tina lingkungan institusional jeung tujuan lembaga tangtu. Dina kontéks ieu, lingkungan institusional nangtukeun tingkat sakabéh résiko anu organisasi daék ditanggung pikeun ngahontal tujuanana.
Prosés penilaian sareng manajemén résiko tiasa dirobih kana sababaraha tahap, kalebet netepkeun kontéks, ngaidentipikasi résiko, nganalisa résiko tina hal kamungkinan sareng dampak, ngira-ngira résiko sareng tungtungna ngubaran résiko.
2.1.1. Konteks institusional
Léngkah munggaran nyaéta netepkeun kontéks strategis, organisasi sareng manajemén résiko dimana sesa prosésna bakal lumangsung. Ieu kalebet netepkeun kritéria anu mana résiko anu bakal ditaksir sareng netepkeun struktur analisis.
2.1.2. Idéntifikasi résiko
Dina tahap kadua, kajadian-kajadian anu tiasa mangaruhan kana ngahontal tujuan kedah diidentifikasi. Idéntifikasi kedah kalebet patarosan anu aya hubunganana sareng jinis résiko, waktos kajadian, lokasi, atanapi kumaha kajadian éta tiasa nyegah, parah, reureuh, atanapi ningkatkeun pencapaian tujuan.
2.1.3. Pamariosan résiko
Léngkah satuluyna diwangun ku ngaidentipikasi kadali anu aya sareng nganalisa résiko tina segi probabilitas sareng konsékuansi poténsial. Dina konteks artikel ieu, likelihood atawa likelihood tina resiko lumangsung dipaké dina skala ti 1 (teu dipikaresep) nepi ka 5 (sering). Dampak lumangsungna kajadian diukur dina skala ti 1 (henteu signifikan) nepi ka 5 (ekstrim). Ditémbongkeun saperti dina Table 1, produk probabiliti jeung dampak ngahasilkeun "tingkat resiko" mimitian ti 1 nepi ka 25.

Perkiraan tingkat résiko tiasa dibandingkeun sareng kriteria anu tos ditetepkeun pikeun netepkeun kasaimbangan antara kauntungan poténsial sareng hasil anu ngarugikeun. Hal ieu ngamungkinkeun judgments bisa dijieun ngeunaan prioritas manajemén.

Prioritas tindakan kedah ditempatkeun dina resiko kritis (tingali Tabél 2), nyaéta, anu kamungkinan kajadian sareng gaduh akibat anu serius atanapi ekstrim pikeun tujuan organisasi.
2.1.4. Résiko Résiko
Lengkah ahir diwangun ku kaputusan ngeunaan kumaha carana ngabales resiko. Sababaraha résiko anu sahandapeun tingkat résiko anu tos ditangtukeun tiasa dipaliré atanapi ditolerir. Pikeun anu sanés, biaya pikeun ngatur résiko tiasa langkung luhur dugi ka ngaleuwihan kauntungan poténsial. Dina hal ieu, organisasi bisa mutuskeun pikeun abandon kagiatan relevan. Résiko ogé tiasa dialihkeun ka pihak katilu, sapertos asuransi, anu bakal ngabalikeun biaya anu ditanggung. Pilihan terakhir nyaéta mertimbangkeun résiko nalika nangtoskeun strategi sareng tindakan anu nyaimbangkeun biaya sareng kauntungan poténsial. Ku kituna, organisasi bakal mutuskeun pikeun nerapkeun strategi pikeun maksimalkeun pungsi kauntungan sarta ngaleutikan waragad poténsial.

2.2. Sistem kualitas
Pasukan tugas anu diwangun ku wawakil organisasi statistik nasional sareng internasional ngembangkeun kerangka kualitas awal pikeun statistik anu diturunkeun tina data ageung dina 2014. Pasukan tugas digawé di handapeun naungan proyék UNECE / HLG "Peran data badag dina modernizing produksi statistik". Eta ngalegaan sistem kualitas aya dirancang evaluate statistik diturunkeun tina sumber data administrasi kalawan indikator kualitas nu dianggap relevan pikeun sumber data badag.
Sistem ieu ngabédakeun antara tilu fase prosés bisnis: input, produktivitas sareng kaluaran. Fase input pakait jeung fase "desain" jeung "ngumpulkeun" GSBP, kinerja pikeun "prosés" jeung "analisa" fase, sarta kaluaran sarua jeung fase "diseminasi".
Kerangka ngagunakeun struktur hirarki nu dicokot tina struktur data administrasi dikembangkeun ku Statistik Walanda (7 Daas, P., S. Ossen, R. Vis-Visschers, jeung J. Arends-Toth, (2009), Daptar pariksa keur Quality. evaluasi Sumber Data Administratif. Statistik Walanda, Den Haag / Heerlen). Dimensi kualitas disarangkeun dina struktur hirarki anu disebut hyperspaces. Tilu hyperdimensions anu ditetepkeun nyaéta "sumber", "metadata" sareng "data". Dimensi kualitas disarangkeun dina hyperdimensions ieu sareng ditugaskeun ka unggal tahapan produksi. Pikeun fase input, aspék tambahan tina "privasi sareng karusiahan," "kompléksisitas" (nurutkeun struktur data), "kalengkepan" metadata, sareng "kohési" (kamampuhan pikeun ngaitkeun data kana data sanés) diusulkeun ka tambahkeun kana modél kualitas standar. Pikeun unggal indikator kualitas, faktor anu relevan pikeun pedaranana diusulkeun, kitu ogé indikator anu mungkin.
Pikeun kaperluan artikel ieu, resiko bisa dikaluarkeun tina faktor ieu. Salaku conto, faktor anu kedah dipertimbangkeun pikeun ngukur kualitas "lingkungan kelembagaan / bisnis" nyaéta kelestarian panyadia data. A résiko patali bisa jadi yén data moal sadia ti panyadia data dina mangsa nu bakal datang. Conto sanésna aya hubunganana sareng aspék kualitas, privasi sareng kaamanan anu nembe diusulkeun. Hiji faktor penting nyaéta "persépsi," nu nujul kana persepsi négatip mungkin tina pamakéan dimaksudkeun tina sumber data tinangtu ku rupa stakeholder.
3. Résiko pakait sareng aksés data
3.1. Kurangna aksés ka data
3.1.1. Katerangan
Résiko ieu diwangun ku proyék pangembangan BOSP anu henteu ngaksés Sumber Data Besar (BDS) anu diperyogikeun.
Ayeuna, OSC parantos diajar cara anu sesah bahkan kaluar tina blok awal sareng kéngingkeun aksés éta kadang-kadang halangan anu teu tiasa diatasi. Kadang-kadang gampang pikeun ngaksés sumber anu tangtu - sapertos rékaman data telepon (CDRs) pikeun tujuan tés/panalungtikan, tapi langkung hese (kanggo alesan hukum atanapi komérsial) pikeun ngaksés éta pikeun tujuan produksi.
3.1.2. Kamungkinan
Kamungkinan gumantung pisan kana karakteristik BDS. Dina kasus data administrasi badag, maranéhna bisa jadi low salaku 1, utamana lamun (sakumaha dina kasus data loop lalulintas diulik ku Daas dkk. 8 Daas, P., M. Puts, B. Buelens na P. van. den Hurk. 2015. "Data badag salaku Sumber pikeun Statistik Resmi." Journal of Statistik Resmi 31 (2). (Forthcoming; publikasi foreseen pikeun Juni 2015.)) aya euweuh masalah jeung panangtayungan data pribadi. Upami kasus BDS pribadi, khususna upami sénsitip (misalna tina sudut pandang panyalindungan data) atanapi berharga (tina sudut pandang komérsial), kamungkinanna tiasa pisan luhur (5).
3.1.3. Pangaruh
Dampak gumantung kana BOSP sareng kumaha BDS dianggo. Lamun BDS di puseur pisan, dampak bisa jadi kacida luhurna (4 = teu mungkin pikeun ngahasilkeun BOSP pisan), sedengkeun bisa jadi leuwih handap lamun masih mungkin pikeun ngahasilkeun BOSP (sanajan kualitas handap) ku ngandelkeun BDS séjén, ngarah kana dampak dina rentang 2-3.
3.1.4. Nyegah
Pikeun ngirangan résiko kakurangan aksés, kontak awal sareng panyadia data kedah didamel sareng perjanjian jangka panjang pikeun aksés kana data kedah diasupkeun. Salaku tambahan, analisa hukum komprehensif ngeunaan kombinasi khusus BDS sareng BOSP kedah dilakukeun. Kasempetan pikeun aksés ka data ngaliwatan panerapan ayeuna atawa nu bakal datang ogé kudu ditaksir.
3.1.5. Mitigasi
Upami aya alternatif BDS anu tiasa dianggo pikeun BOSP, éta tiasa digali. Upami teu aya cara pikeun ngahasilkeun BOSP tanpa BDS, sareng upami henteuna aksés henteu tiasa diatasi, usaha kedah ditinggalkeun sareng BOSP énggal moal terang.
3.2. Leungitna aksés ka data
3.2.1. Katerangan
résiko Ieu yén kantor statistik leungiteun BDS nu underpins BOSP.
3.2.2. Kamungkinan
Mun BOSP geus dihasilkeun, biasana aya sababaraha stabilitas jeung dina sababaraha kasus resiko bisa jadi pisan low (1). Sanajan kitu, hususna dina kasus entitas swasta jeung nu pasatujuan insufficiently teguh geus menyimpulkan, euweuh nangtung di jalan, misalna. hidayah anyar ti ngarobah kawijakan ngalaporkeun data hasilna résiko sedeng beubeulahan (3). Leuwih ti éta, lamun BDS pakait sareng aktivitas teu stabil, sok aya resiko nu panyadia saukur bakal bangkrut, sarta résiko bisa jadi malah leuwih luhur (4).
3.2.3. Pangaruh
Kusabab BOSP anu tos aya panginten henteu tiasa ngahasilkeun, dampak anu luhur pisan sering lumangsung (5). Dina kasus séjén dimana BDS mangrupa ancillary di alam, dampak bisa jadi leuwih ti leungitna kualitas kalawan dampak dina rentang 2-3.
3.2.4. Nyegah
Strategi pencegahan téh sarupa jeung strategi no-data, tapi kalawan ngaronjat tekenan kana vigilance konstan ogé dina setélan produksi.
Henteu nempatkeun sadayana endog anjeun dina hiji karanjang (nyaéta gaduh sababaraha BDS dina dasar unggal BSOP) ogé tiasa janten strategi, tapi ieu tiasa janten teu praktis atanapi mahal teuing.
3.2.5. Mitigasi
Lamun BDS mangrupa hasil tina aktivitas unsustainable, meureun hiji BDS anyar reflecting fenomena sosial sarua laun bakal sadia. Sanajan kitu, éta bakal telat pikeun ngamimitian "scanning pasar" sakali BSOP turun; eta bakal merlukeun vigilance konstan-na ieu bisa jadi hésé pikeun ngahontal.
4. Résiko pakait sareng lingkungan hukum
4.1. Gagalna sasuai jeung panerapan relevan
4.1.1. Katerangan
Résiko ieu diwangun ku proyék ngembangkeun BOSP anu henteu tumut kana panerapan anu relevan, ngajantenkeun BOSP henteu patuh kana panerapan anu disebatkeun. Ieu tiasa aya hubunganana sareng undang-undang perlindungan data, peraturan ngeunaan beban réspon, jsb.
4.1.2. Kamungkinan
Kusabab kurangna kasadaran OSC ngeunaan data gedé, kamungkinan henteu kahaja (3) henteu patuh. Probabilitas umumna pakait sareng BDS sabab kirang "sénsitip" sumber, anu kurang kamungkinan non-conformity bakal lumangsung.
4.1.3. Pangaruh
Dampakna biasana kritis (4) dina hartos yén produksi anu henteu saluyu ngabutuhkeun BOSP dieureunkeun (atanapi, upami éta henteu acan ngahontal tahap palaksanaan, pangwangunanana kedah dieureunkeun). Ieu malah tiasa ekstrim (5), sabab résiko reputasi anu timbul tina statistik resmi anu teu pantes ("ilegal") tiasa gaduh akibat.
4.1.4. Nyegah
BOSP naon waé ngabutuhkeun analisa hukum anu lengkep - sareng ieu kajantenan dina sababaraha tahapan (naon anu ditampi dina tahap pamekaran/eksplorasi tiasa henteu dina tahap palaksanaan/produksi). Ieu dina gilirannana tiasa ngakibatkeun BOSP direkayasa sabalikna pikeun cocog.
4.1.5. Mitigasi
Gumantung kana severity tina bédana, lengkah kahiji bisa jadi nyandak BOSP offline.
Rekayasa ulang BOSP sangkan patuh bisa jadi hiji pilihan, tapi naha BOSP "disimpen" ku cara ieu gumantung pisan kana sifat non-conformity.
4.2. Parobahan ngarugikeun dina lingkungan hukum
4.2.1. Katerangan
Perda anyar tiasa diwanohkeun ngeunaan BOSP anu dikembangkeun, sacara efektif ngajantenkeun BOSP henteu cocog.
4.2.2. Kamungkinan
Ieu mungkin yen proponents panyalindungan data ditingkatkeun bakal tiasa ngenalkeun sarat anyar nu langsung atawa henteu langsung mangaruhan kamampuh nyieun BOSPs husus. Kamungkinan dina rentang 2-3 sigana perkiraan realistis.
4.2.3. Pangaruh
Dampakna biasana kritis (4), dina harti yén produksi anu henteu saluyu ngabutuhkeun BOSP dipareuman.
4.2.4. Nyegah
Sababaraha inpormasi bisnis kedah dilaksanakeun sacara rutin pikeun ngawas kamajuan législatif - sigana ogé pikeun mangaruhan aranjeunna ku ngadamel kasus statistik resmi dina forum anu cocog (contona piwuruk).
4.2.5. Mitigasi
Upami ngawaskeun proaktif parantos dilaksanakeun, panginten aya waktos pikeun ngarékayasa deui BOSP pikeun saluyu sareng panerapan énggal ti dinten mimiti dikuatkeun.
Upami, di sisi anu sanés, teu aya panjagaan supados undang-undang énggal "kagetna" - atanapi upami undang-undang éta radikal sahingga teu aya jalan pikeun ngajantenkeun BOSP teu cocog - hiji-hijina pilihan nyaéta nganonaktipkeun BOSP.
5. Resiko patali privasi sarta kaamanan data
5.1. Ngalanggar kaamanan data
5.1.1. Katerangan
Résiko ieu aya hubunganana sareng aksés anu henteu sah kana data anu dicekel ku kantor statistik. Pihak katilu tiasa nampi data anu aya dina embargo, contona kusabab sékrési jadwal(9) Pikeun BOSP anu sapinuhna dumasar kana BDS tunggal, teu tiasa dihindari yén datana bakal terang sacara implisit ku anu gaduh data asli. Sareng upami metodologina transparan, statistik turunan ogé bakal dipikanyaho. Kaayaan ieu henteu kajawab di dieu, tapi résiko anu aya hubunganana sareng malpractice ku juragan.) (10 Salaku tambahan, data ieu tiasa nyababkeun résiko pelanggaran karusiahan. résiko ieu bakal kajawab misah.). Ieu bisa jadi, contona, data nu investor nyangka di pasar saham.
5.1.2. Kamungkinan
Lamun datang ka aspék téknis ngajaga lingkungan IT dina departemén statistik, resiko sagampil dipikaresep pikeun BDSs sakumaha keur sumber tradisional. Nanging, aya dua aspék tambahan anu kedah dipertimbangkeun.
Kahiji, kalawan sababaraha BDS, résiko sakabéh rada ngaronjat alatan kanyataan yén kaamanan data nu boga aslina bisa compromised. Ieu tiasa aya hubunganana, contona, spionase industri atanapi hacking.
Bréh, sakali data berpotensi berharga mimiti disimpen di kantor, résiko attracting niat jahat naek. Upami data anu disimpen gaduh nilai bisnis anu luhur pisan, anjeun kedah siap pikeun kamungkinan serangan anu luhur pisan nargétkeun infrastruktur IT, ku kituna kamungkinan ngalanggar tiasa berpotensi langkung luhur (4).
Upami data anu disimpen henteu dianggap gaduh nilai, kamungkinan umumna sigana henteu luhur pisan - ti (1) dugi ka (3) gumantung kana sumber data.
5.1.3. Pangaruh
Potensi ruksakna reputasi bisa jadi hébat (5). Anu penting dina kasus BDS nyaéta upami pelanggaran kaamanan kajantenan di pamilik asli, dampak dina reputasi kantor statistik diperkirakeun langkung handap tibatan upami pelanggaran lumangsung dina data anu dijagaan.
Di sisi séjén, kasebut nyaéta dimungkinkeun yén palanggaran di kantor statistik bisa boga konsekuensi négatip pikeun nu boga aslina. Dina hal ieu, dampak négatip kuat deui mungkin alatan karuksakan dina hal kapercayaan antara supplier jeung kantor statistik (5).
5.1.4. Nyegah
Anu khusus pikeun kasus BDS nyaéta yén prosedur kaamanan pamilik asli tiasa cocog. Teu mungkin yén kantor statistik bakal dibéré kakuatan audit pikeun ngawas ieu. Pamilik anu datana dipaké pikeun ngahasilkeun rékaman jeung jadwal publikasi rahasia kudu informed ngeunaan dampak dina statistik resmi ngeunaan hiji breach kaamanan poténsial dina enggon maranéhanana sarta kudu nampa jaminan formal yén prosedur kaamanan luyu geus di tempat.
Hiji cara lugas pikeun nyegah breach kaamanan di enggon hiji boga dampak serius dina kantor statistik nyaéta pikeun mastikeun yén sababaraha sumber dipaké pikeun produk anu sarua, ku kituna hiji sumber compromised teu cukup pikeun ngahasilkeun inohong final. Kauntungannana pendekatan ieu kontrol gede aya dina leungeun kantor statistik.
Cara pikeun nyegah pamilik asli data tina ngalanggar kaamanan di kantor statistik dipangaruhan négatip nyaéta milarian cara operasi anu henteu ngalibetkeun mindahkeun data anu berpotensi sénsitip tina sudut pandang anu gaduh ka kantor statistik. Dina bentuk atah. Hiji pendekatan preventative mungkin nyaéta pamakéan data aggregated. Ieu kudu inget, kumaha oge, yén sababaraha bentuk aggregation, kayaning nu dirancang pikeun nyegah idéntifikasi anggota individu hiji populasi, bisa jadi teu luyu dina hal ieu. Hiji alesan pikeun ieu bisa jadi kanyataan yén resiko keur nu boga pakait sareng nilai komérsial data, nu bisa jadi signifikan malah sanggeus anonymity geus kahontal.
5.1.5. Mitigasi
Upami aya palanggaran data anu diurus ku kantor statistik, ukuran mitigasi bakal sami sareng sumber tradisional, kecuali aya dampak negatif ka anu gaduh aslina.
Dina acara konsékuansi négatip pikeun nu boga aslina, kantor statistik kudu marios jeung nguatkeun prosedur kaamanan sarta jelas komunikasi jeung demonstrate komitmen na.
Lamun palanggaran lumangsung dina enggon nu boga aslina urang, kantor statistik relevan kudu jelas komunikasi kaayaan jeung keukeuh ngaronjatkeun prosedur kaamanan nu boga. Upami diperlukeun, Anjeun bisa néangan hiji supplier alternatif.
5.2. Pelanggaran privasi data
5.2.1. Katerangan
Ieu mangrupikeun résiko yén privasi hiji atanapi langkung individu dina populasi statistik bakal dikompromi. Ieu bisa jadi alatan serangan dina infrastruktur IT alatan tekanan ti instansi pamaréntah séjén atawa alatan kontrol inadequate kana sékrési data statistik.
5.2.2. Kamungkinan
Salaku kalawan résiko breaches data, kaayaan teknis pikeun nyimpen microdata teu robah teuing kalawan tambahan BDS. Sanajan kitu, aya caveats dieu teuing.
Microdata tina sumber data tangtu tiasa gaduh nilai bisnis anu luhur, ku kituna nyimpen éta bakal ningkatkeun kamungkinan serangan.
Salaku tambahan, sababaraha microdata tiasa berpotensi mangpaat pisan pikeun lembaga pamaréntahan sanés, sapertos penegak hukum, perpajakan, atanapi perawatan kaséhatan. Dina kaayaan nu tangtu, adherence kana prinsip karusiahan statistik bisa datang dina tekanan hébat.
Sedengkeun pikeun kagagalan dina kontrol panyingkepan informasi statistik, ayeuna geus aya prakték ngadegkeun. A BDS bisa ngidinan statistik dihasilkeun pikeun subgroups leutik populasi atawa nyadiakeun kamampuhan pikeun numbu data aggregated ti BDSs béda, nu bisa ngaronjatkeun likelihood tina resiko lumangsung. Sajaba ti éta, sumber anyar bakal kitu, merlukeun kamajuan metodologis anyar, jadi bahaya nyata yén metodologi kontrol panyingkepan teu diropéa leres.
Sacara umum, kalawan ukuran preventif lumrah probabiliti bisa diteundeun dina tingkat lumrah, Tapi saprak aya loba faktor béda jeung variatif aub, assessment luyu didieu sigana yén probabiliti tinggi (4).
5.2.3. Pangaruh
Potensi ruksakna reputasi bisa jadi hébat (5). Salaku kalawan resiko hiji breach kaamanan data, breach dina kantor statistik bisa boga konsekuensi négatip pikeun nu boga aslina. Di dieu, dampak acara sapertos berpotensi tiasa langkung ageung, khususna upami tren ayeuna dina pendapat umum diteruskeun. Karusakan hubungan antara panyadia data sareng kantor statistik ogé diperkirakeun ageung pisan.
5.2.4. Nyegah
Hiji cara pasti-seuneu pikeun nyegah resiko ieu kajadian nyaeta mun teu boga microdata ti BDS pisan (sanajan nyekel microdata séjén masih mawa resiko saluyu, sanajan kalawan probabiliti béda jeung dampak). Jalur ieu, sakumaha sareng résiko palanggaran kaamanan data, bakal peryogi pikeun ngembangkeun cara-cara sanés ngagunakeun data pikeun tujuan statistik. Leuwih ti éta, di dieu sipat béda tina sumber bakal hartosna yén metodologi anyar bakal perlu dimekarkeun kalawan tujuan competing extracting saloba mungkin informasi mangpaat tur ngajaga privasi tina bahaya.
Dina kasus panyimpen microdata, kaamanan IT sareng mékanisme kontrol aksés kedah aya dina tingkat anu diperyogikeun sareng terus diawaskeun. Perhatian khusus kedah diperhatoskeun pikeun mastikeun kasalametan cara anyar pikeun meunangkeun data. Ironisna, metoda anyar ieu tiasa ngalibetkeun alat panyimpen sacara fisik (sapertos hard drive). Upami metode ieu dianggo, pangiriman kedah aman sacara fisik sareng énkripsi kedah dianggo.
5.2.5. Mitigasi
Ukuran mitigasi di dieu dasarna sami sareng pikeun ngalanggar kaamanan data. Lamun alesan palanggaran éta tekanan ti instansi pamaréntah sejen, mangka kasempetan kudu dilaksanakeun pikeun nguatkeun kamerdikaan manajemén ambéh palanggaran sarupa jadi leuwih hese di hareup.
5.3. Manipulasi Sumber Data
5.3.1. Katerangan
Panyadia data pihak katilu, sapertos data média sosial atanapi data anu disayogikeun sacara sukarela, aya résiko manipulasi. Ieu tiasa dilakukeun ku panyadia data sorangan atanapi ku pihak katilu. Salaku conto, seueur tulisan média sosial palsu tiasa dibangkitkeun pikeun nyorong indéks statistik anu diturunkeun tina data éta dina hiji cara atanapi anu sanés upami dipikanyaho yén indéksna diitung tina data sapertos kitu.
Pikeun data anu disayogikeun sacara sukarela, tiasa waé para sukarelawan ngawakilan kelompok minat khusus sareng agenda khusus.
5.3.2. Kamungkinan
Pikeun data anu bisa dimanipulasi pikeun mawa kauntungan gede, kamungkinan leuwih luhur. Ieu bisa jadi data nu statistik metot, kayaning pasar saham. Dina lampu tina LIBOR na skandal Forex panganyarna, bisa dianggap yén salami insentif aya, usaha pikeun ngamanipulasi data bakal dipikaresep.
Pikeun statistik dumasar kana data anu disayogikeun sacara sukarela, urang ngan ukur kedah ningali prakték PR panganyarna pikeun nyewa jalma anu pura-pura gaduh pendapat sareng dibayar pikeun nganyatakeun sacara umum (contona, dina forum Internét) pikeun nyimpulkeun yén kamungkinan henteu sakedik . Sacara umum, inohong ti 3 nepi ka 4 sigana nyukupan.
5.3.3. Pangaruh
Masalah badag kalayan manipulasi téh nya éta bisa nuluykeun pikeun lila tanpa deteksi. Lamun manipulasi dituluykeun pikeun lila, dampak dina kualitas tiasa signifikan. Leuwih ti éta, karuksakan kapercayaan masarakat dina statistik resmi ogé bisa jadi gede, utamana lamun peran kantor statistik salaku panyadia data kualitas ieu emphasized publik. Di sisi séjén, lamun manipulasi nu dideteksi mimiti lajeng diterbitkeun, sabenerna bisa ningkatkeun persepsi publik. Kacuali dina kasus anu parah pisan, pangaruh maksimal tiasa dibayangkeun (3).
5.3.4. Nyegah
Ngalaksanakeun latihan ngawaskeun rutin sareng sumber alternatif mangrupikeun pendekatan pencegahan anu mungkin. Sumber alternatif ieu tiasa tradisional atanapi sanés. Ngagunakeun statistik dumasar kana kombinasi sumber bisa nyegah épék manipulasi signifikan. Dina kasus dimana manipulasi anu digagas ku panyadia dipikahariwang, perjanjian hukum ogé tiasa janten jalan pikeun nyegah prakték sapertos kitu.
5.3.5. Mitigasi
Dina hal karuksakan hubungan umum, ukuran mitigasi anu kedah dilakukeun di dieu henteu jauh béda sareng pikeun merangan krisis naon waé.
Tina sudut pandang kualitas data, bakal aya mangpaatna upami data katukang tiasa dilereskeun ku kituna sanajan kalayan reureuh anu ageung, séri anu leres tiasa dilereskeun.
dihasilkeun. Tolok ukur biasa tiasa ngabantosan ieu. Catet yén tujuan benchmarking dina hal ieu rada béda ti tujuan pencegahan. Pikeun nyegah ieu, hal anu penting pikeun gancang perhatikeun tur nalungtik hiji béda curiga antara data patokan jeung BDS. Pikeun tujuan mitigasi, data mangpaat heubeul salawasna mangpaat.
Salaku tambahan, ati-ati kedah dilaksanakeun pikeun nyegah manipulasi anu sami di hareup - dina kasus anu sénsitip, ieu tiasa hartosna kéngingkeun data anu berpotensi kaleuleuwihan ti sababaraha supplier pikeun tujuan benchmarking.
5.4. Persepsi masarakat anu henteu nguntungkeun ngeunaan panggunaan data ageung ku statistik resmi
5.4.1. Katerangan
Média jeung masarakat umum pisan sénsitip kana masalah privasi sarta pamakéan data pribadi tina sumber data badag, utamana dina konteks pamakéan sekundér data ku instansi pamaréntah ngalakukeun lampah administratif atawa hukum ngalawan warga. Pamakéan anu ditanggap négatip tiasa janten posisi kontrol laju dumasar kana analisis data navigasi (11 Tingali ).
Kasus khusus TomTom Walanda nyababkeun panurunan anu signifikan dina paménta pikeun alat TomTom sareng nyababkeun kaputusan perusahaan pikeun ngawatesan aksés kana data. Dina hal husus ieu, data nu patali jeung individu, tapi pikeun speed tingkat ku bagian jalan.
Sanajan kitu, meureun aya aplikasi data badag anu positif ditarima ku masarakat. Salah sahiji conto nyaéta aplikasi anu nyegah kajahatan sapertos maling nganggo téknik data ageung.
Pamadegan umum anu positif ogé négatip tiasa gaduh pangaruh anu kuat dina panggunaan BDS dina kontéks produksi statistik resmi.
Konsékuansi tina persepsi publik négatip bisa jadi yén:
- BDS moal sadia deui ka kantor statistik, boh alatan panyadia data atawa kaputusan pamaréntah pikeun henteu ngagunakeun data, atawa
- pamakéan data bakal diwatesan, nu bisa ngaganggu produksi lamun BOSP tangtu.
5.4.2. Kamungkinan
Faktor anu tiasa mangaruhan kamungkinan kajadian sapertos kitu atanapi pangaruhna kana produksi statistik:
- karusiahan data, nyaéta kumaha gampangna jalma bisa diidentifikasi;
- jumlah informasi anu data nembongkeun ngeunaan individu, contona, ngaronjat ku linking data tina sumber béda;
- tipe data, contona, transaksi finansial dianggap leuwih rahasia ti data séjén;
- jinis tindakan poténsial anu tiasa dilaksanakeun ngalawan warga, sapertos denda jalma pikeun ngebut;
- lingkungan hukum anu teu jelas dimana panyadia data sareng pangguna beroperasi atanapi dimana kaayaan hukum bertentangan sareng pendapat / standar etika umum;
- darajat gumantungna kana sumber data nu tangtu pikeun meunangkeun statistik; dina tahap eksplorasi, faktor ieu bisa jadi minor pentingna. Sanajan kitu, ieu bisa greatly mangaruhan statistik diala dina tahap engké sahingga kudu dianggap salila tahap eksplorasi ogé. Hiji masalah bisa jadi yén extent ahir pamakéan data mimitina kanyahoan sabab sumber data berpotensi bisa ngawula leuwih ti hiji wewengkon statistik.
Estimasi waktu kajadian ngarugikeun teu mungkin sabab mobilisasi publik mindeng dipicu ku sinyalna kajadian anu boga dampak negatif kana warga. Nanging, kalayan ningkatna panggunaan data ageung ku pamaréntah sareng perusahaan swasta, sareng khususna sareng pamasaran data anu aktip pikeun tujuan sanés anu nyababkeun koléksi aslina, kamungkinan kajadian sapertos kitu bakal kajantenan.
Kajadian-kajadian anu gedé pangaruhna kana persépsi masarakat téh henteu remen, tapi sacara acak (3) jeung jauh (2). Kalawan ngaronjatna pamakéan sumber data badag, likelihood ogé bakal nambahan.
5.4.3. Pangaruh
Dampak hiji kajadian gumantung pisan kana faktor-faktor anu dibahas di luhur. Sacara umum, dampakna langkung parah pikeun produksi data statistik anu parantos mapan, sabab operasina kedah dihentikan. Dampak ogé gumantung kana kasadiaan sumber data alternatif, sanajan bisa jadi persepsi publik teu ngabedakeun antara sumber data béda lamun hiji kajadian materializes. Dina kaayaan kiwari pamakéan data badag, nembongan yen sumber ieu teu bisa sagemblengna ngaganti sumber data tradisional, tapi rada pelengkap statistik aya. Ieu bakal ngurangan dampak acara. Ku alatan éta, dampak acara dianggap dina rentang ti 2 (minor) nepi ka 3 (mayor). Dina tahap produksi, pangaruh bisa ngaronjat jadi 4 (nilai kritis).
5.4.4. Nyegah
Ukuran preventif bisa ngawengku nangtukeun prinsip etika pikeun data badag dina statistik resmi. Tungtunan étika kedah dumasar kana prinsip sapertos kodeu prakték pikeun statistik Éropa atanapi prinsip dasar statistik resmi (12). ). Léngkah saterusna nyaéta netepkeun strategi komunikasi anu bakal nyebarkeun hasil pedoman étika ka masarakat sareng tiasa dianggo pikeun nginpokeun pamangku kapentingan ngeunaan panggunaan etika BDS pikeun BOSP.
A assessment résiko misah pikeun BDS husus bisa dipigawé pikeun ngaidentipikasi resiko na nyarankeun lampah preventif atawa mitigating dumasar kana prinsip etika. Penilaian résiko anu misah ogé tiasa kalebet pamangku kapentingan sapertos agénsi panyalindungan data pikeun mastikeun yén sadaya résiko diidentifikasi sareng tindakan dibenerkeun.
5.4.5. Mitigasi
Strategi komunikasi ogé kedah ngawengku ukuran pikeun nungkulan ngaronjatna sikap publik négatip. A assessment resiko misah kedah ngumpulkeun conto positif pamakean data jeung ukuran pikeun nyegah nyalahgunakeun data, nu bisa merta dilaksanakeun dina tingkat kawijakan jeung komunitas statistik bisa jadi teu bisa pangaruh éféktif.
5.5. Leungitna kapercayaan - teu meunang ngaliwatan observasi
5.5.1. Katerangan
Pamaké statistik resmi biasana boga kayakinan luhur dina katepatan jeung reliabilitas statistik. Ieu dumasar kana kanyataan yén produksi data statistik diwangun kana kerangka metodologis dipercaya jeung sadia masarakat awam, kitu ogé dokuméntasi ngeunaan kualitas produk statistik. Leuwih ti éta, paling statistik dumasar kana observasi, i.e. diturunkeun tina survey atanapi sensus anu netepkeun hubungan anu gampang kaharti antara observasi sareng data statistik. Ngagunakeun BDS nu teu dikumpulkeun pikeun tujuan primér statistik ngajalankeun résiko yén hubungan ieu bakal leungit sarta pamaké bakal leungit kapercayaan dina statistik resmi. Conto anu patali jeung babak panganyarna (2010) tina sénsus populasi nyaéta yén di sababaraha nagara statistik dicandak ngagunakeun sababaraha sumber sareng model statistik. Dina sababaraha kasus, pamangku kapentingan ngabantah statistik.
5.5.2. Kamungkinan
Kamungkinan résiko lumangsung gumantung kana faktor-faktor sapertos kompleksitas model statistik/métodologis, validitas hubungan antara BSD sareng BOSP, atanapi konsistensi sareng data statistik sanés. Kamungkinan kedah antara 3 (acak) sareng 4 (kamungkinan), hartosna éta tiasa lumangsung sababaraha kali atanapi sering.
5.5.3. Pangaruh
Dampak kajadian résiko bakal gumantung kana naha NSO tiasa suksés nunjukkeun katepatan sareng réliabilitas statistik. Upami ieu henteu tiasa dihontal, dampak dina hal kaleungitan kapercayaan sareng kapercayaan ogé tiasa mangaruhan daérah statistik anu sanés, nyaéta réliabilitas henteu ngan ukur sababaraha statistik, tapi ogé nyauran organisasi éta sorangan. NSOs bakal leungit kaunggulan kalapa leuwih organisasi swasta séjén operasi di wewengkon ieu.
5.5.4. Nyegah
Tindakan preventif bakal ngawengku ngembangkeun sarta medarkeun hiji metodologi sora ilmiah anu dipikawanoh ku komunitas ilmiah, enriching data kalawan metadata kualitas, mastikeun konsistensi BOSP kalawan non-BOSP, sarta ngalaksanakeun kadali kualitas ketat.
Sateuacan neraskeun produksi statistik, BOSP tiasa diémbarkeun salaku ékspérimén, sareng pihak anu kabetot bakal didorong pikeun nangtang BOSP pikeun ngavalidasi atanapi ningkatkeun BOSP.
5.5.5. Mitigasi
Aya dua kasus pikeun ngabédakeun. Bisi statistik anu dibantah tapi kualitas luhur / cukup (bener / akurat), éta bakal cukup pikeun ngajelaskeun tur nepikeun statistik ka publik ku cara nyadiakeun gampang ngartos conto.
6. Résiko pakait sareng kaahlian
6.1. Kurangna spesialis
6.1.1. Katerangan
Nganalisis jejak digital anu ditinggalkeun ku jalma-jalma nalika ngalaksanakeun kagiatanana butuh alat-alat analisis data anu ayeuna henteu paling umum dina statistik resmi. Kahiji, ngagunakeun data teu langsung dina kagiatan masarakat tinimbang questioning langsung dina survey merlukeun pamakéan model statistik sahingga inferensi jeung mesin learning kaahlian. Kadua, rékaman digital ieu diwangun ku data anu sering henteu ngagaduhan format tabel anu biasa pikeun hasil survéy, kalayan barisan pakait sareng unit statistik sareng kolom anu gaduh ciri khusus tina unit statistik éta. jalur digital ogé dibere dina bentuk téks, audio, gambar jeung video. Ékstrak inpormasi statistik anu relevan tina jinis data ieu peryogi kaahlian dina ngolah basa alami, ngolah sinyal audio, sareng ngolah gambar. Katilu, sumber data ieu condong nyadiakeun susunan data masif, ngolah nu merlukeun pamahaman hade metodologi komputasi disebarkeun.
Résiko kakurangan para ahli nyaéta pikeun meunangkeun data tina salah sahiji sumber data ageung anyar ieu, sabab kantor statistik henteu gaduh kamampuan pikeun ngolah sareng nganalisis éta leres kusabab stafna kurang kaahlian anu diperyogikeun.
6.1.2. Kamungkinan
The likelihood tina resiko ieu bakal gumantung kana tilu faktor: 1) jenis husus kaahlian diperlukeun pikeun tiap jenis sumber data badag sarta likelihood yén kantor statistik bakal manggihan kasempetan pikeun diajar sumber misalna; 2) kasadiaan ayeuna kaahlian diperlukeun dina kantor statistik; jeung 3) budaya organisasi kantor statistik.
Dina watesan jenis kaahlian nu bisa jadi diperlukeun, éta kudu dicatet yén teu sakabeh sumber merlukeun sakabéh kaahlian nu didaptarkeun di luhur. Sababaraha (misalna data tipe Google Trends) henteu meryogikeun komputasi anu disebarkeun sabab tos diprosés ti panyekel data atanapi gaduh kaahlian ngolah sinyal sareng utamina ngabutuhkeun kaahlian modél statistik. Sanajan kitu, aya rupa-rupa sumber data badag, lolobana nu merlukeun kaahlian dina komputasi disebarkeun, processing sinyal jeung learning mesin. Dina waktos anu sami, eksplorasi anu leres tina ngambah digital ieu ngabutuhkeun ngolah sababaraha sumber. Ku kituna, aya kamungkinan luhur yén sumber data badag jadi sadia pikeun kantor statistik bakal merlukeun kaahlian mahiwal ieu, sarta likelihood tina resiko ieu kacida luhurna (5).
Ngeunaan kasadiaan ayeuna tina kaahlian diperlukeun, ieu bakal gumantung kana kantor statistik husus. Sanaos metodologi survéy kirang umum tibatan metodologi survéy, éta ogé dianggo dina statistik resmi di daérah anu dipilih. Ku alatan éta, sanajan ieu bisa merlukeun sababaraha realokasi SDM, kantor statistik bisa manggihan solusi sorangan. Sajauh kaahlian komputasi anu disebarkeun, utamina aya hubunganana sareng IT, aranjeunna bakal gumantung kana kumaha infrastruktur IT dikokolakeun dina organisasi. Gumantung kana kumaha outsourcing departemen IT, solusi bisa kapanggih dina konteks arrangements aya. Sanajan kitu, pamrosésan sinyal jeung kaahlian mesin learning umumna teu aya di paling kantor statistik formal, sarta aplikasi kaahlian ieu teu bisa outsourcing sabab kudu dilarapkeun ku ahli statistik. Ku alatan éta, tina sudut pandang ieu, kamungkinan résiko ieu ogé sigana luhur pisan (5).
Budaya organisasi ogé bakal mangaruhan kamungkinan résiko ieu. Mibanda staf daék acquire kaahlian diperlukeun ngaliwatan timer palatihan bisa ngaktipkeun organisasi pikeun ngabales kaayaan kalawan sumber data anyar nu merlukeun kaahlian béda ti biasa. Ieu bakal gumantung kana budaya organisasi kantor statistik, nyaéta naha éta nyorong staf diajar kaahlian anyar sareng naha éta ngamungkinkeun waktos staf pikeun diajar mandiri.
Ku kituna, kamungkinan yén kantor statistik moal bisa ngolah jeung nganalisis sumber data anyar alatan kurangna kaahlian diantara staf na bakal antara kamungkinan (4) jeung kamungkinan (5), gumantung kana budaya learning organisasi.
6.1.3. Pangaruh
Kantor statistik anu henteu tiasa ngolah sareng nganalisis sumber data anu ageung kusabab kurangna kaahlian diantara stafna tiasa gaduh dua akibat négatip: 1) sumber data moal ditaliti, sahenteuna henteu sapinuhna; 2) sumberna bakal disalahgunakeun.
Kagagalan pikeun pinuh ngajajah poténsi sumber berharga data badag bakal boga dampak saeutik (2) dina jangka pondok, sabab kantor statistik boga parabot statistik pikeun minuhan kabutuhan ayeuna. Sanajan kitu, dina jangka panjang (jeung sugan malah dina jangka sedeng), konsékuansi tina kaleungitan kasempetan ieu bakal kritis (4), sakumaha kantor statistik beuki nyanghareupan kompetisi ti panyadia swasta anu teu boga struktur institusional sarua anu bakal ngidinan aranjeunna. pikeun ngajamin kamerdikaan umum data statistik.
Tapi, nyalahgunakeun sumberna bakal gaduh akibat anu négatip pisan pikeun kantor statistik, sabab statistik resmi ngandelkeun reputasina pikeun ngalaksanakeun misina. Najan kitu, urang bisa ngajawab yén skill pangpentingna anu, lamun lasut, bisa ngakibatkeun hasil lepat nyaeta inferensi statistik, hususna inferensi dumasar-model, nu ogé kurang kamungkinan kana leungit. Ku alatan éta, dampak ekspektasi bakal kritis (4) tinimbang ekstrim.
6.1.4. Nyegah
Kantor statistik tiasa aktip nyegah résiko ieu ku dua cara: 1) latihan; jeung 2) susunan.
Kantor statistik bisa ngalengkepan staf jeung kaahlian diperlukeun ku detailing kaahlian diperlukeun pikeun ngagunakeun sumber data badag dina produksi statistik, pemetaan kaahlian staf aya, identifying kabutuhan latihan, lajeng nyadiakeun kursus latihan.
Kantor statistik ogé tiasa ngarekrut staf énggal kalayan kaahlian anu diperyogikeun. Ieu sigana gaduh watesan anu serius sabab kantor statistik moal tiasa ngarékam massa kritis staf pikeun kaayaan dimana pamakean sumber data ageung bakal nyebar di jero jabatan sareng staf anyar masih bakal nyandak sababaraha taun pikeun cocog sareng pangalaman anu aya. pagawe. Sanajan kitu, sahenteuna sababaraha karyawan anyar hired salaku bagian tina refresh staf rutin mungkin gaduh kaahlian data badag.
6.1.5. Mitigasi
Nyanghareupan kaayaan dimana sumber data badag anyar sadia tanpa staf jeung kaahlian diperlukeun, kantor statistik bisa mitigate konsékuansi négatip ku dua cara: 1) subcontracting; jeung 2) gawé bareng.
Kantor statistik tiasa ngalebetkeun kontrak pikeun ngolah data sareng nganalisis sumber data ageung sareng organisasi sanés anu nyayogikeun jinis jasa ieu. Ieu sigana janten solusi anu lumayan salaku séktor usaha anyar anu khusus dina ngolah data jinis ieu muncul. Nanging, ieu mangrupikeun solusi anu nyalira gaduh résiko anu tangtu, sabab kantor statistik bakal gaduh kontrol anu kirang dina produksi produk statistik anu berpotensi sénsitip. Leyuran ieu ogé boga disadvantage nu teu ngidinan staf kantor statistik pikeun neuleuman sarta acquire kaahlian perlu.
Kolaborasi sareng organisasi sanés anu ngagaduhan karyawan kalayan kaahlian anu dipikabutuh sareng anu ogé resep ngajalajah sumber data ageung sigana janten solusi anu langkung ngajangjikeun. Kolaborasi ieu tiasa janten bentuk proyék gabungan sareng staf ti kantor statistik sareng staf ti organisasi sanés anu sami sareng anu ngabagi pangaweruhna. Ieu henteu ngan ukur ngirangan résiko kakurangan kaahlian, tapi ogé ngamungkinkeun staf kantor statistik pikeun nyandak kaahlian ieu.
6.2. Leakage ahli ka organisasi séjén
6.2.1. Katerangan
Résiko ieu nyaéta kantor statistik kaleungitan stafna ka organisasi sanés saatos aranjeunna ngagaduhan kaahlian data anu ageung.
6.2.2. Kamungkinan
Kamungkinan résiko ieu bakal gumantung kana dua faktor: 1) kasempetan pikaresepeun anu aya dina organisasi di luar statistik resmi; 2) kaayaan gawé di departemén statistik.
Pikeun kasempetan di organisasi di luar statistik resmi, résiko ieu sigana (4). Aya paménta anu luhur pikeun jalma anu gaduh kaahlian data ageung di sektor swasta ogé organisasi sektor publik anu sanés. Sakali kaahlian damel sareng data ageung kaala, ahli statistik resmi bakal gaduh kaunggulan komparatif sapertos ahli statistik anu berpengalaman. Salian kaahlian data badag husus, organisasi séjén merlukeun élmuwan data kalawan kaahlian leuwih tradisional, kayaning assessing pangabutuh pamaké sarta ngamekarkeun indikator kinerja konci (KPIs), nu ilahar pikeun statistikawan resmi. Sajaba ti éta, diperkirakeun yén pagawé anu bakal leuwih daék acquire kaahlian anyar ogé bakal jalma anu ogé bakal leuwih kabuka pikeun parobahan karir jeung ninggalkeun kantor statistik.
Sedengkeun pikeun kaayaan gawé di kantor statistik, ieu écés bakal gumantung utamana kana kantor husus. Tapi, kantor statistik sacara umum masih nawiskeun kasempetan karir anu pikaresepeun pikeun jalma tina sudut pandang kuantitatif. Kantor statistik nawiskeun rentang panglegana tina domain anu tiasa dianggo sareng pilihan data anu paling ageung pikeun dianggo. Ieu kumaha bae bakal ngurangan likelihood nu kantor statistik bakal leungit staf alatan kaayaan teu kaduga (3).
6.2.3. Pangaruh
Dampak tina resiko ieu bakal sarua jeung resiko teu boga staf jeung kaahlian luyu di tempat munggaran. Ku kituna, dampak bakal kritis (4) sakumaha disebutkeun di luhur.
6.2.4. Nyegah
Sigana hiji-hijina jalan pikeun kantor statistik pikeun nyegah résiko ieu nyaéta nyayogikeun kaayaan kerja anu pikaresepeun pikeun karyawanna. Ieu umumna bener keur sakabeh staf. Nanging, dina kasus khusus dimana karyawan kabuka pikeun diajar kaahlian anyar, nyaéta kaahlian data ageung, kaayaan kerja tiasa ningkat ku nyayogikeun kasempetan diajar dimana aranjeunna tiasa ngembangkeun kapentingan profésionalna. Kantor statistik ogé bisa nengetan husus ka kabuka pikeun proyék-proyék inovatif anyar jeung gagasan nu patali jeung sumber data badag anyar datang ti statistikawan gawe dina sababaraha widang statistik. Tungtungna, nyegah organisasi séjén kaleungitan staf dina urutan kaahlian data badag maranéhna bakal gumantung kana idéntifikasi alus staf sanggup tur daék digawekeun ku data sapertos, sarta nyadiakeun kasempetan alus pikeun ngembangkeun profésional maranéhanana.
6.2.5. Mitigasi
Mitigasi tina resiko ieu bakal dilakukeun dina hubungan resiko kurangna tanaga jeung kaahlian luyu: 1) subcontracting; jeung 2) gawé bareng.
7. Sawala
Ti Tinjauan munggaran ieu, jelas yén teu mungkin pikeun nyieun hiji probabiliti tunggal atawa dampak pikeun "Risiko Data Big" - duanana umumna gumantung pisan kana sumber Big Data ogé "resmi Big Data basis. statistik."
produk ".
Ku kituna kami nyimpulkeun yén lengkah logis salajengna dina arah ieu nyaéta nyandak sababaraha proyék pilot anu mungkin (unggal ngalibetkeun kombinasi hiji atanapi langkung BDS sareng hiji atanapi langkung BDOS) salaku titik awal sareng - pikeun tiap pilot sapertos kitu - kahayang pikeun assess likelihood jeung dampak unggal resiko.
Pikeun tujuan ieu, kami nuju ngaluncurkeun survey pamangku kapentingan milarian penilaian OSC ngeunaan kamungkinan, dampak (sareng kamungkinan tindakan pencegahan / mitigasi) pikeun sajumlah proyék pilot anu mungkin - sareng nyuhunkeun input OSC ngeunaan résiko anu kami henteu kalebet kana. dokumén ieu.
8. DAFTAR PUSTAKAUNECE (2014), "Kerangka anu disarankeun pikeun Kualitas Data Besar", Hasil Tim Tugas Kualitas Data Besar UNECE,
a%20Quality%20Framework%20-%20final-%20Jan08-2015.pdf?version=1&modificationDate=1420725063663&api=v2
UNECE (2014), "Sabaraha ageung Big Data? Ngajalajah peran Big Data dina Statistik Resmi",
Daas, P., S. Ossen, R. Vis-Visschers, sarta J. Arends-Toth, (2009), Daptar pariksa keur evaluasi Kualitas Sumber Data Administratif, Statistik Walanda, Den Haag / Heerlen
Dorfman, Tandaan S. (2007), Bubuka pikeun Manajemén Risk (e ed.), Cambridge, Inggris, Woodhead-Faulkner, p. 18, ISBN 0-85941-332-22)
Eurostat (2014), "Prosedur Akréditasi pikeun data statistik tina sumber non-resmi" dina Analisis Métodologi pikeun ngagunakeun Internét pikeun ngumpulkeun inpormasi masarakat sareng statistik sanésna,
Reimsbach-Kounatze, C. (2015), "The proliferasi tina "Data badag" jeung implikasi pikeun statistik resmi jeung agénsi statistik: A Analisis awal "OECD Digital Ékonomi Papers, No. 245, OECD Publishing.
Reis, F., Ferreira, P., Perduca, V. (2014) "Pamakéan bukti aktivitas web pikeun ngaronjatkeun Kala tina indikator statistik resmi", kertas dibere dina konferensi IAOS 2014,
Sanaos henteu sacara eksplisit nyebatkeun résiko, makalah ieu nyatana ngadeukeutan seueur résiko anu aya hubunganana sareng panggunaan data kagiatan wéb pikeun statistik resmi. Eurostat (2007), Buku Panduan ngeunaan Métode Penilaian Kualitas Data sareng Alat,
sumber: www.habr.com
