Ngresiki data kaya Rock, Paper, Gunting. Iku game karo utawa tanpa Rampung? Bagean 1. Teoritis

1. Data wiwitan

Reresik data minangka salah sawijining tantangan sing diadhepi tugas analisis data. Materi iki nggambarake perkembangan lan solusi sing muncul minangka asil ngrampungake masalah praktis nganalisa basis data ing pambentukan nilai kadaster. Sumber kene "LAPORAN No. 01/OKS-2019 babagan asil penilaian kadaster negara kabeh jinis real estate (kajaba plot tanah) ing wilayah Okrug Otonomi Khanty-Mansiysk - Ugra".

File "Model komparatif total.ods" ing "Lampiran B. Asil nemtokake KS 5. Informasi babagan cara nemtokake nilai kadaster 5.1 Pendekatan komparatif" dianggep.

Tabel 1. Indikator statistik dataset ing file "Model komparatif total.ods"
Jumlah kolom, pcs. — 44
Jumlah cathetan, pcs. — 365 490
Jumlah karakter, pcs. — 101 714 693
Jumlah karakter rata-rata ing rekaman, pcs. — 278,297
Standar deviasi karakter ing rekaman, pcs. — 15,510
Jumlah minimal karakter ing entri, pcs. — 198
Jumlah maksimum karakter ing entri, pcs. — 363

2. Perangan Pambuka. Standar dhasar

Nalika nganalisa basis data sing ditemtokake, tugas dibentuk kanggo nemtokake syarat kanggo tingkat pemurnian, amarga, kaya sing jelas kanggo saben wong, database kasebut nggawe konsekuensi hukum lan ekonomi kanggo pangguna. Sajrone karya, ternyata ora ana syarat khusus kanggo tingkat reresik data gedhe. Nganalisa norma-norma hukum ing prakara iki, aku nyimpulake yen kabeh mau dibentuk saka kemungkinan. Tegese, tugas tartamtu wis muncul, sumber informasi dikompilasi kanggo tugas kasebut, banjur dataset dibentuk lan, adhedhasar dataset sing digawe, alat kanggo ngrampungake masalah kasebut. Solusi sing diasilake minangka titik referensi kanggo milih saka alternatif. Aku nampilake iki ing Gambar 1.

Ngresiki data kaya Rock, Paper, Gunting. Iku game karo utawa tanpa Rampung? Bagean 1. Teoritis

Amarga, kanggo nemtokake standar apa wae, luwih becik ngandelake teknologi sing wis kabukten, aku milih syarat sing ditemtokake ing "Definisi lan Pandhuan Integritas Data MHRA GxP kanggo Industri", amarga aku nganggep dokumen iki paling lengkap kanggo masalah iki. Khususé, ing dokumen iki bagean kasebut ujar "Perlu dicathet yen syarat integritas data ditrapake kanggo data manual (kertas) lan elektronik." (terjemahan: "... syarat integritas data ditrapake kanggo manual (kertas) lan data elektronik"). Formulasi iki cukup khusus digandhengake karo konsep "bukti tertulis", ing pranata Artikel 71 saka Code of Civil Procedure, Art. 70 CAS, Pasal 75 APC, "ing tulisan" Art. 84 Kode Prosedur Perdata.

Gambar 2 nampilake diagram pambentukan pendekatan kanggo jinis informasi ing yurisprudensi.

Ngresiki data kaya Rock, Paper, Gunting. Iku game karo utawa tanpa Rampung? Bagean 1. Teoritis
Gabah. 2. Sumber kene.

Gambar 3 nuduhake mekanisme Gambar 1, kanggo tugas ing ndhuwur "Pandhuan". Gampang, kanthi nggawe perbandingan, kanggo ndeleng manawa pendekatan sing digunakake nalika nyukupi syarat kanggo integritas informasi ing standar modern kanggo sistem informasi diwatesi sacara signifikan dibandhingake karo konsep hukum informasi.

Ngresiki data kaya Rock, Paper, Gunting. Iku game karo utawa tanpa Rampung? Bagean 1. Teoritis
Gambar 3

Ing dokumen kasebut (Pandhuan), sambungan menyang bagean teknis, kemampuan kanggo ngolah lan nyimpen data, dikonfirmasi kanthi kutipan saka Bab 18.2. Basis data relasional: "Struktur file iki pancen luwih aman, amarga data kasebut disimpen ing format file gedhe sing njaga hubungan antarane data lan metadata."

Nyatane, ing pendekatan iki - saka kemampuan teknis sing wis ana, ora ana sing ora normal lan, ing dhewe, iki minangka proses alami, amarga ekspansi konsep teka saka kegiatan sing paling ditliti - desain database. Nanging, ing sisih liya, norma hukum katon sing ora menehi diskon babagan kemampuan teknis sistem sing ana, contone: GDPR - Peraturan Pangreksan Data Umum.

Ngresiki data kaya Rock, Paper, Gunting. Iku game karo utawa tanpa Rampung? Bagean 1. Teoritis
Gabah. 4. Corong kapabilitas teknis (Sumber).

Ing aspek kasebut, dadi cetha yen dataset asli (Fig. 1) kudu, pisanan kabeh, disimpen, lan kapindho, dadi basis kanggo ngekstrak informasi tambahan saka iku. Inggih, minangka conto: kamera ngrekam aturan lalu lintas ana ing ngendi-endi, sistem Processing informasi ganja metu violators, nanging informasi liyane uga bisa ditawakake kanggo konsumen liyane, contone, minangka marketing ngawasi struktur aliran pelanggan menyang pusat blanja. Lan iki minangka sumber nilai tambah tambahan nalika nggunakake BigDat. Bisa uga yen dataset sing diklumpukake saiki, ing endi wae ing mangsa ngarep, bakal duwe nilai miturut mekanisme sing padha karo nilai edisi langka 1700 ing wektu saiki. Sawise kabeh, nyatane, dataset sauntara unik lan ora mungkin diulang maneh ing mangsa ngarep.

3. Perangan Pambuka. Kritéria evaluasi

Sajrone proses pangolahan, klasifikasi kesalahan ing ngisor iki dikembangake.

1. Kelas kesalahan (adhedhasar GOST R 8.736-2011): a) kesalahan sistematis; b) kesalahan acak; c) kesalahan.

2. Miturut multiplicity: a) mono distorsi; b) multi-distorsi.

3. Miturut kritisitas akibat: a) kritis; b) ora kritis.

4. Miturut sumber kedadeyan:

A) Teknis - kesalahan sing kedadeyan sajrone operasi peralatan. Kesalahan sing cukup cocog kanggo sistem IoT, sistem kanthi pengaruh sing signifikan ing kualitas komunikasi, peralatan (perangkat keras).

B) Kesalahan operator - kesalahan ing macem-macem saka kesalahan ketik operator sajrone input nganti kesalahan ing spesifikasi teknis kanggo desain database.

C) Kesalahan pangguna - ing kene ana kesalahan pangguna ing kabeh kisaran saka "kelalen ngalih tata letak" nganti salah meter kanggo sikil.

5. Dipérang dadi kelas sing kapisah:

a) "tugas pemisah," yaiku spasi lan ":" (ing kasus kita) nalika diduplikasi;
b) tembung sing ditulis bebarengan;
c) ora ana spasi sawise karakter layanan
d) simbol sing simetris: (), "", "...".

Digabungake, kanthi sistematisasi kesalahan database sing ditampilake ing Gambar 5, sistem koordinat sing cukup efektif dibentuk kanggo nggoleki kesalahan lan ngembangake algoritma reresik data kanggo conto iki.

Ngresiki data kaya Rock, Paper, Gunting. Iku game karo utawa tanpa Rampung? Bagean 1. Teoritis
Gabah. 5. Kesalahan khas sing cocog karo unit struktural database (Sumber: Oreshkov V.I., Paklin N.B. "Konsep kunci konsolidasi data").

Akurasi, Integritas Domain, Jinis Data, Konsistensi, Redundansi, Kelengkapan, Duplikasi, Kesesuaian karo Aturan Bisnis, Kepastian Struktural, Anomali Data, Kejelasan, Pas wektune, Ketaatan karo Aturan Integritas Data. (Page 334. Data warehousing fundamental for IT professionals / Paulraj Ponniah.—2nd ed.)

Disajikake tembung Inggris lan terjemahan mesin Rusia ing kurung.

Akurasi. Nilai sing disimpen ing sistem kanggo unsur data minangka nilai sing tepat kanggo kedadeyan unsur data kasebut. Yen sampeyan duwe jeneng pelanggan lan alamat sing disimpen ing rekaman, alamat kasebut minangka alamat sing bener kanggo pelanggan kanthi jeneng kasebut. Yen sampeyan nemokake jumlah sing dipesen minangka 1000 unit ing cathetan kanggo nomer pesenan 12345678, banjur jumlah kasebut minangka jumlah sing akurat kanggo pesenan kasebut.
[Akurasi. Nilai sing disimpen ing sistem kanggo unsur data minangka nilai sing bener kanggo kedadeyan unsur data kasebut. Yen sampeyan duwe jeneng lan alamat pelanggan sing disimpen ing rekaman, alamat kasebut minangka alamat sing bener kanggo pelanggan kanthi jeneng kasebut. Yen sampeyan nemokake jumlah sing dipesen minangka 1000 unit ing cathetan kanggo nomer pesenan 12345678, banjur jumlah kasebut minangka jumlah sing tepat kanggo pesenan kasebut.]

Integritas Domain. Nilai data saka atribut tumiba ing sawetara sing diijini, nilai sing ditetepake. Conto umum yaiku nilai sing diidinake yaiku "lanang" lan "wadon" kanggo unsur data jender.
[Integritas Domain. Nilai data atribut kalebu ing kisaran sing bener, nilai sing ditemtokake. Conto umum yaiku nilai sing valid "lanang" lan "wadon" kanggo unsur data jender.]

Jinis data. Nilai kanggo atribut data bener-bener disimpen minangka jinis data sing ditetepake kanggo atribut kasebut. Nalika jinis data kolom jeneng toko ditetepake minangka "teks", kabeh conto lapangan kasebut ngemot jeneng toko sing ditampilake ing format teks lan dudu kode angka.
[Tipe data. Nilai atribut data bener-bener disimpen minangka jinis data sing ditetepake kanggo atribut kasebut. Yen jinis data kolom jeneng toko ditetepake minangka "teks", kabeh conto kolom iki ngemot jeneng toko sing ditampilake ing format teks tinimbang kode angka.]

Konsistensi. Wangun lan isi kolom data padha ing macem-macem sistem sumber. Yen kode produk kanggo produk ABC ing siji sistem yaiku 1234, banjur kode produk iki yaiku 1234 ing saben sistem sumber.
[Konsistensi. Wangun lan isi kolom data padha ing sistem sumber sing beda. Yen kode produk kanggo produk ABC ing siji sistem yaiku 1234, banjur kode produk kasebut yaiku 1234 ing saben sistem sumber.]

Redundansi. Data sing padha ora kudu disimpen ing luwih saka siji panggonan ing sistem. Yen, kanthi alasan efisiensi, unsur data sengaja disimpen ing luwih saka siji panggonan ing sistem, mula redundansi kasebut kudu diidentifikasi lan diverifikasi kanthi jelas.
[Keluwihan. Data sing padha ora kudu disimpen ing luwih saka siji panggonan ing sistem. Yen, amarga efisiensi, unsur data sengaja disimpen ing pirang-pirang lokasi ing sistem, mula redundansi kudu ditetepake lan diverifikasi kanthi jelas.]

Kelengkapan. Ora ana nilai sing ilang kanggo atribut tartamtu ing sistem kasebut. Contone, ing file pelanggan, kudu ana nilai sing bener kanggo kolom "negara" kanggo saben pelanggan. Ing file kanggo rincian pesenan, saben rekaman rincian pesenan kudu diisi kanthi lengkap.
[Kelengkapan. Ora ana nilai sing ilang ing sistem kanggo atribut iki. Contone, file klien kudu duwe nilai sing bener kanggo kolom "status" kanggo saben klien. Ing file rincian pesenan, saben cathetan rincian pesenan kudu rampung rampung.]

Duplikasi. Duplikasi rekaman ing sistem wis rampung. Yen file produk dikenal duwe rekaman duplikat, kabeh rekaman duplikat kanggo saben produk diidentifikasi lan referensi silang digawe.
[Duplikat. Duplikasi cathetan ing sistem wis rampung dibusak. Yen file produk dikenal ngemot entri duplikat, kabeh entri duplikat kanggo saben produk diidentifikasi lan referensi silang digawe.]

Selaras karo Aturan Bisnis. Nilai saben item data manut aturan bisnis sing wis ditemtokake. Ing sistem lelang, rega palu utawa adol ora bisa kurang saka rega cadangan. Ing sistem silihan bank, saldo silihan kudu tansah positif utawa nol.
[Selaras karo aturan bisnis. Nilai saben unsur data tundhuk karo aturan bisnis sing wis ditemtokake. Ing sistem lelang, rega palu utawa adol ora bisa kurang saka rega cadangan. Ing sistem kredit perbankan, imbangan silihan kudu tansah positif utawa nol.]

Kepastian Struktural. Ing ngendi wae item data bisa disusun dadi komponen individu, item kasebut kudu ngemot struktur sing wis ditemtokake kanthi apik. Contone, jeneng individu kanthi alami dipérang dadi jeneng ngarep, wiwitan tengah, lan jeneng mburi. Nilai kanggo jeneng individu kudu disimpen minangka jeneng ngarep, awal tengah, lan jeneng mburi. Karakteristik kualitas data iki nyederhanakake penegakan standar lan nyuda nilai sing ilang.
[Kepastian Struktural. Yen unsur data bisa disusun kanthi alami dadi komponen individu, unsur kasebut kudu ngemot struktur sing wis ditemtokake kanthi apik. Contone, jeneng wong lumrahé dipérang dadi jeneng ngarep, jeneng tengah, lan jeneng mburi. Nilai kanggo jeneng individu kudu disimpen minangka jeneng ngarep, awal tengah, lan jeneng mburi. Karakteristik kualitas data iki nyederhanakake aplikasi standar lan nyuda nilai sing ilang.]

Anomali Data. Sawijining lapangan kudu digunakake mung kanggo tujuan sing ditetepake. Yen kolom Alamat-3 ditetepake kanggo sembarang baris katelu saka alamat kanggo alamat dawa, banjur kolom iki kudu digunakake mung kanggo ngrekam baris katelu saka alamat. Ora kudu digunakake kanggo ngetik nomer telpon utawa fax kanggo pelanggan.
[Anomali Data. Sawijining lapangan mung kudu digunakake kanggo tujuan sing ditetepake. Yen kolom Alamat-3 ditetepake kanggo baris alamat katelu sing bisa kanggo alamat sing dawa, banjur kolom iki mung digunakake kanggo ngrekam baris alamat katelu. Ora kena digunakake kanggo ngetik nomer telpon utawa fax kanggo pelanggan.]

kajelasan. Unsur data bisa uga nduweni kabeh karakteristik data kualitas liyane nanging yen pangguna ora ngerti maknane kanthi jelas, unsur data kasebut ora ana regane kanggo pangguna. Konvensi penamaan sing tepat mbantu supaya unsur data bisa dingerteni dening pangguna.
[Kejelasan. Unsur data bisa uga nduweni kabeh ciri liyane saka data sing apik, nanging yen pangguna ora ngerti maknane kanthi jelas, mula unsur data kasebut ora ana regane kanggo pangguna. Konvensi penamaan sing bener mbantu supaya unsur data bisa dingerteni dening pangguna.]

pas wektune. Pangguna nemtokake wektu data. Yen pangguna ngarepake data dimensi pelanggan ora luwih saka sedina, owah-owahan data pelanggan ing sistem sumber kudu ditrapake ing gudang data saben dina.
[Ing wektu sing tepat. Pangguna nemtokake wektu data. Yen pangguna ngarepake data dimensi pelanggan ora luwih saka sedina, owah-owahan data pelanggan ing sistem sumber kudu ditrapake ing gudang data saben dina.]

Migunani. Saben unsur data ing gudang data kudu nyukupi sawetara syarat koleksi pangguna. Unsur data bisa uga akurat lan berkualitas tinggi, nanging yen ora ana regane kanggo pangguna, mula unsur data kasebut ora perlu ana ing gudang data.
[Utilitas. Saben item data ing nyimpen data kudu nyukupi sawetara syarat koleksi pangguna. Unsur data bisa uga akurat lan berkualitas, nanging yen ora menehi nilai kanggo pangguna, mula unsur data kasebut ora perlu ana ing gudang data.]

Ketaatan marang Aturan Integritas Data. Data sing disimpen ing basis data relasional saka sistem sumber kudu netepi integritas entitas lan aturan integritas referensial. Tabel apa wae sing ngidini null minangka kunci utama ora nduweni integritas entitas. Integritas referensial meksa nggawe hubungan wong tuwa-anak kanthi bener. Ing hubungan customer-to-order, integritas referensial njamin anane pelanggan kanggo saben pesenan ing database.
[Selaras karo aturan integritas data. Data sing disimpen ing basis data hubungan sistem sumber kudu tundhuk karo aturan integritas entitas lan integritas referensial. Tabel apa wae sing ngidini null minangka kunci utama ora nduweni integritas entitas. Integritas referensial meksa sesambungan antarane wong tuwa lan anak supaya bisa diwujudake kanthi bener. Ing hubungan pesenan pelanggan, integritas referensial njamin manawa ana pelanggan kanggo saben pesenan ing basis data.]

4. Kualitas reresik data

Качество очистки данных достаточно проблематичный вопрос в бигдата. Ответить на вопрос какая степень очистки данных необходима при выполнении поставленной задачи, является основным для каждого датаанлитика. В большинстве текущих задач каждый аналитик устанавливает это сам и вряд ли кто-то со стороны способен оценить этот аспект в его решении. Но для поставленной задачи в этом случае этот вопрос был крайне важен, так как достоверность правовых данных должна стремиться к единице.

Ngelingi teknologi tes piranti lunak kanggo nemtokake linuwih operasional. Dina iki ana luwih saka model iki 200. Akeh model nggunakake model layanan klaim:

Ngresiki data kaya Rock, Paper, Gunting. Iku game karo utawa tanpa Rampung? Bagean 1. Teoritis
Gambar. Xnumx

Mikir kaya ing ngisor iki: "Yen kesalahan sing ditemokake minangka acara sing padha karo acara kegagalan ing model iki, banjur kepiye carane nemokake analog saka parameter t?" Lan aku nyawiji model ing ngisor iki: Ayo mbayangno wektu sing dibutuhake tester kanggo mriksa siji rekaman yaiku 1 menit (kanggo database sing dimaksud), banjur kanggo nemokake kabeh kesalahane, dheweke butuh 365 menit, yaiku kira-kira 494 taun 3. sasi wektu kerja. Kaya sing kita ngerteni, iki minangka karya sing akeh banget lan biaya kanggo mriksa database bakal larang kanggo kompiler database iki. Ing bayangan iki, konsep ekonomi biaya katon lan sawise analisis aku teka menyang kesimpulan sing iki alat cukup efektif. Adhedhasar hukum ekonomi: "Volume produksi (ing unit) sing entuk bathi maksimal perusahaan dumunung ing titik ing ngendi biaya marginal kanggo ngasilake unit output anyar dibandhingake karo rega sing bisa ditampa dening perusahaan iki. kanggo unit anyar." Adhedhasar postulat sing nemokake saben kesalahan sakteruse mbutuhake luwih akeh mriksa cathetan, iki minangka faktor biaya. Tegese, postulat sing diadopsi ing model tes njupuk makna fisik ing pola ing ngisor iki: yen kanggo nemokake kesalahan i-th kudu mriksa n cathetan, banjur nemokake kesalahan sabanjure (i + 3) bakal dibutuhake. kanggo mriksa m cathetan lan ing wektu sing padha n

  1. Nalika jumlah cathetan sing dicenthang sadurunge kesalahan anyar ditemokake stabil;
  2. Nalika jumlah cathetan sing dicenthang sadurunge nemokake kesalahan sabanjure bakal nambah.

Kanggo nemtokake nilai kritis, aku nguripake konsep kelayakan ekonomi, sing ing kasus iki, nggunakake konsep biaya sosial, bisa dirumusake kaya ing ngisor iki: "Biaya kanggo mbenerake kesalahan kudu ditanggung dening agen ekonomi sing bisa nindakake. kanthi biaya paling murah." Kita duwe siji agen - tester sing mbuwang 1 menit kanggo mriksa siji rekaman. Ing istilah moneter, yen sampeyan entuk 6000 rubel / dina, iki bakal dadi 12,2 rubel. (kira-kira dina iki). Iku tetep kanggo nemtokake sisih liya saka keseimbangan ing hukum ekonomi. Aku nalar kaya iki. Kesalahan sing ana bakal mbutuhake wong sing prihatin kudu ngupayakake kanggo mbenerake, yaiku pemilik properti. Ayo ngomong iki mbutuhake 1 dina tumindak (ngirim aplikasi, nampa dokumen sing didandani). Banjur, saka sudut pandang sosial, biaya bakal padha karo gaji rata-rata saben dina. Gaji rata-rata sing ditampa ing Okrug Otonomi Khanty-Mansi "Asil pangembangan sosio-ekonomi Okrug Otonomi Khanty-Mansiysk - Ugra kanggo Januari-September 2019" 73285 rub. utawa 3053,542 rubel / dina. Dadi, kita entuk nilai kritis sing padha karo:
3053,542: 12,2 = 250,4 unit cathetan.

Iki tegese, saka sudut pandang sosial, yen panguji mriksa 251 cathetan lan nemokake kesalahan, iku padha karo pangguna sing ndandani kesalahan kasebut dhewe. Mulane, yen tester ngginakaken wektu witjaksono kanggo mriksa 252 cathetan kanggo nemokake kesalahan sabanjuré, ing kasus iki, iku luwih apik kanggo mindhah biaya koreksi kanggo pangguna.

Pendekatan sing disederhanakake ditampilake ing kene, amarga saka sudut pandang sosial kudu digatekake kabeh nilai tambahan sing digawe dening saben spesialis, yaiku, biaya kalebu pajak lan pembayaran sosial, nanging model kasebut jelas. Konsekuensi saka hubungan iki yaiku syarat ing ngisor iki kanggo spesialis: spesialis saka industri IT kudu duwe gaji luwih gedhe tinimbang rata-rata nasional. Yen gajine kurang saka gaji rata-rata pangguna database potensial, mula dheweke kudu mriksa kabeh database kanthi tangan.

Nalika nggunakake kritéria sing diterangake, syarat pisanan kanggo kualitas database dibentuk:
Aku (tr). Panggabungan saka kesalahan kritis ngirim ora ngluwihi 1/250,4 = 0,39938%. A sethitik kurang saka nyaring emas ing industri. Lan ing istilah fisik ana ora luwih saka 1459 cathetan karo kasalahan.

Mundur ekonomi.

Nyatane, kanthi nggawe sawetara kesalahan ing cathetan, masyarakat setuju karo kerugian ekonomi kanthi jumlah:

1459 * 3053,542 = 4 rubel.

Jumlah kasebut ditemtokake dening kasunyatan manawa masyarakat ora duwe alat kanggo nyuda biaya kasebut. Dadi, yen ana wong sing duwe teknologi sing ngidini nyuda jumlah rekaman kanthi kesalahan, contone, 259, mula iki bakal ngidini masarakat nyimpen:
1200 * 3053,542 = 3 rubel.

Nanging ing wektu sing padha, dheweke bisa njaluk bakat lan karya, uga, ayo ngomong - 1 yuta rubles.
Yaiku, biaya sosial dikurangi kanthi:

3 - 664 = 250 rubel.

Intine, efek iki minangka nilai tambah saka panggunaan teknologi BigDat.

Nanging ing kene kudu dianggep yen iki minangka efek sosial, lan pemilik database kasebut minangka panguwasa kotamadya, penghasilan saka panggunaan properti sing dicathet ing basis data iki, kanthi tingkat 0,3%, yaiku: 2,778 milyar rubles / taun. Lan biaya kasebut (4 rubel) ora ngganggu dheweke, amarga ditransfer menyang pamilik properti. Lan, ing aspek iki, pangembang teknologi panyulingan liyane ing Bigdata kudu nuduhake kemampuan kanggo gawe uwong yakin pemilik saka database iki, lan iku mbutuhake bakat owahan.

Ing conto iki, algoritma evaluasi kesalahan dipilih adhedhasar model Schumann [2] verifikasi piranti lunak sajrone tes linuwih. Amarga prevalensi ing Internet lan kemampuan kanggo entuk indikator statistik sing dibutuhake. Metodologi dijupuk saka Monakhov Yu.M. "Stabilitas fungsional sistem informasi", deleng ing spoiler ing Fig. 7-9.

Gabah. 7 – 9 Metodologi model SchumannNgresiki data kaya Rock, Paper, Gunting. Iku game karo utawa tanpa Rampung? Bagean 1. Teoritis

Ngresiki data kaya Rock, Paper, Gunting. Iku game karo utawa tanpa Rampung? Bagean 1. Teoritis

Ngresiki data kaya Rock, Paper, Gunting. Iku game karo utawa tanpa Rampung? Bagean 1. Teoritis

Bagian kapindho materi iki nyedhiyakake conto reresik data, ing ngendi asil nggunakake model Schumann dipikolehi.
Ayo kula nampilake asil sing dipikolehi:
Jumlah kesalahane kira-kira N = 3167 n.
Parameter C, lambda lan fungsi keandalan:

Ngresiki data kaya Rock, Paper, Gunting. Iku game karo utawa tanpa Rampung? Bagean 1. Teoritis
Gambar 17

Ateges, lambda minangka indikator nyata saka intensitas kesalahan sing dideteksi ing saben tahap. Yen katon ing bagean kapindho, prakiraan kanggo Indikator iki 42,4 kasalahan saben jam, kang cukup iso dibandhingke kanggo Indikator Schumann. Ndhuwur, ditemtokake manawa tingkat kesalahan pangembang kudu ora luwih murah tinimbang 1 kesalahan saben 250,4 rekaman, nalika mriksa 1 rekaman saben menit. Dadi nilai kritis lambda kanggo model Schumann:

60 / 250,4 = 0,239617.

Tegese, kabutuhan kanggo nindakake prosedur deteksi kesalahan kudu ditindakake nganti lambda, saka 38,964 sing ana, mudhun dadi 0,239617.

Utawa nganti indikator N (nomer potensial kesalahan) minus n (jumlah kesalahan sing didandani) mudhun ing ngisor ambang sing ditampa - 1459 pcs.

Sastra

  1. Monakhov, Yu.M. Stabilitas fungsional sistem informasi. Ing jam 3. Bagean 1. Reliabilitas piranti lunak: buku teks. sangu / Yu. M. Monakhov; Vladimir. negara univ. – Vladimir: Izvo Vladimir. negara Universitas, 2011. - 60 p. – ISBN 978-5-9984-0189-3.
  2. Martin L. Shooman, "Model probabilistik kanggo prediksi keandalan piranti lunak."
  3. Data warehousing dhasar kanggo profesional IT / Paulraj Ponniah.—2nd ed.

Bagian loro. Teori

Source: www.habr.com

Add a comment