Limpyohi ang datos sama sa dula nga Bato, Papel, Gunting. Kini ba usa ka dula nga adunay katapusan o wala? Bahin 1. Teoretikal

1. Inisyal nga datos

Ang paglimpyo sa datos usa sa mga hagit nga giatubang sa mga buluhaton sa pagtuki sa datos. Kini nga materyal nagpakita sa mga kalamboan ug mga solusyon nga mitungha isip resulta sa pagsulbad sa usa ka praktikal nga problema sa pag-analisar sa database sa pagporma sa kadastral nga bili. Mga tinubdan dinhi "REPORT No. 01/OKS-2019 sa mga resulta sa state cadastral valuation sa tanang matang sa real estate (gawas sa mga luna sa yuta) sa teritoryo sa Khanty-Mansiysk Autonomous Okrug - Ugra".

Ang file nga "Comparative model total.ods" sa "Appendix B. Resulta sa pagtino sa KS 5. Ang impormasyon sa pamaagi sa pagtino sa kadastral nga bili 5.1 Comparative approach" gikonsiderar.

Talaan 1. Statistical indicators sa dataset sa file nga "Comparative model total.ods"
Kinatibuk-ang gidaghanon sa mga uma, pcs. β€” 44
Kinatibuk-ang gidaghanon sa mga rekord, pcs. β€” 365 490
Kinatibuk-ang gidaghanon sa mga karakter, pcs. β€” 101 714 693
Average nga gidaghanon sa mga karakter sa usa ka rekord, pcs. β€” 278,297
Standard deviation sa mga karakter sa usa ka rekord, pcs. β€” 15,510
Minimum nga gidaghanon sa mga karakter sa usa ka entry, pcs. β€” 198
Maximum nga gidaghanon sa mga karakter sa usa ka entry, pcs. β€” 363

2. Pasiuna nga bahin. Panguna nga mga sumbanan

Samtang nag-analisar sa gipiho nga database, usa ka buluhaton ang naporma aron mahibal-an ang mga kinahanglanon alang sa lebel sa pagputli, tungod kay, ingon nga klaro sa tanan, ang piho nga database nagmugna og legal ug ekonomikanhon nga mga sangputanan alang sa mga tiggamit. Atol sa pagtrabaho, nahimo nga wala’y piho nga mga kinahanglanon alang sa lebel sa paglimpyo sa dagkong datos. Ang pag-analisar sa mga ligal nga pamatasan sa kini nga butang, nakahinapos ako nga silang tanan naporma gikan sa mga posibilidad. Kana mao, usa ka piho nga buluhaton ang nagpakita, ang mga gigikanan sa kasayuran giipon alang sa buluhaton, unya usa ka dataset ang naporma ug, base sa gihimo nga dataset, mga himan alang sa pagsulbad sa problema. Ang resulta nga mga solusyon mao ang mga reference point sa pagpili gikan sa mga alternatibo. Gipresentar ko kini sa Figure 1.

Limpyohi ang datos sama sa dula nga Bato, Papel, Gunting. Kini ba usa ka dula nga adunay katapusan o wala? Bahin 1. Teoretikal

Tungod kay, sa mga butang sa pagtino sa bisan unsang mga sumbanan, mas maayo nga mosalig sa napamatud-an nga mga teknolohiya, gipili nako ang mga kinahanglanon nga gilatid sa "Mga Kahulugan sa Integridad sa Data sa MHRA GxP ug Giya alang sa Industriya", tungod kay giisip nako kini nga dokumento nga labing komprehensibo alang niini nga isyu. Sa partikular, sa kini nga dokumento ang seksyon nag-ingon "Kinahanglan nga matikdan nga ang mga kinahanglanon sa integridad sa datos parehas nga magamit sa manwal (papel) ug elektronik nga datos." (paghubad: "...ang mga kinahanglanon sa integridad sa datos parehas nga magamit sa manwal (papel) ug elektronik nga datos"). Kini nga pormulasyon espesipikong nalangkit sa konsepto sa "sinulat nga ebidensya", sa mga probisyon sa Artikulo 71 sa Code of Civil Procedure, Art. 70 CAS, Art. 75 APC, β€œsa pagsulat” Art. 84 Kodigo sa Pamaagi Sibil.

Gipakita sa Figure 2 ang usa ka diagram sa pagporma sa mga pamaagi sa mga tipo sa kasayuran sa jurisprudence.

Limpyohi ang datos sama sa dula nga Bato, Papel, Gunting. Kini ba usa ka dula nga adunay katapusan o wala? Bahin 1. Teoretikal
bugas. 2. Tinubdan dinhi.

Ang Figure 3 nagpakita sa mekanismo sa Figure 1, alang sa mga buluhaton sa ibabaw nga "Guidance". Sayon, pinaagi sa paghimo sa usa ka pagtandi, aron makita nga ang mga pamaagi nga gigamit sa pagtagbo sa mga kinahanglanon alang sa integridad sa kasayuran sa modernong mga sumbanan alang sa mga sistema sa kasayuran labi nga limitado kung itandi sa ligal nga konsepto sa kasayuran.

Limpyohi ang datos sama sa dula nga Bato, Papel, Gunting. Kini ba usa ka dula nga adunay katapusan o wala? Bahin 1. Teoretikal
Fig. 3

Sa gipiho nga dokumento (Giya), ang koneksyon sa teknikal nga bahin, mga kapabilidad sa pagproseso ug pagtipig sa datos, maayo nga gipamatud-an sa usa ka kinutlo gikan sa Kapitulo 18.2. Relational database: "Kini nga file structure kay mas luwas, tungod kay ang data gihuptan sa usa ka dako nga file format nga nagpreserbar sa relasyon tali sa data ug metadata."

Sa tinuud, sa kini nga pamaagi - gikan sa naglungtad nga teknikal nga kapabilidad, wala’y abnormal ug, sa iyang kaugalingon, kini usa ka natural nga proseso, tungod kay ang pagpalapad sa mga konsepto naggikan sa labing gitun-an nga kalihokan - disenyo sa database. Apan, sa laing bahin, ang ligal nga mga lagda nagpakita nga wala maghatag mga diskwento sa mga teknikal nga kapabilidad sa mga naglungtad nga sistema, pananglitan: GDPR - Kinatibuk-ang Regulasyon sa Pagpanalipod sa Data.

Limpyohi ang datos sama sa dula nga Bato, Papel, Gunting. Kini ba usa ka dula nga adunay katapusan o wala? Bahin 1. Teoretikal
bugas. 4. Funnel sa teknikal nga kapabilidad (Tinubdan).

Niini nga mga aspeto, mahimong klaro nga ang orihinal nga dataset (Fig. 1) kinahanglan, una sa tanan, maluwas, ug ikaduha, mahimong basehan sa pagkuha sa dugang nga impormasyon gikan niini. Aw, ingon nga usa ka pananglitan: ang mga camera nga nagrekord sa mga lagda sa trapiko kay ubiquitous, ang mga sistema sa pagproseso sa impormasyon nagwagtang sa mga malapason, apan ang ubang impormasyon mahimo usab nga itanyag sa ubang mga konsumedor, pananglitan, ingon nga pag-monitor sa marketing sa istruktura sa dagan sa mga kustomer ngadto sa usa ka shopping center. Ug kini usa ka gigikanan sa dugang nga dugang nga kantidad kung gigamit ang BigDat. Posible nga ang mga dataset nga nakolekta karon, sa usa ka dapit sa umaabot, adunay bili sumala sa usa ka mekanismo nga susama sa bili sa talagsaon nga mga edisyon sa 1700 sa karon nga panahon. Human sa tanan, sa pagkatinuod, ang temporaryo nga mga dataset talagsaon ug dili tingali masubli sa umaabot.

3. Pasiuna nga bahin. Kriterya sa ebalwasyon

Atol sa proseso sa pagproseso, ang mosunod nga klasipikasyon sa mga sayop naugmad.

1. Sayop nga klase (base sa GOST R 8.736-2011): a) sistematikong mga sayop; b) random nga mga sayop; c) usa ka sayup.

2. Pinaagi sa pagkadaghan: a) mono distortion; b) daghang pagtuis.

3. Sumala sa kritikalidad sa mga sangpotanan: a) kritikal; b) dili kritikal.

4. Pinaagi sa tinubdan sa panghitabo:

A) Teknikal - mga sayup nga mahitabo sa panahon sa operasyon sa kagamitan. Usa ka patas nga may kalabutan nga sayup alang sa mga sistema sa IoT, mga sistema nga adunay usa ka hinungdanon nga lebel sa impluwensya sa kalidad sa komunikasyon, kagamitan (hardware).

B) Mga kasaypanan sa operator - mga sayup sa usa ka halapad nga hanay gikan sa mga typo sa operator sa panahon sa pag-input hangtod sa mga sayup sa teknikal nga mga detalye alang sa disenyo sa database.

C) Mga sayop sa tiggamit - ania ang mga sayop sa tiggamit sa tibuok nga han-ay gikan sa "nakalimot sa pagbalhin sa layout" ngadto sa sayop nga mga metro alang sa mga tiil.

5. Gibulag sa lahi nga klase:

a) ang "buhat sa separator," nga mao, ang luna ug ":" (sa among kaso) kung kini gidoble;
b) mga pulong nga gisulat sa tingub;
c) walay luna human sa mga karakter sa serbisyo
d) simetriko nga daghang simbolo: (), "", "...".

Gihiusa, uban ang sistematisasyon sa mga sayup sa database nga gipresentar sa Figure 5, usa ka medyo epektibo nga sistema sa koordinasyon ang naporma alang sa pagpangita sa mga sayup ug pagpalambo sa usa ka algorithm sa paglimpyo sa datos alang niini nga pananglitan.

Limpyohi ang datos sama sa dula nga Bato, Papel, Gunting. Kini ba usa ka dula nga adunay katapusan o wala? Bahin 1. Teoretikal
bugas. 5. Kinaandan nga mga sayop nga katumbas sa istruktura nga mga yunit sa database (Source: Oreshkov V.I., Paklin N.B. "Mahinungdanon nga mga konsepto sa paghiusa sa datos").

Pagkatukma, Integridad sa Domain, Type sa Data, Pagkamauyonon, Kadugangan, Pagkakompleto, Pagdoble, Pagpahiuyon sa Mga Lagda sa Negosyo, Pagkatino sa Estruktura, Anomaliya sa Data, Katin-aw, Tukma sa Panahon, Pagsunod sa Mga Lagda sa Integridad sa Data. (Page 334. Mga sukaranan sa bodega sa datos alang sa mga propesyonal sa IT / Paulraj Ponniah.β€”2nd ed.)

Gipresentar ang English nga mga pulong ug Russian nga paghubad sa makina sa mga bracket.

Pagkatukma. Ang bili nga gitipigan sa sistema alang sa usa ka elemento sa datos mao ang husto nga bili alang niana nga panghitabo sa elemento sa datos. Kung ikaw adunay ngalan sa kustomer ug usa ka adres nga gitipigan sa usa ka rekord, nan ang adres mao ang husto nga adres alang sa kustomer nga adunay kana nga ngalan. Kon imong makita ang gidaghanon nga gi-order isip 1000 ka mga yunit sa rekord alang sa order nga numero 12345678, nan kana nga gidaghanon mao ang tukma nga gidaghanon alang sa maong order.
[Pagkatukma. Ang bili nga gitipigan sa sistema alang sa usa ka elemento sa datos mao ang husto nga bili alang niana nga panghitabo sa elemento sa datos. Kung ikaw adunay ngalan sa kostumer ug adres nga gitipigan sa usa ka rekord, nan ang adres mao ang husto nga adres alang sa kustomer nga adunay kana nga ngalan. Kung makit-an nimo ang gidaghanon nga gi-order nga 1000 ka mga yunit sa rekord sa order nga numero 12345678, nan kana nga gidaghanon mao ang eksaktong gidaghanon alang sa order.]

Integridad sa Domain. Ang kantidad sa datos sa usa ka hiyas nahulog sa sakup sa gitugotan, gipiho nga mga kantidad. Ang kasagaran nga pananglitan mao ang gitugot nga mga kantidad nga "lalaki" ug "babaye" alang sa elemento sa datos sa gender.
[Integridad sa Domain. Ang bili sa datos sa hiyas anaa sulod sa han-ay sa balido, gipiho nga mga bili. Usa ka kinatibuk-ang pananglitan mao ang balido nga mga mithi nga "lalaki" ug "babaye" alang sa elemento sa datos sa gender.]

Type sa Data. Ang bili alang sa usa ka data attribute sa tinuod gitipigan ingon nga data type nga gihubit alang niana nga attribute. Kung ang tipo sa datos sa field sa ngalan sa tindahan gihubit ingon nga "teksto," ang tanan nga mga higayon sa kana nga field naglangkob sa ngalan sa tindahan nga gipakita sa textual format ug dili mga numeric code.
[Tipe sa datos. Ang bili sa usa ka hiyas sa datos aktuwal nga gitipigan ingon nga matang sa datos nga gihubit alang niana nga hiyas. Kung ang tipo sa datos sa field sa ngalan sa tindahan gihubit nga "teksto", ang tanan nga mga higayon sa kini nga field adunay sulud nga ngalan sa tindahan nga gipakita sa pormat sa teksto kaysa sa mga numeric code.]

pagkamakanunayon. Ang porma ug sulod sa usa ka natad sa datos parehas sa daghang mga sistema sa gigikanan. Kung ang code sa produkto alang sa produkto nga ABC sa usa ka sistema mao ang 1234, nan ang code alang niini nga produkto mao ang 1234 sa matag gigikanan nga sistema.
[Pagkanunayon. Ang porma ug sulod sa data field parehas sa lain-laing source system. Kung ang code sa produkto alang sa produkto nga ABC sa usa ka sistema mao ang 1234, nan ang code alang sa kana nga produkto mao ang 1234 sa matag gigikanan nga sistema.]

Redundancy. Ang parehas nga datos kinahanglan dili tipigan sa labaw sa usa ka lugar sa usa ka sistema. Kung, alang sa mga hinungdan sa pagkaepisyente, ang usa ka elemento sa datos gituyo nga gitipigan sa labaw sa usa ka lugar sa usa ka sistema, nan kinahanglan nga tin-aw nga mailhan ug mapamatud-an ang redundancy.
[Pagkabus. Ang parehas nga datos kinahanglan dili tipigan sa labaw sa usa ka lugar sa sistema. Kung, alang sa mga hinungdan sa pagkaepisyente, ang usa ka elemento sa datos tinuyo nga gitipigan sa daghang mga lokasyon sa usa ka sistema, nan kinahanglan nga tin-aw nga gihubit ug gipamatud-an ang paglabaw.]

Pagkakompleto. Wala’y nawala nga mga kantidad alang sa gihatag nga hiyas sa sistema. Pananglitan, sa usa ka file sa kustomer, kinahanglan adunay balido nga kantidad alang sa "estado" nga uma alang sa matag kustomer. Sa file alang sa mga detalye sa order, ang matag detalye nga rekord alang sa usa ka order kinahanglan nga hingpit nga mapuno.
[Pagkompleto. Wala’y nawala nga mga kantidad sa sistema alang sa kini nga hiyas. Pananglitan, ang file sa kliyente kinahanglan adunay balido nga kantidad alang sa field nga "status" alang sa matag kliyente. Sa file nga detalye sa order, ang matag rekord sa detalye sa order kinahanglan nga hingpit nga makompleto.]

Pagdoble. Ang pagdoble sa mga rekord sa usa ka sistema hingpit nga nasulbad. Kung ang file sa produkto nahibal-an nga adunay doble nga mga rekord, nan ang tanan nga mga doble nga mga rekord alang sa matag produkto mailhan ug usa ka cross-reference nga gihimo.
[Duplicate. Ang pagdoble sa mga rekord sa sistema hingpit nga giwagtang. Kung ang usa ka file sa produkto nahibal-an nga adunay mga doble nga mga entri, nan ang tanan nga mga doble nga mga entri para sa matag produkto mailhan ug usa ka cross-reference ang gihimo.]

Pagpahiuyon sa Mga Lagda sa Negosyo. Ang mga kantidad sa matag data nga butang nagsunod sa gireseta nga mga lagda sa negosyo. Sa usa ka sistema sa subasta, ang martilyo o presyo sa pagbaligya dili mahimong ubos sa presyo sa reserba. Sa sistema sa pautang sa bangko, ang balanse sa pautang kinahanglan kanunay nga positibo o zero.
[Pagsunod sa mga lagda sa negosyo. Ang mga kantidad sa matag elemento sa datos nagsunod sa natukod nga mga lagda sa negosyo. Sa usa ka sistema sa subasta, ang martilyo o presyo sa pagbaligya dili mahimong ubos sa presyo sa reserba. Sa usa ka sistema sa kredito sa bangko, ang balanse sa pautang kinahanglan kanunay nga positibo o zero.]

Structural Definiteness. Bisan asa ang usa ka data nga butang natural nga mahimong gambalay ngadto sa tagsa-tagsa nga mga sangkap, ang butang kinahanglan nga adunay kini nga maayo nga pagkahan-ay nga istruktura. Pananglitan, ang ngalan sa usa ka indibidwal natural nga nabahin sa una nga ngalan, tungatunga nga inisyal, ug apelyido. Ang mga kantidad alang sa mga ngalan sa mga indibidwal kinahanglan itago ingon una nga ngalan, tunga nga inisyal, ug apelyido. Kini nga kinaiya sa kalidad sa datos nagpayano sa pagpatuman sa mga sumbanan ug nagpamenos sa nawala nga mga kantidad.
[Katinoan sa Estruktura. Diin ang usa ka elemento sa datos mahimong natural nga ma-istruktura ngadto sa tagsa-tagsa nga mga sangkap, ang elemento kinahanglang adunay sulod niining maayo nga pagkahan-ay nga istruktura. Pananglitan, ang ngalan sa usa ka tawo natural nga gibahin sa una nga ngalan, tungatunga nga inisyal, ug apelyido. Ang mga kantidad alang sa indibidwal nga mga ngalan kinahanglan itago ingon una nga ngalan, tungatunga nga inisyal, ug apelyido. Kini nga kinaiya sa kalidad sa datos nagpasayon ​​sa paggamit sa mga sumbanan ug nagpamenos sa nawala nga mga bili.]

Anomaliya sa Data. Ang usa ka field kinahanglan nga gamiton lamang alang sa katuyoan diin kini gihubit. Kung ang field Address-3 gihubit alang sa bisan unsang posible nga ikatulo nga linya sa adres alang sa taas nga mga adres, nan kini nga field kinahanglan nga gamiton lamang alang sa pagrekord sa ikatulo nga linya sa adres. Kinahanglan nga dili kini gamiton sa pagsulod sa numero sa telepono o fax para sa kustomer.
[Data Anomaliya. Ang usa ka natad kinahanglan lamang gamiton alang sa katuyoan diin kini gihubit. Kung ang Adres-3 nga field gihubit alang sa bisan unsang posible nga ikatulo nga linya sa adres alang sa taas nga mga adres, nan kini nga field gamiton lamang sa pagrekord sa ikatulo nga linya sa adres. Kinahanglan nga dili kini gamiton sa pagsulod sa numero sa telepono o fax para sa usa ka kustomer.]

Kaklaro. Ang usa ka elemento sa datos mahimong magbaton sa tanan nga uban nga mga kinaiya sa kalidad nga datos apan kung ang mga tiggamit dili makasabut sa kahulogan niini nga tin-aw, nan ang elemento sa datos walay bili sa mga tiggamit. Ang tukma nga mga kombensiyon sa pagngalan makatabang aron masabtan pag-ayo sa mga tiggamit ang mga elemento sa datos.
[Pagklaro. Ang usa ka elemento sa datos mahimong adunay tanan nga uban nga mga kinaiya sa maayo nga datos, apan kung ang mga tiggamit dili klaro nga makasabut sa kahulogan niini, nan ang elemento sa datos walay bili sa mga tiggamit. Ang husto nga mga kombensiyon sa pagngalan makatabang sa paghimo sa mga elemento sa datos nga masabtan pag-ayo sa mga tiggamit.]

Tukma sa panahon. Gitino sa mga tiggamit ang pagka-panahon sa datos. Kung ang mga tiggamit magdahum nga ang datos sa dimensyon sa kustomer dili molapas sa usa ka adlaw, ang mga pagbag-o sa datos sa kustomer sa mga sistema sa gigikanan kinahanglan nga magamit sa bodega sa datos matag adlaw.
[Sa tukma sa panahon nga paagi. Gitino sa mga tiggamit ang pagka-panahon sa datos. Kung ang mga tiggamit magdahum nga ang datos sa dimensyon sa kustomer dili molapas sa usa ka adlaw ang edad, ang mga pagbag-o sa datos sa kostumer sa mga sistema sa gigikanan kinahanglan nga magamit sa bodega sa datos matag adlaw.]

Kapuslanan. Ang matag elemento sa datos sa bodega sa datos kinahanglan nga makatagbaw sa pipila nga mga kinahanglanon sa pagkolekta sa mga tiggamit. Ang usa ka elemento sa datos mahimong tukma ug adunay taas nga kalidad, apan kung kini walay bili sa mga tiggamit, nan kini mao ang hingpit nga dili kinahanglan alang sa data nga elemento nga anaa sa data bodega.
[Utility. Ang matag data nga butang sa data store kinahanglang makatagbaw sa pipila ka kinahanglanon sa pagkolekta sa user. Ang usa ka elemento sa datos mahimong tukma ug adunay taas nga kalidad, apan kung wala kini maghatag bili sa mga tiggamit, nan dili kinahanglan nga ang elemento sa datos naa sa bodega sa datos.]

Pagsunod sa Data Integrity Rules. Ang datos nga gitipigan sa mga relational database sa mga source system kinahanglan nga mosunod sa entity integrity ug referential integrity rules. Ang bisan unsang lamesa nga nagtugot sa null isip panguna nga yawe walay integridad sa entidad. Ang reperensyal nga integridad nagpugos sa pagtukod sa relasyon sa ginikanan-anak sa hustong paagi. Sa usa ka customer-to-order nga relasyon, ang referential integrity nagsiguro sa paglungtad sa usa ka customer alang sa matag order sa database.
[Pagsunod sa mga lagda sa integridad sa datos. Ang datos nga gitipigan sa relational databases sa source systems kinahanglang mosunod sa mga lagda sa entity integrity ug referential integrity. Ang bisan unsang lamesa nga nagtugot sa null isip panguna nga yawe walay integridad sa entidad. Ang reperensyal nga integridad nagpugos sa relasyon tali sa mga ginikanan ug mga anak nga maestablisar sa hustong paagi. Sa usa ka customer-order nga relasyon, ang referential integrity nagsiguro nga adunay usa ka customer alang sa matag order sa database.]

4. Kalidad sa pagpanglimpyo sa datos

Ang kalidad sa paglimpyo sa datos usa ka problema nga isyu sa bigdata. Ang pagtubag sa pangutana kung unsa nga lebel sa paglimpyo sa datos ang gikinahanglan aron makompleto ang tahas hinungdanon alang sa matag analista sa datos. Sa kadaghanan sa karon nga mga problema, ang matag analista nagtino niini sa iyang kaugalingon ug dili tingali nga bisan kinsa gikan sa gawas makahimo sa pagtimbang-timbang niini nga aspeto sa iyang solusyon. Apan alang sa buluhaton nga giatubang sa kini nga kaso, kini nga isyu hinungdanon kaayo, tungod kay ang kasaligan sa ligal nga datos kinahanglan nga adunay usa.

Gikonsiderar ang mga teknolohiya sa pagsulay sa software aron mahibal-an ang kasaligan sa operasyon. Karon adunay labaw pa niini nga mga modelo 200. Daghan sa mga modelo naggamit sa usa ka modelo sa pag-alagad sa pag-angkon:

Limpyohi ang datos sama sa dula nga Bato, Papel, Gunting. Kini ba usa ka dula nga adunay katapusan o wala? Bahin 1. Teoretikal
Mat. 6

Naghunahuna ingon sa mosunod: "Kung ang sayup nga nakit-an usa ka panghitabo nga susama sa pagkapakyas nga panghitabo sa kini nga modelo, kung giunsa pagpangita ang usa ka analogue sa parameter t?" Ug akong gihugpong ang mosunod nga modelo: Atong hunahunaon nga ang panahon nga gikinahanglan sa usa ka tester sa pagsusi sa usa ka rekord mao ang 1 ka minuto (alang sa database sa pangutana), unya sa pagpangita sa tanan nga mga sayop nga siya kinahanglan nga 365 minutos, nga mao ang gibana-bana nga 494 ka tuig ug 3 mga bulan sa oras sa pagtrabaho. Sama sa among nasabtan, kini usa ka dako kaayo nga kantidad sa trabaho ug ang mga gasto sa pagsusi sa database mahimong gidili alang sa tigtipon niini nga database. Niini nga pagpamalandong, ang konsepto sa ekonomiya sa mga gasto nagpakita ug pagkahuman sa pag-analisar nakahinapos ako nga kini usa ka epektibo nga himan. Pinasukad sa balaod sa ekonomiya: "Ang gidaghanon sa produksiyon (sa mga yunit) diin ang labing taas nga ganansya sa usa ka kompanya nakab-ot nahimutang sa punto diin ang marginal nga gasto sa paghimo usa ka bag-ong yunit sa output gitandi sa presyo nga madawat sa kompanya. para sa bag-ong unit.” Pinasukad sa postulate nga ang pagpangita sa matag sunod nga sayup nanginahanglan dugang ug dugang nga pagsusi sa mga rekord, kini usa ka hinungdan sa gasto. Sa ato pa, ang postulate nga gisagop sa mga modelo sa pagsulay adunay pisikal nga kahulugan sa mosunod nga sumbanan: kung aron makit-an ang i-th nga sayup kinahanglan nga susihon ang n mga rekord, nan aron makit-an ang sunod nga (i + 3) nga sayup kinahanglan. sa pagsusi m mga rekord ug sa samang higayon n

  1. Kung ang gidaghanon sa mga rekord nga gisusi sa wala pa makit-an ang usa ka bag-ong sayup nga nagpalig-on;
  2. Kung ang gidaghanon sa mga rekord nga gisusi sa wala pa makit-an ang sunod nga sayup modaghan.

Aron mahibal-an ang kritikal nga kantidad, akong gipunting ang konsepto sa posibilidad sa ekonomiya, nga sa kini nga kaso, gamit ang konsepto sa mga gasto sa sosyal, mahimong maporma ingon sa mosunod: "Ang mga gasto sa pagtul-id sa sayup kinahanglan nga abagahon sa ahente sa ekonomiya nga makahimo. kini sa pinakaubos nga kantidad.” Kami adunay usa ka ahente - usa ka tester nga mogugol ug 1 ka minuto sa pagsusi sa usa ka rekord. Sa mga termino sa kwarta, kung mokita ka og 6000 rubles/adlaw, kini mahimong 12,2 rubles. (gibanabana karon). Nagpabilin kini aron mahibal-an ang ikaduhang bahin sa panimbang sa balaod sa ekonomiya. Nangatarungan ko nga ingon niini. Ang usa ka kasamtangan nga sayop nagkinahanglan sa tawo nga hingtungdan nga mogasto og paningkamot sa pagtul-id niini, nga mao, ang tag-iya sa propiedad. Ingnon ta nga nanginahanglan kini og 1 ka adlaw nga aksyon (pagsumite usa ka aplikasyon, pagdawat usa ka gitul-id nga dokumento). Unya, gikan sa sosyal nga panglantaw, ang iyang gasto mahimong katumbas sa kasagaran nga sweldo kada adlaw. Average nga natigom nga suweldo sa Khanty-Mansi Autonomous Okrug "Mga resulta sa socio-economic development sa Khanty-Mansiysk Autonomous Okrug - Ugra alang sa Enero-Septyembre 2019" 73285 nga rub. o 3053,542 rubles/adlaw. Tungod niini, nakakuha kami usa ka kritikal nga kantidad nga katumbas sa:
3053,542: 12,2 = 250,4 ka yunit sa mga rekord.

Kini nagpasabot, gikan sa sosyal nga panglantaw, kung ang usa ka tester nagsusi sa 251 nga mga rekord ug nakit-an ang usa ka sayup, kini katumbas sa tiggamit nga nag-ayo niini nga sayup sa iyang kaugalingon. Tungod niini, kung ang tigsulay migahin ug oras nga katumbas sa pagsusi sa 252 nga mga rekord aron makit-an ang sunod nga sayup, nan sa kini nga kaso mas maayo nga ibalhin ang gasto sa pagtul-id sa tiggamit.

Ang usa ka gipayano nga pamaagi gipresentar dinhi, tungod kay gikan sa usa ka sosyal nga punto sa pagtan-aw kinahanglan nga tagdon ang tanan nga dugang nga kantidad nga nahimo sa matag espesyalista, nga mao, ang mga gasto nga gikonsiderar ang mga buhis ug pagbayad sa sosyal, apan ang modelo klaro. Ang sangputanan niini nga relasyon mao ang mosunod nga kinahanglanon alang sa mga espesyalista: ang usa ka espesyalista gikan sa industriya sa IT kinahanglan adunay suweldo nga mas dako kaysa sa nasudnon nga average. Kung ang iyang suweldo mas ubos kaysa kasagaran nga suweldo sa mga potensyal nga tiggamit sa database, siya mismo kinahanglan nga susihon ang tibuuk nga database sa kamot-sa-kamot.

Kung gigamit ang gihulagway nga sukdanan, ang una nga kinahanglanon alang sa kalidad sa database naporma:
Ako(tr). Ang bahin sa kritikal nga mga sayup kinahanglan dili molapas sa 1/250,4 = 0,39938%. Mas gamay kay sa pagdalisay bulawan sa industriya. Ug sa pisikal nga termino wala'y labaw pa sa 1459 nga mga rekord nga adunay mga sayup.

Pag-atras sa ekonomiya.

Sa tinuud, pinaagi sa paghimo sa daghang mga sayup sa mga rekord, ang katilingban miuyon sa mga pagkawala sa ekonomiya sa kantidad nga:

1459*3053,542 = 4 rubles.

Kini nga kantidad gitino sa kamatuoran nga ang katilingban walay mga himan sa pagpakunhod niini nga mga gasto. Gisundan niini nga kung adunay usa ka tawo nga adunay teknolohiya nga nagtugot kanila sa pagpakunhod sa gidaghanon sa mga rekord nga adunay mga sayup sa, pananglitan, 259, nan kini magtugot sa katilingban nga makaluwas:
1200*3053,542 = 3 rubles.

Apan sa samang higayon, makapangayo siya sa iyang talento ug trabaho, maayo, ingnon ta - 1 milyon nga rubles.
Sa ato pa, ang mga gasto sa sosyal gikunhuran pinaagi sa:

3 – 664 = 250 ka rubles.

Sa esensya, kini nga epekto mao ang dugang nga kantidad gikan sa paggamit sa mga teknolohiya sa BigDat.

Apan dinhi kinahanglan nga tagdon nga kini usa ka sosyal nga epekto, ug ang tag-iya sa database mao ang mga awtoridad sa munisipyo, ang ilang kita gikan sa paggamit sa kabtangan nga natala sa kini nga database, sa rate nga 0,3%, mao ang: 2,778 bilyon nga rubles / tuig. Ug kini nga mga gasto (4 rubles) dili kaayo makahasol kaniya, tungod kay kini gibalhin sa mga tag-iya sa kabtangan. Ug, sa kini nga aspeto, ang nag-develop sa labi ka dali nga teknolohiya sa Bigdata kinahanglan magpakita sa katakus sa pagkombinsir sa tag-iya niini nga database, ug ang ingon nga mga butang nanginahanglan daghang talento.

Niini nga pananglitan, ang error assessment algorithm gipili base sa Schumann model [2] sa software verification atol sa reliability testing. Tungod sa pagkaylap niini sa Internet ug ang abilidad sa pagkuha sa gikinahanglan nga mga indikasyon sa istatistika. Ang pamaagi gikuha gikan sa Monakhov Yu.M. "Functional stability sa mga sistema sa impormasyon", tan-awa ubos sa spoiler sa Fig. 7-9.

bugas. 7 – 9 Pamaagi sa modelo sa SchumannLimpyohi ang datos sama sa dula nga Bato, Papel, Gunting. Kini ba usa ka dula nga adunay katapusan o wala? Bahin 1. Teoretikal

Limpyohi ang datos sama sa dula nga Bato, Papel, Gunting. Kini ba usa ka dula nga adunay katapusan o wala? Bahin 1. Teoretikal

Limpyohi ang datos sama sa dula nga Bato, Papel, Gunting. Kini ba usa ka dula nga adunay katapusan o wala? Bahin 1. Teoretikal

Ang ikaduhang bahin niini nga materyal nagpakita sa usa ka pananglitan sa paglimpyo sa datos, diin ang mga resulta sa paggamit sa modelo sa Schumann nakuha.
Tugoti ako nga ipresentar ang mga resulta nga nakuha:
Gibanabana nga gidaghanon sa mga sayop N = 3167 n.
Parameter C, lambda ug reliability function:

Limpyohi ang datos sama sa dula nga Bato, Papel, Gunting. Kini ba usa ka dula nga adunay katapusan o wala? Bahin 1. Teoretikal
Fig. 17

Sa esensya, ang lambda usa ka aktuwal nga timailhan sa intensity diin ang mga sayup nakit-an sa matag yugto. Kung imong tan-awon ang ikaduhang bahin, ang banabana alang sa kini nga timailhan mao ang 42,4 nga mga sayup matag oras, nga medyo ikatandi sa timailhan sa Schumann. Sa ibabaw, gitino nga ang rate sa kung diin ang usa ka developer nakit-an ang mga sayup kinahanglan nga dili moubos sa 1 nga sayup matag 250,4 nga mga rekord, kung susihon ang 1 nga rekord matag minuto. Busa ang kritikal nga bili sa lambda alang sa Schumann nga modelo:

60/250,4 = 0,239617.

Sa ato pa, ang panginahanglan sa paghimo sa mga pamaagi sa pag-ila sa sayup kinahanglan nga himuon hangtod ang lambda, gikan sa naa nga 38,964, mikunhod sa 0,239617.

O hangtod ang timailhan N (potensyal nga gidaghanon sa mga sayup) minus n (gitul-id nga gidaghanon sa mga sayup) mikunhod ubos sa among gidawat nga threshold - 1459 pcs.

Literatura

  1. Monakhov, Yu. M. Functional nga kalig-on sa mga sistema sa impormasyon. Sa mga oras nga 3. Bahin 1. Kasaligan sa software: libro. allowance / Yu. M. Monakhov; Vladimir. estado univ. – Vladimir: Izvo Vladimir. estado Unibersidad, 2011. - 60 p. – ISBN 978-5-9984-0189-3.
  2. Martin L. Shooman, "Probabilistic nga mga modelo alang sa pagtagna sa kasaligan sa software."
  3. Mga sukaranan sa bodega sa datos alang sa mga propesyonal sa IT / Paulraj Ponniah.β€”2nd ed.

Ikaduhang bahin. Teoretikal

Source: www.habr.com

Idugang sa usa ka comment