Datu nodaļa. 2013. gads. Retrospektīvs

Jo 2013 gadā IBS, kas tad, Ŕķiet, radÄ«ja Datu nodaļa, lÅ«dza man veikt Ŕādu prāta izplÅ«di (tikai pamatojoties uz pieredzi mijiedarbÄ«bā ar korporatÄ«vajiem naftas un gāzes klientiem) attiecÄ«bā uz Big Data problēmzonu un datiem kopumā. Tāpēc es to saskāros pēc 7 gadiem un domāju, ka tas ir smieklÄ«gi. Dažas lietas ir acÄ«mredzamas. Dažas izrādÄ«jās ne lÄ«dz galam patiesas, bet... ir pagājuÅ”i 7 gadi.

Rakstīju angliski un tagad izdomāju pārtulkot krieviski. Ko darīt, ja kaut kas joprojām ir aktuāls? (TulkoŔu biļetenus, bet zīmes angļu valodā atstāju aiz slinkuma. ZaļŔ ir labs, sarkans ir bīstams, zils ir sapnis).

Es formalizÄ“Å”u minimālos komentārus no ā€œÅ”odienasā€ itāļu valodalai tas bÅ«tu skaidrs un atŔķirams.

Tātad, DATI! Dati mums...

Datu nodaļa ir Asins nodaļa, jo datus var salÄ«dzināt, piemēram, ar asinÄ«m, kas plÅ«st pa uzņēmuma vēnām un artērijām. Tomēr, lai gan asinis ir vienādas, organismi ir atŔķirÄ«gi un tāpēc produkciju ļoti grÅ«ti, taču tā ir arÄ« attÄ«stÄ«bas iespēja.

Ir cilvēki, kuriem dati lec tieÅ”i acÄ«s ā€“ tādi ir Mēs.
Un ir cilvēki, kuri diemžēl neredz datu punktu tukÅ”u. Diemžēl tas atkal ir mÅ«su Klienti!

Datu nodaļa. 2013. gads. Retrospektīvs

Tātad, biznesa principi...

  1. Pārdod BiznessUn ne IT (lai visi IT speciālisti man piedod uzreiz), jo mēs risinām pasaules problēmas un, labi, vairāk naudas.
  2. Visas biznesa problēmas ir koncentrētas ap tematiskajām nozares vertikālēm, un tām bÅ«s nepiecieÅ”amas atbilstoÅ”as specializācijas.
  3. Mēģinājumi pierādÄ«t "datu" vērtÄ«ba vai, vēl grÅ«tāk, ā€œdatu pārvaldÄ«basā€ vērtÄ«ba uzņēmumam ir mūžīgas cieÅ”anas un sāpes. BÅ«tÄ«bā tas ir tāpat kā pienākt pie cilvēka, kurÅ” jÅ«tas labi, un pateikt: "DruÅ”, mēs tagad ārstēsim tavas asinis, un, vecÄ«t, tas ir dārgi!"
  4. Mans "slapjais sapnis" ir pārdot "datu ieguvi" un "analīzi" SaaS modelī mazie un vidējie uzņēmumikuri iekļuva 123 mākoņpakalpojumos ar lieliskām saskarnēm: projektu vadība, palīdzības dienests, grāmatvedība, CRM, algu uzskaite, laika atskaite, mārketings, ... jūs to nosaucat, un ieslēpa sevi datos. Youcalc un Successfactors (laikam tādu vairs nav) Tas ir labi!
  5. Meklējiet cilvēkus, kuriem patÄ«k lāpÄ«t ā€œkraukŔķēŔanaā€ ar datiem. Tie ir reti un dÄ«vaini (piemēram, tējas lapas), taču tie ir biznesa atslēga. Piemēram, dzejnieks var bÅ«t ļoti labs korelācijā.
  6. Inženieri vajadzÄ«gs! NepiecieÅ”ams, lai problēmas, ko Crunchers izvilka no datiem, pārvērstu risinājumos. Un lēmuma veiksme vai neveiksme ir pilnÄ«bā atkarÄ«ga no viņiem.
  7. AttÄ«stÄ«ba opensource projekti ir ļoti vērtÄ«gi un ļauj praktiski no nulles ā€œsaliktā€ sarežģītus risinājumus.
  8. Bet... mēs nedrīkstam aizmirst, ka Hadoop ir bibliotēka, un Lucene ir arī bibliotēka, un attālums starp tiem bibliotēka un industriālais produkts daudz!
  9. BÅ«vētie risinājumi bÅ«s bÅ«tiski jāpielāgo, jo modularitāte Šø integrējamÄ«ba - galvenie punkti.
  10. Agile (Dievs man piedod) ir galvenais paņēmiens mijiedarbībā ar klientu un pārbaudē hipotēzes, kuru būs daudz.
  11. ÄŖpaÅ”i iespējams un nepiecieÅ”ams visu kodÄ“Å”anu un lietotāja saskarni nodot ārpakalpojumu sniedzējiem. Visa biznesa analÄ«ze un specifikācijas aizmugure vajag aiziet laikā un tiek uzskatÄ«ta par pamatkompetenci.
  12. UzņēmējdarbÄ«bas lēmumu pieņēmējiem ir pastāvÄ«gi jābÅ«t ā€œinformētiemā€. nepiecieÅ”amÄ«ba pareizi strādāt ar datiem un pastāvÄ«gi meklē jaunus veidus, kā tos analizēt. MÅ«su darbinieku tehnisko un biznesa kompetenču apvienoÅ”ana palÄ«dzēs paaugstināt visas organizācijas statusu kopumā.
  13. Internets ā€“ ir bezgalÄ«gs iedvesmas avots (toreiz kaÄ·u nebija tik daudz) saistÄ«bā ar pieejām uzņēmuma datu pārvaldÄ«bai, lai gan mērÄ·i un darbÄ«bas joma ievērojami atŔķiras.

Datu nodaļa. 2013. gads. Retrospektīvs

Tehnoloģiskie postulāti...

  1. Tajā ir milzÄ«gs attÄ«stÄ«bas potenciāls vienkārÅ”oÅ”ana kā dati tiek rādÄ«ti cilvēkiem. To var saukt par vārdu ā€œiPhonizationā€.
  2. Neskatoties uz to, ka BI pārdevēji apgalvo, ka viņi ir tieÅ”i sniegt analÄ«zi gala lietotājiem, (un viņi noteikti virzās Å”ajā virzienā) - izrāviens vēl nav noticis. Cilvēki vienkārÅ”i nesaprot labi daudzdimensionāls datus.
  3. Lietotāja saskarne, kas attēlo vairāk vai mazāk sarežģītus, vāji strukturētus datus slÄ«pēta forma ā€” rada arÄ« bezgalÄ«gi daudz problēmu. Secinājums: jo plakanāks, jo labāk.
  4. Platforma, kas izveidota, pamatojoties uz automātisku datu ieguvi no avotiem (kas ne vienmēr ir paredzēta Ŕādai ieguvei), ir bÅ«tiski atkarÄ«ga no avotiem, savienotāju stabilitātes un infrastruktÅ«ras. Platforma (ziņnesis) vienmēr tiks vainota par rezultātu nesniegÅ”anu. Uzticieties ā€“ Ŕāda veida platformu kapitāls. Kapitāls, kuru ir grÅ«ti nopelnÄ«t un viegli zaudēt.
  5. No biznesa viedokļa nav atŔķirÄ«bas starp lielo datu analÄ«zi un Tikai dati. Bieži vien aiz tādiem vienkārÅ”iem skaitļiem kā 2x2 slēpjas miljoniem dolāru vērtas iespējas. Labs piemērs ir dati par infrastruktÅ«ras elementu dzÄ«ves beigām Norvēģijas plauktā. Kad ir visi nākotnes vāciņu datumi. uz vienas ass tika likts visu iekārtu remonts un uzzinot, ka pēc N gadiem nāk plaukts Armagedons - viens ļoti turÄ«gs vÄ«rietis piecēlās no krēsla un steigÅ”us paklanÄ«jās no istabas ar vārdiem: ā€œPiedod, es nē. man ir daudz laika, man jāsagatavo flote...ā€
  6. Programmai Excel un būtībā skaidrai un kodolīgai datu tabulas prezentācijai ir milzīgs spēks un liela nākotne. Es ticu skaistiem galdiem (un joprojām dara) un viss!
  7. Visas Ŕīs ā€œanalÄ«tikasā€ galvenais priekÅ”gals ir lēmumu automatizācija. Ir vislielākās iespējas, bet arÄ« augstākie riski, tāpēc iespējas ir bagātÄ«gas, tāpēc ir riski, tāpēc ir iespējas, tāpēc tie ir Ä«risi... šŸ™‚ Aku urbÅ”anas vadÄ«ba, piemēram...
  8. Ja ā€œintegrējamÄ«baā€ ir galvenā iezÄ«me, dati de facto ir jāuzrāda kā pakalpojums. ATPÅŖTA noteikumi, taču mēs nedrÄ«kstam aizmirst par optimizāciju produktivitāte, kas tagad bieži tiek upurēta integrējamÄ«bas labad, jo skaitļoÅ”anas jauda turpina pieaugt.
  9. Pamatdati - tas ir tas, kas ir jālokalizē, jāizvelk, jāstandartizē pirms jebkādu biznesa problēmu risināŔanas. Pamatdati ir mazi, bet problēmas ar tiem lielas! Kā saka semantikas brāļi, 50% no visām pasaules problēmām ir tāpēc, ka cilvēki sauc vienas un tās paÅ”as lietas dažādos vārdos, bet pārējie 50% ir tāpēc, ka viņi sauc dažādas lietas vienā vārdā.
  10. jebkurÅ” iekapsulÄ“Å”ana krātuves lÄ«menÄ« tas ierobežo risinājuma atvērtÄ«bu un noved pie SILO-fikācijas. Ir labi, ja esat liels pārdevējs, pretējā gadÄ«jumā tas ir tik un tā. (Å eit mēs, protams, nerunājam par bloka lÄ«meni un nevis par AWS S3, kam toreiz jau bija 6 gadi, bet gan par failiem).
  11. Relāciju modelÄ“Å”ana dati vairs nav mÅ«su draugs. RDF un atslēgas vērtÄ«ba ā€“ forÅ”i! Mēs esam redzējuÅ”i maÄ£iskas relāciju datu bāzu transformācijas ar 2000 tabulu modeļiem 15 tabulās, un neviens no lietotājiem neko nezaudēja.
  12. Internets darbojas, jo tas pastāv URL kā vienotu adresācijas metodi. URL vai drīzāk nozīme URI uzņēmuma informācijas resursus ir grūti pārvērtēt.
  13. Teksta ieguve un NLP ir populāri. Internetā. Bet pat korporatīvajā sektorā lielus panākumus var gūt, iegūstot strukturētus datus no nestrukturētiem korporatīvajiem datiem.
  14. SinerÄ£ija starp strukturētiem datiem un informāciju, kas iegÅ«ta no nestrukturētiem datiem, t.i. faili ā€“ analÄ«tiskā Klondaika.
  15. Iegūstot datus, neaizmirstiet par tiesībām un autortiesības.
  16. Datu ieguves uzņēmumam ir jāveido ahakeru nodaļa, vārda labā nozīmē. Iedvesmojoties no kalnup cīņas pret Yellow Pages rāpuļbotu aizsardzības sistēmām.
  17. Pirms darba ar datiem, ir nepiecieÅ”ams "redzēt" kopumā. GrÅ«ti izskaidrot. Prātā nāk tabulas formas. Dažiem grafiski attēlojumi, bet jebkurÅ” grafiks jau ir interpretācija. Tā vai citādi... ā€œredziā€!
  18. Atkārtota lietotāja ā€œuzticÄ“Å”anāsā€ problēma priekÅ”galā. UzticÄ«ba savienotājiem/datu Ä£enerÄ“Å”anas procesiem, uzticÄ“Å”anās datiem, uzticÄ«ba pieņemtajiem lēmumiem.

Avots: www.habr.com

Pievieno komentāru