กองข้อมูล. ปี 2013 ย้อนหลัง

ใน 2013 ปี IBSซึ่งดูเหมือนว่าจะกำลังสร้าง กองข้อมูลขอให้ฉันระดมความคิด (เฉพาะจากประสบการณ์การมีปฏิสัมพันธ์กับลูกค้าน้ำมันและก๊าซขององค์กร) เกี่ยวกับประเด็นปัญหาของ Big Data และข้อมูลโดยทั่วไป ฉันก็เลยมาเจอมันในอีก 7 ปีต่อมา และคิดว่ามันตลกดี บางสิ่งบางอย่างก็ชัดเจน บางเรื่องกลับกลายเป็นว่าไม่เป็นความจริงทั้งหมด แต่... 7 ปีผ่านไป

ฉันเขียนเป็นภาษาอังกฤษและตอนนี้ฉันคิดว่าจะแปลเป็นภาษารัสเซีย จะเกิดอะไรขึ้นหากบางสิ่งยังคงเกี่ยวข้องอยู่ในขณะนี้? (ฉันจะแปลกระดานข่าว แต่ปล่อยให้ป้ายเป็นภาษาอังกฤษเพื่อความเกียจคร้าน สีเขียวคือดี สีแดงคืออันตราย สีน้ำเงินคือความฝัน)

ฉันจะเรียบเรียงความคิดเห็นขั้นต่ำจาก "วันนี้" ภาษาอิตาลีเพื่อให้เกิดความชัดเจนและแยกแยะได้

ดังนั้นข้อมูล! ข้อมูลสำหรับเรา...

แผนกข้อมูลคือแผนกเลือด เนื่องจากข้อมูลสามารถเปรียบเทียบได้ เช่น กับเลือดที่ไหลผ่านหลอดเลือดดำและหลอดเลือดแดงขององค์กรธุรกิจ อย่างไรก็ตาม แม้ว่าเลือดจะเหมือนกัน แต่สิ่งมีชีวิตก็ต่างกันด้วยเหตุนี้ การผลิต ยากมากแต่ก็ถือเป็นโอกาสในการพัฒนาเช่นกัน

มีคนที่ข้อมูลกระโจนเข้าตา - เหล่านี้คือ เรา.
และยังมีคนที่น่าเสียดายที่ไม่เห็นจุดข้อมูลว่างเปล่า อนิจจานี่เป็นของเราอีกครั้ง ลูกค้า!

กองข้อมูล. ปี 2013 ย้อนหลัง

ดังนั้น หลักการดำเนินธุรกิจ...

  1. เราขาย ธุรกิจและไม่ มัน (ขอให้ผู้เชี่ยวชาญด้านไอทีทุกคนยกโทษให้ฉันทันที) เพราะเรากำลังแก้ไขปัญหาของโลกและก็เงินมากขึ้นด้วย
  2. ปัญหาทางธุรกิจทั้งหมดจะกระจุกตัวอยู่ในแนวดิ่งของอุตสาหกรรมและจะต้องมีความเพียงพอ ความเชี่ยวชาญ.
  3. ความพยายามที่จะพิสูจน์ คุณค่าของ "ข้อมูล" หรือที่ยากยิ่งกว่านั้น คุณค่าของ “การจัดการข้อมูล” ต่อธุรกิจคือความทุกข์ทรมานและความเจ็บปวดชั่วนิรันดร์ โดยพื้นฐานแล้วมันเหมือนกับการไปหาคนที่รู้สึกดีแล้วพูดว่า: “เพื่อน เราจะรักษาเลือดของคุณตอนนี้ และเพื่อน มันแพง!”
  4. “ความฝันอันเปียกชื้น” ของฉันคือการขาย “การดึงข้อมูล” และ “การวิเคราะห์” ภายในโมเดล SaaS ธุรกิจขนาดเล็กและขนาดกลางผู้ก้าวเข้าสู่บริการคลาวด์ 123 บริการพร้อมอินเทอร์เฟซสุดเจ๋ง: การจัดการโครงการ โปรแกรมช่วยเหลือ การบัญชี CRM บัญชีเงินเดือน การรายงานเวลา การตลาด ... อะไรก็ได้ตามใจชอบ และฝังตัวเองอยู่ในข้อมูล Youcalc และปัจจัยแห่งความสำเร็จ (คงไม่มีอีกแล้ว) ดีจัง!
  5. ตามหาคนที่ชอบคนจรจัด "กระทืบ" พร้อมข้อมูล เป็นของหายากและแปลก (เช่น ใบชา) แต่เป็นกุญแจสำคัญในการดำเนินธุรกิจ ตัวอย่างเช่น กวีสามารถมีความสัมพันธ์กันได้เป็นอย่างดี
  6. วิศวกร จำเป็น! จำเป็นต้องเปลี่ยนปัญหาที่ Crunchers ดึงมาจากข้อมูลมาเป็นแนวทางแก้ไข และความสำเร็จหรือความล้มเหลวของการตัดสินใจนั้นขึ้นอยู่กับพวกเขาทั้งหมด
  7. พัฒนาการ โอเพ่นซอร์ส โครงการมีคุณค่าอย่างยิ่งและทำให้สามารถ "รวบรวม" โซลูชันที่ซับซ้อนได้จริงตั้งแต่เริ่มต้น
  8. แต่... เราต้องไม่ลืมว่า Hadoop คือห้องสมุด และ Lucene ก็คือห้องสมุด และระยะห่างระหว่างกัน ห้องสมุดและผลิตภัณฑ์อุตสาหกรรม มาก!
  9. โซลูชั่นที่สร้างขึ้นจะต้องได้รับการปรับเปลี่ยนอย่างมากเพราะว่า ความเป็นโมดูลาร์ и บูรณาการได้ - ประเด็นสำคัญ
  10. เปรียว (พระเจ้ายกโทษให้ฉัน) เป็นเทคนิคสำคัญในการโต้ตอบกับลูกค้าและการตรวจสอบ สมมติฐานซึ่งก็จะมีมากมาย
  11. มีความเป็นไปได้และจำเป็นเป็นพิเศษในการจ้างบุคคลภายนอกในการเขียนโค้ดและ UI ทั้งหมด การวิเคราะห์และข้อกำหนดทางธุรกิจทั้งหมด แบ็กเอนด์ จำเป็นต้องออกไป ภายใน และถือเป็นความสามารถหลัก
  12. ผู้มีอำนาจตัดสินใจทางธุรกิจจะต้องได้รับ "ข้อมูล" อย่างต่อเนื่อง ความจำเป็นในการทำงานกับข้อมูลอย่างเหมาะสม และค้นหาวิธีใหม่ๆ ในการวิเคราะห์อย่างต่อเนื่อง การผสมผสานระหว่างความสามารถทางเทคนิคและทางธุรกิจของพนักงานของเราจะช่วยยกระดับสถานะของทั้งองค์กรโดยรวม
  13. อินเทอร์เน็ต – มีแหล่งที่มาของแรงบันดาลใจไม่มีที่สิ้นสุด (สมัยนั้นมีแมวไม่มากนัก) ที่เกี่ยวข้องกับแนวทางการจัดการข้อมูลองค์กร แม้ว่าวัตถุประสงค์และขอบเขตจะแตกต่างกันอย่างมีนัยสำคัญ

กองข้อมูล. ปี 2013 ย้อนหลัง

สมมุติฐานทางเทคโนโลยี...

  1. มีศักยภาพในการพัฒนาอย่างมากใน ลดความซับซ้อน ข้อมูลจะแสดงต่อผู้คนอย่างไร คุณสามารถเรียกสิ่งนี้ว่า "iPhonization"
  2. แม้ว่าผู้ขาย BI จะอ้างว่าตนโดยตรงก็ตาม นำการวิเคราะห์มาสู่ผู้ใช้ปลายทาง, (และพวกเขากำลังเคลื่อนไปในทิศทางนี้อย่างแน่นอน) - การพัฒนายังไม่เกิดขึ้น คนก็ไม่เข้าใจอยู่ดี หลายมิติ ข้อมูล.
  3. อินเทอร์เฟซผู้ใช้ที่แสดงข้อมูลที่มีโครงสร้างอย่างหลวมๆ ที่ซับซ้อนไม่มากก็น้อย เหลี่ยมเพชรพลอย รูปแบบ - ยังนำเสนอปัญหามากมายไม่รู้จบ สรุป: ยิ่งประจบยิ่งดี
  4. แพลตฟอร์มที่สร้างขึ้นบนพื้นฐานของการแยกข้อมูลจากแหล่งที่มาโดยอัตโนมัติ (ซึ่งไม่ได้ออกแบบมาสำหรับการแยกข้อมูลดังกล่าวเสมอไป) ขึ้นอยู่กับแหล่งที่มา ความเสถียรของตัวเชื่อมต่อ และโครงสร้างพื้นฐานอย่างมาก แพลตฟอร์ม (ผู้ส่งสาร) จะถูกตำหนิเสมอว่าล้มเหลวในการส่งมอบผลลัพธ์ ความมั่นใจ – ทุนของแพลตฟอร์มประเภทนี้ ทุนที่หาได้ยากและขาดทุนง่าย
  5. จากมุมมองทางธุรกิจ ไม่มีความแตกต่างระหว่างการวิเคราะห์ Big Data และ เพียงแค่ข้อมูล. มักจะอยู่เบื้องหลังตัวเลขง่ายๆ เช่น 2x2 โอกาสที่มีมูลค่านับล้านเหรียญสหรัฐ ตัวอย่างที่ดีคือข้อมูลเกี่ยวกับการสิ้นสุดอายุการใช้งานขององค์ประกอบโครงสร้างพื้นฐานบนชั้นวางของนอร์เวย์ เมื่อถึงวันทั้งหมดของตัวพิมพ์ใหญ่ในอนาคต การซ่อมแซมอุปกรณ์ทั้งหมดวางอยู่บนแกนเดียวและพวกเขาพบว่าในอีก N ปีชั้นวางของ Armageddon กำลังจะมาถึง - ชายผู้มั่งคั่งคนหนึ่งลุกขึ้นจากเก้าอี้แล้วโค้งคำนับออกจากห้องอย่างเร่งรีบพร้อมคำว่า: "ขอโทษฉันไม่ มีเวลามาก ฉันต้องเตรียมกองเรือ...”
  6. Excel และการนำเสนอข้อมูลแบบตารางที่ชัดเจนและกระชับ มีพลังมหาศาลและอนาคตที่ดี ฉันเชื่อในโต๊ะที่สวยงาม (และยังคงทำอยู่) เท่านี้ก็เรียบร้อย!
  7. สิ่งสำคัญของ "การวิเคราะห์" ทั้งหมดนี้คือ การตัดสินใจอัตโนมัติ. มีโอกาสที่ยิ่งใหญ่ที่สุด แต่ก็มีความเสี่ยงสูงสุดด้วย นั่นคือสาเหตุที่โอกาสมีมากมาย นั่นคือสาเหตุที่มีความเสี่ยง นั่นคือสาเหตุที่มีโอกาส นั่นคือเหตุผลว่าทำไมพวกเขาถึงเป็นท๊อฟฟี่... 🙂 ตัวอย่างเช่น การจัดการที่เจาะลึก...
  8. หาก “ความสามารถในการบูรณาการ” เป็นคุณลักษณะสำคัญ ข้อมูลก็ควรถูกนำเสนอเป็นบริการโดยพฤตินัย REST กฎเกณฑ์ แต่เราต้องไม่ลืมเกี่ยวกับการเพิ่มประสิทธิภาพ ผลผลิตซึ่งปัจจุบันมักถูกเสียสละเพื่อความสามารถในการบูรณาการเนื่องจากพลังการประมวลผลยังคงเติบโตอย่างต่อเนื่อง
  9. ข้อมูลหลัก - นี่คือสิ่งที่จำเป็นต้องได้รับการแปล คัดแยก และทำให้เป็นมาตรฐาน ก่อนที่จะแก้ไขปัญหาทางธุรกิจใดๆ ข้อมูลหลักมีขนาดเล็ก แต่ปัญหานั้นใหญ่! ดังที่พี่น้องแห่งความหมายศาสตร์กล่าวไว้ 50% ของปัญหาในโลกนี้เกิดจากการที่ผู้คนเรียกสิ่งเดียวกันโดยใช้ชื่อต่างกัน และอีก 50% เป็นเพราะเรียกสิ่งเดียวกันด้วยชื่อเดียวกัน
  10. ใด การห่อหุ้ม ที่ระดับการจัดเก็บ จะจำกัดการเปิดกว้างของโซลูชันและนำไปสู่ ​​SILO-fication เป็นเรื่องดีถ้าคุณเป็นผู้ขายรายใหญ่ ไม่อย่างนั้นก็เฉยๆ (แน่นอนว่าเรากำลังพูดถึงที่นี่ ไม่เกี่ยวกับระดับบล็อก และไม่เกี่ยวกับ AWS S3 ซึ่งตอนนั้นมีอายุ 6 ปีแล้ว แต่เกี่ยวกับไฟล์).
  11. การสร้างแบบจำลองเชิงสัมพันธ์ ข้อมูลไม่ใช่เพื่อนของเราอีกต่อไป RDF และคีย์-ค่า – เจ๋ง! เราได้เห็นการเปลี่ยนแปลงอย่างน่าอัศจรรย์ของฐานข้อมูลเชิงสัมพันธ์จากโมเดล 2000 ตารางเป็น 15 ตาราง และไม่มีผู้ใช้คนใดสูญเสียอะไรเลย
  12. อินเทอร์เน็ตใช้งานได้เพราะมันมีอยู่จริง URL เป็นวิธีการจัดการที่เป็นเอกภาพ ความสำคัญของ URL หรือมากกว่า URI สำหรับทรัพยากรข้อมูลขององค์กรนั้นยากที่จะประเมินค่าสูงไป
  13. การทำเหมืองข้อความและ NLP เป็นที่นิยม. ในอินเตอร์เน็ต. แต่แม้แต่ในภาคองค์กร ความสำเร็จที่ยิ่งใหญ่ก็สามารถบรรลุได้โดยการดึงข้อมูลที่มีโครงสร้างออกจากข้อมูลองค์กรที่ไม่มีโครงสร้าง
  14. ทำงานร่วมกัน ระหว่างข้อมูลที่มีโครงสร้างกับข้อมูลที่ดึงมาจากข้อมูลที่ไม่มีโครงสร้าง เช่น ไฟล์ – Klondike เชิงวิเคราะห์
  15. เมื่อทำการดึงข้อมูลอย่าลืมเกี่ยวกับสิทธิ์และ ลิขสิทธิ์.
  16. บริษัทสกัดข้อมูลจะต้องจัดตั้งกแผนกแฮกเกอร์ในความหมายที่ดีของคำ แรงบันดาลใจจากการต่อสู้ที่ยากลำบากกับระบบป้องกันบอทของโปรแกรมรวบรวมข้อมูลสมุดหน้าเหลือง
  17. ก่อนที่จะทำงานกับข้อมูลจำเป็นต้องทำ "ดู" ในสิ่งทั้งปวง. มันยากที่จะอธิบาย แบบฟอร์มตารางอยู่ในใจ สำหรับบางคน การแสดงกราฟ แต่กราฟใดๆ ก็เป็นการตีความอยู่แล้ว ไม่ทางใดก็ทางหนึ่ง... “เห็น”!
  18. ย้ำปัญหาเรื่อง "ความไว้วางใจ" ของผู้ใช้ในส่วนหน้า ไว้วางใจในตัวเชื่อมต่อ/กระบวนการสร้างข้อมูล ไว้วางใจในข้อมูล ไว้วางใจในการตัดสินใจ.

ที่มา: will.com

เพิ่มความคิดเห็น