ใน 2013 ปี IBSซึ่งดูเหมือนว่าจะกำลังสร้าง กองข้อมูลขอให้ฉันระดมความคิด (เฉพาะจากประสบการณ์การมีปฏิสัมพันธ์กับลูกค้าน้ำมันและก๊าซขององค์กร) เกี่ยวกับประเด็นปัญหาของ Big Data และข้อมูลโดยทั่วไป ฉันก็เลยมาเจอมันในอีก 7 ปีต่อมา และคิดว่ามันตลกดี บางสิ่งบางอย่างก็ชัดเจน บางเรื่องกลับกลายเป็นว่าไม่เป็นความจริงทั้งหมด แต่... 7 ปีผ่านไป
ฉันเขียนเป็นภาษาอังกฤษและตอนนี้ฉันคิดว่าจะแปลเป็นภาษารัสเซีย จะเกิดอะไรขึ้นหากบางสิ่งยังคงเกี่ยวข้องอยู่ในขณะนี้? (ฉันจะแปลกระดานข่าว แต่ปล่อยให้ป้ายเป็นภาษาอังกฤษเพื่อความเกียจคร้าน สีเขียวคือดี สีแดงคืออันตราย สีน้ำเงินคือความฝัน)
ฉันจะเรียบเรียงความคิดเห็นขั้นต่ำจาก "วันนี้" ภาษาอิตาลีเพื่อให้เกิดความชัดเจนและแยกแยะได้
ดังนั้นข้อมูล! ข้อมูลสำหรับเรา...
แผนกข้อมูลคือแผนกเลือด เนื่องจากข้อมูลสามารถเปรียบเทียบได้ เช่น กับเลือดที่ไหลผ่านหลอดเลือดดำและหลอดเลือดแดงขององค์กรธุรกิจ อย่างไรก็ตาม แม้ว่าเลือดจะเหมือนกัน แต่สิ่งมีชีวิตก็ต่างกันด้วยเหตุนี้ การผลิต ยากมากแต่ก็ถือเป็นโอกาสในการพัฒนาเช่นกัน
มีคนที่ข้อมูลกระโจนเข้าตา - เหล่านี้คือ เรา.
และยังมีคนที่น่าเสียดายที่ไม่เห็นจุดข้อมูลว่างเปล่า อนิจจานี่เป็นของเราอีกครั้ง ลูกค้า!
ดังนั้น หลักการดำเนินธุรกิจ...
- เราขาย ธุรกิจและไม่ มัน (ขอให้ผู้เชี่ยวชาญด้านไอทีทุกคนยกโทษให้ฉันทันที) เพราะเรากำลังแก้ไขปัญหาของโลกและก็เงินมากขึ้นด้วย
- ปัญหาทางธุรกิจทั้งหมดจะกระจุกตัวอยู่ในแนวดิ่งของอุตสาหกรรมและจะต้องมีความเพียงพอ ความเชี่ยวชาญ.
- ความพยายามที่จะพิสูจน์ คุณค่าของ "ข้อมูล" หรือที่ยากยิ่งกว่านั้น คุณค่าของ “การจัดการข้อมูล” ต่อธุรกิจคือความทุกข์ทรมานและความเจ็บปวดชั่วนิรันดร์ โดยพื้นฐานแล้วมันเหมือนกับการไปหาคนที่รู้สึกดีแล้วพูดว่า: “เพื่อน เราจะรักษาเลือดของคุณตอนนี้ และเพื่อน มันแพง!”
- “ความฝันอันเปียกชื้น” ของฉันคือการขาย “การดึงข้อมูล” และ “การวิเคราะห์” ภายในโมเดล SaaS ธุรกิจขนาดเล็กและขนาดกลางผู้ก้าวเข้าสู่บริการคลาวด์ 123 บริการพร้อมอินเทอร์เฟซสุดเจ๋ง: การจัดการโครงการ โปรแกรมช่วยเหลือ การบัญชี CRM บัญชีเงินเดือน การรายงานเวลา การตลาด ... อะไรก็ได้ตามใจชอบ และฝังตัวเองอยู่ในข้อมูล Youcalc และปัจจัยแห่งความสำเร็จ (คงไม่มีอีกแล้ว) ดีจัง!
- ตามหาคนที่ชอบคนจรจัด "กระทืบ" พร้อมข้อมูล เป็นของหายากและแปลก (เช่น ใบชา) แต่เป็นกุญแจสำคัญในการดำเนินธุรกิจ ตัวอย่างเช่น กวีสามารถมีความสัมพันธ์กันได้เป็นอย่างดี
- วิศวกร จำเป็น! จำเป็นต้องเปลี่ยนปัญหาที่ Crunchers ดึงมาจากข้อมูลมาเป็นแนวทางแก้ไข และความสำเร็จหรือความล้มเหลวของการตัดสินใจนั้นขึ้นอยู่กับพวกเขาทั้งหมด
- พัฒนาการ โอเพ่นซอร์ส โครงการมีคุณค่าอย่างยิ่งและทำให้สามารถ "รวบรวม" โซลูชันที่ซับซ้อนได้จริงตั้งแต่เริ่มต้น
- แต่... เราต้องไม่ลืมว่า Hadoop คือห้องสมุด และ Lucene ก็คือห้องสมุด และระยะห่างระหว่างกัน ห้องสมุดและผลิตภัณฑ์อุตสาหกรรม มาก!
- โซลูชั่นที่สร้างขึ้นจะต้องได้รับการปรับเปลี่ยนอย่างมากเพราะว่า ความเป็นโมดูลาร์ и บูรณาการได้ - ประเด็นสำคัญ
- เปรียว (พระเจ้ายกโทษให้ฉัน) เป็นเทคนิคสำคัญในการโต้ตอบกับลูกค้าและการตรวจสอบ สมมติฐานซึ่งก็จะมีมากมาย
- มีความเป็นไปได้และจำเป็นเป็นพิเศษในการจ้างบุคคลภายนอกในการเขียนโค้ดและ UI ทั้งหมด การวิเคราะห์และข้อกำหนดทางธุรกิจทั้งหมด แบ็กเอนด์ จำเป็นต้องออกไป ภายใน และถือเป็นความสามารถหลัก
- ผู้มีอำนาจตัดสินใจทางธุรกิจจะต้องได้รับ "ข้อมูล" อย่างต่อเนื่อง ความจำเป็นในการทำงานกับข้อมูลอย่างเหมาะสม และค้นหาวิธีใหม่ๆ ในการวิเคราะห์อย่างต่อเนื่อง การผสมผสานระหว่างความสามารถทางเทคนิคและทางธุรกิจของพนักงานของเราจะช่วยยกระดับสถานะของทั้งองค์กรโดยรวม
- อินเทอร์เน็ต – มีแหล่งที่มาของแรงบันดาลใจไม่มีที่สิ้นสุด (สมัยนั้นมีแมวไม่มากนัก) ที่เกี่ยวข้องกับแนวทางการจัดการข้อมูลองค์กร แม้ว่าวัตถุประสงค์และขอบเขตจะแตกต่างกันอย่างมีนัยสำคัญ
สมมุติฐานทางเทคโนโลยี...
- มีศักยภาพในการพัฒนาอย่างมากใน ลดความซับซ้อน ข้อมูลจะแสดงต่อผู้คนอย่างไร คุณสามารถเรียกสิ่งนี้ว่า "iPhonization"
- แม้ว่าผู้ขาย BI จะอ้างว่าตนโดยตรงก็ตาม นำการวิเคราะห์มาสู่ผู้ใช้ปลายทาง, (และพวกเขากำลังเคลื่อนไปในทิศทางนี้อย่างแน่นอน) - การพัฒนายังไม่เกิดขึ้น คนก็ไม่เข้าใจอยู่ดี หลายมิติ ข้อมูล.
- อินเทอร์เฟซผู้ใช้ที่แสดงข้อมูลที่มีโครงสร้างอย่างหลวมๆ ที่ซับซ้อนไม่มากก็น้อย เหลี่ยมเพชรพลอย รูปแบบ - ยังนำเสนอปัญหามากมายไม่รู้จบ สรุป: ยิ่งประจบยิ่งดี
- แพลตฟอร์มที่สร้างขึ้นบนพื้นฐานของการแยกข้อมูลจากแหล่งที่มาโดยอัตโนมัติ (ซึ่งไม่ได้ออกแบบมาสำหรับการแยกข้อมูลดังกล่าวเสมอไป) ขึ้นอยู่กับแหล่งที่มา ความเสถียรของตัวเชื่อมต่อ และโครงสร้างพื้นฐานอย่างมาก แพลตฟอร์ม (ผู้ส่งสาร) จะถูกตำหนิเสมอว่าล้มเหลวในการส่งมอบผลลัพธ์ ความมั่นใจ – ทุนของแพลตฟอร์มประเภทนี้ ทุนที่หาได้ยากและขาดทุนง่าย
- จากมุมมองทางธุรกิจ ไม่มีความแตกต่างระหว่างการวิเคราะห์ Big Data และ เพียงแค่ข้อมูล. มักจะอยู่เบื้องหลังตัวเลขง่ายๆ เช่น 2x2 โอกาสที่มีมูลค่านับล้านเหรียญสหรัฐ ตัวอย่างที่ดีคือข้อมูลเกี่ยวกับการสิ้นสุดอายุการใช้งานขององค์ประกอบโครงสร้างพื้นฐานบนชั้นวางของนอร์เวย์ เมื่อถึงวันทั้งหมดของตัวพิมพ์ใหญ่ในอนาคต การซ่อมแซมอุปกรณ์ทั้งหมดวางอยู่บนแกนเดียวและพวกเขาพบว่าในอีก N ปีชั้นวางของ Armageddon กำลังจะมาถึง - ชายผู้มั่งคั่งคนหนึ่งลุกขึ้นจากเก้าอี้แล้วโค้งคำนับออกจากห้องอย่างเร่งรีบพร้อมคำว่า: "ขอโทษฉันไม่ มีเวลามาก ฉันต้องเตรียมกองเรือ...”
- Excel และการนำเสนอข้อมูลแบบตารางที่ชัดเจนและกระชับ มีพลังมหาศาลและอนาคตที่ดี ฉันเชื่อในโต๊ะที่สวยงาม (และยังคงทำอยู่) เท่านี้ก็เรียบร้อย!
- สิ่งสำคัญของ "การวิเคราะห์" ทั้งหมดนี้คือ การตัดสินใจอัตโนมัติ. มีโอกาสที่ยิ่งใหญ่ที่สุด แต่ก็มีความเสี่ยงสูงสุดด้วย นั่นคือสาเหตุที่โอกาสมีมากมาย นั่นคือสาเหตุที่มีความเสี่ยง นั่นคือสาเหตุที่มีโอกาส นั่นคือเหตุผลว่าทำไมพวกเขาถึงเป็นท๊อฟฟี่... 🙂 ตัวอย่างเช่น การจัดการที่เจาะลึก...
- หาก “ความสามารถในการบูรณาการ” เป็นคุณลักษณะสำคัญ ข้อมูลก็ควรถูกนำเสนอเป็นบริการโดยพฤตินัย REST กฎเกณฑ์ แต่เราต้องไม่ลืมเกี่ยวกับการเพิ่มประสิทธิภาพ ผลผลิตซึ่งปัจจุบันมักถูกเสียสละเพื่อความสามารถในการบูรณาการเนื่องจากพลังการประมวลผลยังคงเติบโตอย่างต่อเนื่อง
- ข้อมูลหลัก - นี่คือสิ่งที่จำเป็นต้องได้รับการแปล คัดแยก และทำให้เป็นมาตรฐาน ก่อนที่จะแก้ไขปัญหาทางธุรกิจใดๆ ข้อมูลหลักมีขนาดเล็ก แต่ปัญหานั้นใหญ่! ดังที่พี่น้องแห่งความหมายศาสตร์กล่าวไว้ 50% ของปัญหาในโลกนี้เกิดจากการที่ผู้คนเรียกสิ่งเดียวกันโดยใช้ชื่อต่างกัน และอีก 50% เป็นเพราะเรียกสิ่งเดียวกันด้วยชื่อเดียวกัน
- ใด การห่อหุ้ม ที่ระดับการจัดเก็บ จะจำกัดการเปิดกว้างของโซลูชันและนำไปสู่ SILO-fication เป็นเรื่องดีถ้าคุณเป็นผู้ขายรายใหญ่ ไม่อย่างนั้นก็เฉยๆ (แน่นอนว่าเรากำลังพูดถึงที่นี่ ไม่เกี่ยวกับระดับบล็อก และไม่เกี่ยวกับ AWS S3 ซึ่งตอนนั้นมีอายุ 6 ปีแล้ว แต่เกี่ยวกับไฟล์).
- การสร้างแบบจำลองเชิงสัมพันธ์ ข้อมูลไม่ใช่เพื่อนของเราอีกต่อไป RDF และคีย์-ค่า – เจ๋ง! เราได้เห็นการเปลี่ยนแปลงอย่างน่าอัศจรรย์ของฐานข้อมูลเชิงสัมพันธ์จากโมเดล 2000 ตารางเป็น 15 ตาราง และไม่มีผู้ใช้คนใดสูญเสียอะไรเลย
- อินเทอร์เน็ตใช้งานได้เพราะมันมีอยู่จริง URL เป็นวิธีการจัดการที่เป็นเอกภาพ ความสำคัญของ URL หรือมากกว่า URI สำหรับทรัพยากรข้อมูลขององค์กรนั้นยากที่จะประเมินค่าสูงไป
- การทำเหมืองข้อความและ NLP เป็นที่นิยม. ในอินเตอร์เน็ต. แต่แม้แต่ในภาคองค์กร ความสำเร็จที่ยิ่งใหญ่ก็สามารถบรรลุได้โดยการดึงข้อมูลที่มีโครงสร้างออกจากข้อมูลองค์กรที่ไม่มีโครงสร้าง
- ทำงานร่วมกัน ระหว่างข้อมูลที่มีโครงสร้างกับข้อมูลที่ดึงมาจากข้อมูลที่ไม่มีโครงสร้าง เช่น ไฟล์ – Klondike เชิงวิเคราะห์
- เมื่อทำการดึงข้อมูลอย่าลืมเกี่ยวกับสิทธิ์และ ลิขสิทธิ์.
- บริษัทสกัดข้อมูลจะต้องจัดตั้งกแผนกแฮกเกอร์ในความหมายที่ดีของคำ แรงบันดาลใจจากการต่อสู้ที่ยากลำบากกับระบบป้องกันบอทของโปรแกรมรวบรวมข้อมูลสมุดหน้าเหลือง
- ก่อนที่จะทำงานกับข้อมูลจำเป็นต้องทำ "ดู" ในสิ่งทั้งปวง. มันยากที่จะอธิบาย แบบฟอร์มตารางอยู่ในใจ สำหรับบางคน การแสดงกราฟ แต่กราฟใดๆ ก็เป็นการตีความอยู่แล้ว ไม่ทางใดก็ทางหนึ่ง... “เห็น”!
- ย้ำปัญหาเรื่อง "ความไว้วางใจ" ของผู้ใช้ในส่วนหน้า ไว้วางใจในตัวเชื่อมต่อ/กระบวนการสร้างข้อมูล ไว้วางใจในข้อมูล ไว้วางใจในการตัดสินใจ.
ที่มา: will.com