Kho dữ liệu DATA VAULT

Ở trước bài viết, chúng ta đã thấy kiến ​​thức cơ bản về DATA VAULT, mở rộng DATA VAULT sang trạng thái dễ phân tích cú pháp hơn và tạo một DỮ LIỆU DOANH NGHIỆP. Đã đến lúc kết thúc loạt bài với bài viết thứ ba.

Như tôi đã thông báo ở phần trước ấn phẩm, bài viết này sẽ tập trung vào chủ đề BI, hay đúng hơn là chuẩn bị DATA VAULT làm nguồn dữ liệu cho BI. Hãy xem cách tạo bảng thực tế và bảng thứ nguyên, từ đó tạo lược đồ sao.

Khi tôi bắt đầu nghiên cứu các tài liệu bằng tiếng Anh về chủ đề tạo data mart qua DATA VAULT, tôi có cảm giác rằng quá trình này khá phức tạp. Vì các bài viết có độ dài đáng kể, có tham chiếu đến những thay đổi trong cách diễn đạt xuất hiện trong phương pháp Data Vault 2.0 nên tầm quan trọng của những cách diễn đạt này được chỉ ra.

Tuy nhiên, khi đi sâu vào bản dịch, rõ ràng là quá trình này không quá phức tạp. Nhưng bạn có thể có một ý kiến ​​​​khác.

Và vì vậy, chúng ta hãy đi thẳng vào vấn đề.

Bảng thứ nguyên và thực tế trong DATA VAULT

Thông tin khó hiểu nhất:

  • Các bảng đo lường được xây dựng dựa trên thông tin từ các trung tâm và vệ tinh của chúng;
  • Các bảng sự thật được xây dựng dựa trên thông tin từ các liên kết và vệ tinh của chúng.

Và điều này là hiển nhiên sau khi đọc bài viết về Thông tin cơ bản về DATA VAULT. Các trung tâm lưu trữ các khóa duy nhất của các đối tượng kinh doanh, các vệ tinh giới hạn thời gian của chúng về trạng thái của các thuộc tính đối tượng kinh doanh, các vệ tinh gắn với các liên kết hỗ trợ giao dịch lưu trữ các đặc điểm số của các giao dịch này.

Đây là nơi lý thuyết về cơ bản kết thúc.

Tuy nhiên, theo tôi, cần lưu ý một số khái niệm có thể tìm thấy trong các bài viết về phương pháp DATA VAULT:

  • Raw Data Marts - trưng bày dữ liệu "thô";
  • Information Marts - trưng bày thông tin.

Khái niệm "Cửa hàng dữ liệu thô" - biểu thị các cửa hàng được xây dựng trên dữ liệu DATA VAULT bằng cách thực hiện THAM GIA khá đơn giản. Cách tiếp cận “Raw Data Marts” cho phép bạn mở rộng dự án kho một cách linh hoạt và nhanh chóng với thông tin phù hợp để phân tích. Cách tiếp cận này không liên quan đến việc thực hiện các chuyển đổi dữ liệu phức tạp và thực thi các quy tắc kinh doanh trước khi được đưa vào mặt tiền cửa hàng, tuy nhiên, dữ liệu Raw Data Marts phải dễ hiểu đối với người dùng doanh nghiệp và sẽ là cơ sở để chuyển đổi thêm, chẳng hạn như bằng các công cụ BI .

Khái niệm “Chợ thông tin” xuất hiện trong phương pháp Data Vault 2.0, nó thay thế khái niệm cũ về “Chợ dữ liệu”. Sự thay đổi này là do việc thực hiện nhiệm vụ triển khai mô hình dữ liệu để báo cáo dưới dạng chuyển đổi dữ liệu thành thông tin. Trước hết, chương trình “Chợ thông tin” phải cung cấp cho doanh nghiệp thông tin phù hợp để ra quyết định.

Các định nghĩa khá dài dòng phản ánh hai sự thật đơn giản:

  1. Các khu trưng bày của loại “Raw Data Marts” được xây dựng trên DATA VAULT thô (RAW), một kho lưu trữ chỉ chứa các khái niệm cơ bản: HUBS, LIÊN KẾT, VỆ TINH;
  2. Các quầy trưng bày "Chợ thông tin" được xây dựng bằng cách sử dụng các yếu tố của BUSINESS VAULT: PIT, BRIDGE.

Nếu chúng ta chuyển sang các ví dụ về lưu trữ thông tin về một nhân viên, chúng ta có thể nói rằng mặt tiền cửa hàng hiển thị số điện thoại hiện tại (hiện tại) của nhân viên là mặt tiền cửa hàng thuộc loại “Raw Data Marts”. Để tạo thành một buổi giới thiệu như vậy, khóa doanh nghiệp của nhân viên và hàm MAX() được sử dụng trên thuộc tính ngày tải vệ tinh (MAX(SatLoadDate)) được sử dụng. Khi cần lưu trữ lịch sử thay đổi thuộc tính trong tủ trưng bày - nó được sử dụng, bạn cần hiểu điện thoại được cập nhật từ ngày nào đến ngày nào, quá trình tổng hợp khóa doanh nghiệp và ngày tải lên vệ tinh sẽ thêm khóa chính vào bảng như vậy, trường ngày kết thúc của thời hạn hiệu lực cũng được thêm vào.

Tạo mặt tiền cửa hàng lưu trữ thông tin cập nhật cho từng thuộc tính của một số vệ tinh có trong trung tâm, ví dụ: số điện thoại, địa chỉ, họ tên, hàm ý sử dụng bảng PIT, qua đó có thể dễ dàng truy cập tất cả các ngày của sự liên quan. Các tủ trưng bày kiểu này được gọi là "Chợ thông tin".

Cả hai cách tiếp cận đều phù hợp cho cả phép đo và sự kiện.

Để tạo mặt tiền cửa hàng lưu trữ thông tin về một số liên kết và trung tâm, có thể sử dụng quyền truy cập vào bảng BRIDGE.

Với bài viết này, tôi hoàn thành chu trình về khái niệm DATA VAULT, tôi hy vọng những thông tin mà tôi chia sẻ sẽ hữu ích trong việc thực hiện các dự án của bạn.

Như mọi khi, tóm lại, một vài liên kết hữu ích:

  • Bài báo Kenta Graziano, ngoài phần mô tả chi tiết, còn chứa các sơ đồ mô hình;

Nguồn: www.habr.com

Thêm một lời nhận xét