Google mở mã thư viện để xử lý dữ liệu bí mật

Google được phát hành mã nguồn thư viện"Quyền riêng tư khác biệt» với việc thực hiện các phương pháp quyền riêng tư khác biệt, cho phép thực hiện các thao tác thống kê trên một tập dữ liệu với độ chính xác đủ cao mà không có khả năng xác định các bản ghi riêng lẻ trong đó. Mã thư viện được viết bằng C++ và đang mở được cấp phép theo Apache 2.0.

Phân tích bằng các phương pháp bảo mật khác biệt cho phép các tổ chức tạo mẫu phân tích từ cơ sở dữ liệu thống kê mà không cho phép họ tách dữ liệu và tách biệt các thông số của các cá nhân cụ thể khỏi thông tin chung. Ví dụ, để xác định sự khác biệt trong việc chăm sóc bệnh nhân, các nhà nghiên cứu có thể được cung cấp thông tin cho phép họ so sánh thời gian nằm viện trung bình của bệnh nhân nhưng vẫn duy trì tính bảo mật của bệnh nhân và không làm nổi bật thông tin bệnh nhân.

Thư viện được đề xuất bao gồm việc triển khai một số thuật toán để tạo số liệu thống kê tổng hợp dựa trên bộ dữ liệu số bao gồm thông tin bí mật. Để kiểm tra hoạt động chính xác của các thuật toán, nó được cung cấp thăm dò ngẫu nhiên. Các thuật toán cho phép bạn thực hiện các phép tính tổng, đếm, trung bình, độ lệch chuẩn, phân tán và thống kê thứ tự trên dữ liệu, bao gồm xác định giá trị tối thiểu, tối đa và trung vị. Nó cũng bao gồm việc thực hiện Cơ chế Laplace, có thể được sử dụng cho các phép tính không có trong các thuật toán được xác định trước.

Thư viện sử dụng kiến ​​trúc mô-đun cho phép bạn mở rộng chức năng hiện có và thêm các cơ chế bổ sung, chức năng tổng hợp và kiểm soát mức độ riêng tư.
Dựa trên thư viện cho PostgreSQL 11 DBMS chuẩn bị tiện ích mở rộng có tập hợp các hàm tổng hợp ẩn danh sử dụng các phương pháp bảo mật khác biệt - ANON_COUNT, ANON_SUM, ANON_AVG, ANON_VAR, ANON_STDDEV và ANON_NTILE.

Nguồn: opennet.ru

Thêm một lời nhận xét