ืฉืืื, ืืืจ! ืืืจืฉืื ืืืจื ืงืืจืก ืืืฉ ืคืชืืื ืืขืช ื-OTUS
ืืื ืืื, ืืืชืจ ืืืื ืืืืืื ืื ืฉืื ืืืงืจืื ืืืืืืืจ ืืื ืืืืืช ืื ืงืืจื ืืขืืื ืืืืื ืืื. ืื ืฆืืืฅ ืืื ืคืขืืืช ืืฉืชืืฉ ืืืจืช ืืืืฆืจืื ืืืจืืข ืฉืืืื ืื ืืชืื ืื ืชืื ืื ืืคื ืืื ืฉื ืืืืืืจ. ืืืืช ืขืืืืื ืื ืชืืื ืืืืืืื ืื ื ืชืื ืื ืืื, ืืฉืืคืืจ ืืืืืื ืฉืืื ืืื ืืจืืฉ ืกืืจ ืืขืืืคืืืืช ืฉื ืฆืืืช ืคืืืคืืจืืช ืื ืชืื ืื ืฉื ืืืืืืจ.
ืื ื ืืืืื ืื ืฉืืฉืชืืฉืื ืืขืื ืืืืื ืจืื ืฉื ืืืฉืืจืื ืืื ืืื ืฆืจืืืื ืืืืืช ืืกืืืืื ืืืืืช ื ืชืื ืื ืืืงืื ืืืฉื ืืืื ื ืืชืื ืืืืืื ืืืืกืกื SQL ืืขืื ืืืฆืืขืื ืืืืื. ืื ืืืคืฉืจ ืืงืืืฆื ืืืฉื ืืืืจื ืฉื ืืฉืชืืฉืื ืคืืืช ืืื ืืื, ืืืื ืื ืชืื ื ืชืื ืื ืืื ืืื ืืืฆืจ, ืืืืฅ ืชืืื ืืช ืื ืชืื ืื, ืื ืฉืืืคืฉืจ ืืื ืืืืื ืืื ืืืชืจ ืืช ืืืืืืืช ืฉื ืืืืืืจ ืืืืฉืชืืฉ ืืื. ืื ืื ื ืขืืฉืื ืืืืงืจืืืืฆืื ืฉื ื ืืชืื ื ืชืื ืื ืืืืืืืจ.
ืืื ืฉืืืืื ืฉืื ื ืืืืืืืช ื ืืชืื ืื ืชืื ืื ืืคื ืืืืืช ืฉืื ื ืืฉืชืคืจื, ืจืืื ื ืืช ืืืืืืจ ืืฉืชืคืจ. ืขื ืืืช, ืขืืืื ืืฉ ืืงืื ืืฉืืคืืจ. ืืืื ื ืืืืืื ืืื Scalding ืืืจืฉืื ื ืืกืืื ืืชืื ืืช. ืืืื ื ืืชืื ืืืืกืกื SQL ืืืื Presto ื-Vertica ืืฉ ืืขืืืช ืืืฆืืขืื ืืงื ื ืืืื. ืืฉ ืื ื ืื ืืขืื ืฉื ืืคืฆืช ื ืชืื ืื ืขื ืคื ื ืืกืคืจ ืืขืจืืืช ืืื ืืืฉื ืืชืืืช ืืืืื.
ืืฉื ื ืฉืขืืจื ืืืืขื ื
BigQuery : ืืืกื ื ืชืื ืื ืืจืืื ื ืขื ืื ืืข SQL ืืืืกืกืืจืืื , ืืฉืจ ืืคืืจืกืืช ืืืืืช ืืืืืจืืช, ืืคืฉืืืช ืืืืชืืืืืืช ืฉืืืืืืืช ืืืื ื .Data Studio: ืืื ืืืืืื ืฉื ื ืชืื ืื ืืืืืื ืขื ืชืืื ืืช ืฉืืชืืฃ ืคืขืืื ืืืืืืช Google Docs.
ืืืืืจ ืื ืชืืืื ืขื ืื ืืกืืื ืฉืื ื ืขื ืืืืื ืืืื: ืื ืขืฉืื ื, ืื ืืืื ื ืืื ื ืขืฉื ืืืืฉื. ืืขืช ื ืชืืงื ืื ืืชืื ืืฆืืื ืืืื ืืจืืงืืืื. ื ืืื ืื ืืชืื ืืืื ืืืช ืืืืืจ ืืื.
ืืืกืืืจืื ืฉื ืื ืืืืช ืื ืชืื ืื ืฉื ืืืืืืจ
ืืคื ื ืฉืฆืืื ืืชืื BigQuery, ืืืื ืืกืคืจ ืืงืฆืจื ืืช ืืืืกืืืจืื ืฉื ืืืกืื ืื ืชืื ืื ืฉื ืืืืืืจ. ืืฉื ืช 2011, ืืืฆืข ื ืืชืื ื ืชืื ืื ืืืืืืืจ ื-Vertica ื-Hadoop. ืืฉืชืืฉื ื ื-Pig ืืื ืืืฆืืจ ืืฉืจืืช MapReduce Hadoop. ื-2012 ืืืืคื ื ืืช Pig ื-Scalding, ืฉืืื ืื Scala API ืขื ืืชืจืื ืืช ืืื ืืืืืืช ืืืฆืืจ ืฆืื ืืจืืช ืืืจืืืื ืืงืืืช ืืืืงื. ืขื ืืืช, ืขืืืจ ืื ืชืื ื ืชืื ืื ืืื ืืื ืืืฆืจ ืจืืื ืฉืืื ืืื ื ืื ืืืชืจ ืืขืืื ืขื SQL, ืื ืืืืชื ืขืงืืืช ืืืืื ืชืืืื ืืืื. ืืกืืืืืช 2016, ืืชืืื ื ืืืฉืชืืฉ ื-Presto ืืืืฉืง SQL ืื ืชืื ื Hadoop. Spark ืืฆืืขื ืืืฉืง Python, ืื ืฉืืืคื ืืืชื ืืืืืจื ืืืื ืขืืืจ ืืืขื ื ืชืื ืื ืื-ืืืง ืืืืืืช ืืืื ื.
ืืื 2018, ืืฉืชืืฉื ื ืืืืื ืืืืื ืื ืืชืื ื ืชืื ืื ืืืืืื:
- ืฆืจืืื ืขืืืจ ืืกืืขื ืืืฆืืจ
- Scalding ื-Spark ืื ืืชืื ื ืชืื ืื ืื-ืืืง ืืืืืืช ืืืื ื
- Vertica ื-Presto ืื ืืชืื SQL ืื-ืืืง ืืืื ืืจืืงืืืื
- ืืจืืืื ืขืืืจ ืืืฉื ืืื ืืจืืงืืืืืช ื ืืืื, ืืงืืจืช ืืืฉืืืื ื ืืืื ืืืืืื ืกืืจืืช ืืื
- Tableau, Zeppelin ื- Pivot ืืืืืืืช ื ืชืื ืื
ืืืืื ื ืฉืืขืื ืฉืืืืื ืืืื ืืฆืืขืื ืืืืืืช ืืืงืืช ืืืื, ืืชืงืฉืื ื ืืืคืื ืืช ืืืืืืืช ืืืื ืืืืื ืืช ืืงืื ืจืื ืืืชืจ ืืืืืืืจ. ืขื ืืื ืืจืืืช ืืคืืืคืืจืื ืฉืื ื ืขื Google Cloud, ืื ื ืืชืืงืืื ืืคืืฉืื ืืื ืื ืืชืื ืฉืื ื ืขืืืจ ืื ืืืืืืจ.
ืืืกื ืื ืชืื ืื BigQuery ืฉื ืืืื
ืืื ืฆืืืชืื ืืืืืืืจ ืืืจ ืฉืืืื ืืช BigQuery ืืืืง ืืฆืื ืืจืืช ืืืืฆืืจ ืฉืืื. ืืขืืจืช ืืืืืืืืช ืฉืืื, ืืชืืื ื ืืืขืจืื ืืช ืืืืืืืช ืฉื BigQuery ืขืืืจ ืื ืืงืจื ืืฉืืืืฉ ืืืืืืืจ. ืืืืจื ืฉืื ื ืืืืชื ืืืฆืืข ืืช BigQuery ืืื ืืืืจื ืืืชืงื ืืืชืืื ืื ืืชืื ืขืจืืช ืืืืื ืฉื ืคืืืคืืจืืช ืื ืชืื ืื. ืื ืืื ืงืฉื ืืกืืืืช ืจืืืช. ืืืื ื ืฆืจืืืื ืืคืชื ืชืฉืชืืช ืืื ืืืืืืข ืืืืคื ืืืืื ืืืืืืช ืืืืืืช ืฉื ื ืชืื ืื, ืืชืืื ืื ืืืื ื ืชืื ืื ืืจืืื ืืืืจื, ืืืืืื ืืงืจืืช ืืืฉื ื ืืืชืืช ืืืืืืื ืืช ืคืจืืืืช ืืืงืืืืช. ืืืื ื ืฆืจืืืื ืื ืืืฆืืจ ืืขืจืืืช ืืืงืฆืืช ืืฉืืืื, ื ืืืืจ ืืืืืจืื ืืกืคืืื ืืื ืฉืฆืืืชืื ืืืืื ืืืฉืชืืฉ ื-BigQuery ืืืขืืืืช.
ืื ืืืืืจ 2018, ืฉืืจืจื ื ืืืืืจืช ืืืคื ืืื ืืืืจื ืฉื BigQuery ื-Data Studio. ืืฆืขื ื ืืขืืืื ืืืืืืจ ืืื ืืืืืืื ืืช ืืืืงืืจืื ืืื ืื ืคืืฆืื ืืืืชืจ ืฉืื ื ืขื ื ืชืื ืื ืืืฉืืื ื ืงืืื. ื-BigQuery ื ืขืฉื ืฉืืืืฉ ืขื ืืื ืืืขืื ื-250 ืืฉืชืืฉืื ืืืืืื ืฆืืืชืื ืืืื ืื ืืกื, ืคืื ื ืกืื ืืฉืืืืง. ืืืืจืื ื, ืื ืืจืืฆื ื-8 ืืงืฉืืช, ืขืืืื ืฉื ื-100 PB ืืืืืฉ, ืื ืกืืคืจ ืืงืฉืืช ืืชืืืื ืืช. ืืืืจ ืฉืงืืืื ื ืืฉืื ืืืืื ืืืื, ืืืืื ื ืืืชืงืื ืืืืฆืืข ืืช BigQuery ืืืฉืื ืืขืืงืจื ืืืื ืืจืืงืฆืื ืขื ื ืชืื ืื ืืืืืืืจ.
ืื ื ืชืจืฉืื ืืจืื ืืืืื ืฉื ืืจืืืืงืืืจืช ืืืกื ื ืื ืชืื ืื ืฉื Google BigQuery ืฉืื ื.
ืื ื ืืขืชืืงืื ื ืชืื ืื ืืืฉืืืืืช Hadoop ืืงืืืืื ื-Google Cloud Storage (GCS) ืืืืฆืขืืช ืืืื ืืคื ืืื Cloud Replicator. ืืืืจ ืืื ืื ื ืืฉืชืืฉืื ื-Apache Airflow ืืื ืืืฆืืจ ืฆืื ืืจืืช ืืืฉืชืืฉืื ื-"
ืืกืขืืคืื ืืืืื, ืื ื ืื ืื ืืืืฉื ืืืืืืืืืช ืฉืื ื ืืชืืืืื ืฉื ืงืืืช ืฉืืืืฉ, ืืืฆืืขืื, ื ืืืื ื ืชืื ืื, ืืจืืืืช ืืืขืจืืช ืืขืืืช.
ืงืืืช ืฉืืืืฉ
ืืืืื ื ืฉืงื ืืืฉืชืืฉืื ืืืชืืื ืขื BigQuery ืืืืืื ืฉืืื ืื ืืืจืฉ ืืชืงื ืช ืชืืื ื ืืืฉืชืืฉืื ืืืื ืืืฉืช ืืืื ืืจื ืืืฉืง ืืื ืืจื ื ืืื ืืืืืืืื. ืขื ืืืช, ืืืฉืชืืฉืื ืืื ืฆืจืืืื ืืืืืจ ืืื ืืืชืืื ืืช ืืืืืฉืืื ืฉื GCP, ืืืื ืืฉืืืื ืืืื ืคืจืืืงืืื, ืืขืจืื ื ืชืื ืื ืืืืืืืช. ืคืืชืื ื ืืืืจืื ืืืืจืืื ืืืืื ืืื ืืขืืืจ ืืืฉืชืืฉืื ืืืชืืื. ืขื ืืื ื ืืกืืกืืช ืฉืืืฉืื, ืืืฉืชืืฉืื ืืื ืงื ืื ืืื ืืขืจืืืช ื ืชืื ืื, ืืืฆืื ื ืชืื ื ืกืืืื ืืืืื, ืืืจืืฅ ืฉืืืืชืืช ืคืฉืืืืช ืืืืืืืฉ ืชืืฆืืืช ื-Data Studio.
ืืืืจื ืฉืื ื ืืืื ืช ื ืชืื ืื ื-BigQuery ืืืืชื ืืืคืฉืจ ืืขืื ื ืืืงื ืฉื ืืขืจืื ื ืชืื ืื HDFS ืื GCS ืืืืืฆื ืืืช. ืฉืงืื ื
ืืื ืืืคืื ื ืชืื ืื ื-BigQuery, ืืฉืชืืฉืื ืืืฆืจืื ืฆืื ืืจืืช ื ืชืื ืื ืคืฉืืืื ืฉื SQL ืืืืฆืขืืช ืฉืืืืชืืช ืืชืืืื ืืช. ืขืืืจ ืฆืื ืืจืืช ืืืจืืืื ืืจืืื-ืฉืืืื ืขื ืชืืืช, ืื ื ืืชืื ื ืื ืืืฉืชืืฉ ืืืกืืจืช Airflow ืืฉืื ื ืื ื-Cloud Composer ืืื ืขื
ืคืจืืืืงืืืืืืช
BigQuery ืืืืขื ืืฉืืืืชืืช SQL ืืืืจืืช ืืืืืืช ืืืขืืืืช ืืืืืืช ืืืืืืช ืฉื ื ืชืื ืื. ืืื ืืื ื ืืืืขื ืืฉืืืืชืืช ืืืืืืจ ืื ืืื, ืืชืคืืงื ืืืืืื ืื ืืจืฉืช ืขื-ืืื ืืกื ื ืชืื ืื ืขืกืงื, ืื ืื ืืชืื ืกืืจืืช ืืื ืขื ืืื ืืืืืจ ื ืืื.
ื ืืชืื ื ืืืขืื ื-800 ืฉืืืืชืืช ืฉืขืืื ื-1 TB ืฉื ื ืชืื ืื ืื ืืืช ืืืฆืื ื ืฉืืื ืืืืฆืืข ืืืืืฆืข ืืื 30 ืฉื ืืืช. ืืืื ื ืื ืฉืืืฆืืขืื ืชืืืืื ืืืื ืืฉืืืืฉ ืืืฉืืฆืช ืฉืื ื ืืคืจืืืงืืื ืืืฉืืืืช ืฉืื ืืช. ืืืื ื ืฆืจืืืื ืืืืืืจ ืืืืจืืจ ืืช ืขืชืืืืช ืืืืฆืืจ ืืืจืืฆื ืืื-ืืืง ืฉืื ื ืืื ืืฉืืืจ ืขื ืืืฆืืขืื ืขืืืจ ืืงืจื ืฉืืืืฉ ืืืืฆืืจ ืื ืืชืื ืืงืืื. ืื ืืฉืคืืข ืจืืืช ืขื ืืขืืฆืื ืฉืื ื ืืฉืืืจืช ืืฉืืฆืืช ืืืืจืจืืืืช ืืคืจืืืงื.
ื ืืืจ ืขื ื ืืืื ื ืชืื ืื, ืคืื ืงืฆืืื ืืืืช ืืขืืืช ืืขืจืืืช ืืืืื ืืงืจืืืื ืืืืง ืืฉื ื ืฉื ืืชืจืืื, ืื ืืขืช ืื ื ืืืืื ืื ืืช ืืืื
ืงืจื ืขืื:
ืืื ืืื ืืืช ื ืชืื ืื ืื ืื ืฉืืฉืืชืฃ ืืื Data Warehouse ื-Smoothie ืฆืืื ืืชืื ืืื Delta: Schema Enforcement and Evolution ืคืจืงื ืืคืืฆ'ื ืืืืจ ืืคืืืชืื ืขื ืืฅ ืืคืืฆ'ื
ืืงืืจ: www.habr.com