Spark schemaEvolution на практике
Уважаемые читатели, доброго дня! В данной статье ведущий консультант бизнес-направления Big Data Solutions компании «Неофлекс», подробно описывает варианты построения витрин переменной структуры с использованием Apache Spark. В рамках проекта по анализу данных, часто возникает задача построения витрин на основе слабо структурированных данных. Обычно это логи, или ответы различных систем, сохраняемые в виде JSON или XML. […]
