Как строить современную платформу данных на базе проектов с открытым кодом
В докладе будут рассмотрены основные подходы и инструменты для построения современных платформ сбора и анализа данных, прежде всего, на базе проектов, входящих в Apache Hadoop.
В последнее десятилетие рост количества данных, их многообразие и вариативность привели к тому, что каждый год появляются все новые и новые средства работы с ними. С одной стороны это замечательно, так как сегодня на любую из конкретных задач по обработке данных можно найти адекватное техническое решение. С другой, как быть уверенным в том, что решение, выбранное сегодня, будет работать с задачами завтрашнего дня? И как разобраться в этом многообразии проектов по обработке данных, собрать и заставить работать их вместе, а затем обеспечить работоспособность в течении жизненного цикла?
1
Понравилось