How to build a modern data platform based on open source tools
В докладе будут рассмотрены основные подходы и инструменты для построения современных платформ сбора и анализа данных, прежде всего, на базе проектов, входящих в Apache Hadoop.
В последнее десятилетие рост количества данных, их многообразие и вариативность привели к тому, что каждый год появляются все новые и новые средства работы с ними. С одной стороны это замечательно, так как сегодня на любую из конкретных задач по обработке данных можно найти адекватное техническое решение. С другой, как быть уверенным в том, что решение, выбранное сегодня, будет работать с задачами завтрашнего дня? И как разобраться в этом многообразии проектов по обработке данных, собрать и заставить работать их вместе, а затем обеспечить работоспособность в течении жизненного цикла?
В докладе будут рассмотрены основные подходы и инструменты для построения современных платформ сбора и анализа данных, прежде всего, на базе проектов, входящих в Apache Hadoop.
В последнее десятилетие рост количества данных, их многообразие и вариативность привели к тому, что каждый год появляются все новые и новые средства работы с ними. С одной стороны это замечательно, так как сегодня на любую из конкретных задач по обработке данных можно найти адекватное техническое решение. С другой, как быть уверенным в том, что решение, выбранное сегодня, будет работать с задачами завтрашнего дня? И как разобраться в этом многообразии проектов по обработке данных, собрать и заставить работать их вместе, а затем обеспечить работоспособность в течении жизненного цикла?