Аннотация:В статье обсуждается сравнение систем обработки потоковых данных Apache Storm и Apache Spark
в задаче анализа сообщений социальной сети Twitter. Сначала описываются основные концепции движков, особенности их настройки и запуска приложений. Затем рассматриваются конкретная задача анализа твитов, а также структура кластера, на котором проводился тест производительности. В заключении были сделаны выводы о применимости Storm и Spark для рассмотренной задачи.