Аннотация:Хотя в сообществе баз данных с обоими этими утверждениями согласно подавляющее большинство исследователей и разработчиков, имеется одна проблема, однозначное решение которой пока отсутствует. Проблема состоит в том, что, в то время как запросы к базе данных, разделенной между узлами кластера, распараллеливаются СУБД автоматически, она, вообще говоря, не может справиться с распараллеливанием серверных приложений, создаваемых пользователями. Один из подходов к решению этой проблемы состоит в том, что внутри параллельной СУБД поддерживается среда MapReduce, в которой и выполняются аналитические приложения. MapReduce накладывает некоторые ограничения на допустимые приложения, но зато обеспечивает их параллельное выполнение. Этот подход является новым, к настоящему времени реализован только в двух системах: Greenplum Database компании Greenplum и nCluster компании Aster Data. Перед Филиппом Аро Диасом была поставлена задача разобраться в том, действительно ли на основе MapReduce можно реализовать сложные аналитические функции, и опробовать это на практике с использованием Greenplum Database.