Возможность выполнять крупномасштабную аналитику без каких-либо знаний о Hadoop или Apache Spark — это отличный опыт работы с этим инструментом! На самом деле ничего, что мне не нравилось до сих пор, но было бы неплохо, если бы была доступная документация, такая как другие инструменты от Red Hat, в виде учебных пособий, руководств и т. д., что также увеличит скорость их принятия конечными пользователями. Это хороший вариант, когда у вас ограниченные ресурсы, где может быть невозможным / возможным экономически эффективным способом использования экосистемы Hadoops для удовлетворения ваших потребностей в обработке больших данных с использованием традиционного подхода к программированию с уменьшением карты.