Мне нравится, как легко Fluml упрощает подготовку данных при использовании моделей машинного обучения, таких как случайные леса или глубокие нейронные сети с бэкэндом TensorFlow! Это очень приятно, потому что большинство других библиотек требуют, чтобы вы создали некоторые файлы Python, что не всегда возможно, если ваш набор данных содержит большое количество категориальных переменных/столбцов и т. д. Существует не намного больше того, что я упомянул выше, но пока этого достаточно. :) Если бы были вещи, которые они могли бы улучшить, возможно, добавив лучшую документацию? Возможно, также добавьте примеры, в которых люди могут видеть, что именно их входной формат должен быть отформатирован этим инструментом перед запуском в производство. Это было бы очень полезно, поскольку иногда ошибки форматирования возникают даже после проверки всех входных данных/столбцов, используемых в классе DataFrameWriter!