Возможность использовать готовые библиотеки или создавать собственные для сложных задач машинного обучения — это то, что мне больше всего нравится в этом наборе инструментов; это просто, но в то же время достаточно мощно! Некоторые API-интерфейсы Python довольно сложны в том, как они работают, особенно когда вы пробуете их из браузера, не зная обо всех задействованных зависимостях, которые иногда делают вещи менее прямыми - здесь нужна надлежащая документация (предоставленная командой Datakit до сих пор не всегда полная) . Система управления рабочими процессами DataScience, которая может интегрировать различные инструменты, такие как PyTorch, Pandas и т. д., в конвейерный рабочий процесс с использованием Apache Airflow DAG, делает реализацию наших заданий ETL более эффективной ;-) Мне нравится идея, что Dataiku может быстро масштабироваться. По мере роста будет только лучше и выгоднее! Это' Очень сложно объяснить, как продукт может облегчить вашу жизнь, но мы добились больших успехов в использовании платформы. Мы не уверены, есть ли что-то, что можно было бы улучшить, пока все было идеально! Мы решаем сложные задачи аналитики в нашей отрасли. Возможность масштабировать и развертывать высокоточные модели машинного обучения по нескольким каналам.