Что такое RDD и для чего это нужно фреймворку Spark

Набор RDD (Resilient Distributed Dataset) – это неизменяемая коллекция объектов данных. Каждый такой набор делится на определенное количество частей, которые обрабатываются различными узлами в кластере....

Поиск по сайту