Архивы Статьи - Страница 11 из 14 - Практические курсы по Apache Spark для аналитиков, разработчиков, администраторов Big Data

24Фев

Увеличьте скорость обработки с помощью кэширования в Spark

В Apache Spark есть функции для кэширования промежуточных данных с целью получения повышения производительности при выполнении SQL запросов. В этой статье мы сравним различные методы...

19Фев

Автор Роман Котюбеев

3 совета по ускорению Apache Spark

В прошлой статье мы говорили об устройстве оптимизатора Apache Spark. Теперь мы знаем, как сложный и продуманный механизм оптимизации Spark обеспечивает быстрый и эффективный анализ...

17Фев

Автор Роман Котюбеев

Как работает SparkSQL изнутри и причем здесь Catalyst

Spark обрабатывает данные быстро. Это было основным преимуществом фреймворка с момента его первого представления в 2010 году. Обладая широким спектром вариантов возможностей и простотой использования,...

10Фев

Автор Роман Котюбеев

3 метода параллельной обработки данных в Spark

Spark, как инструмент анализа данных, отлично подходит при увеличении масштаба задач и при увеличении размера самих данных Пока вы используете датафреймы и библиотеки Spark вы...

04Фев

Автор Роман Котюбеев

Выбор наилучшей модели: кросс-валдиация и разбиение на выборки

Тюнинг, или подбор параметров, является незаменимой частью при подборе модели Machine Learning, поскольку с одними параметрами модель может показывать высокие результаты, а с другими —...

29Янв

Автор Роман Котюбеев

Конвейеры машинного обучения в Spark

Построение моделей машинного обучения в Spark — это последовательный процесс. Сегодня мы расскажем о конвейерах (Pipeline) в Spark. Читайте далее: какие объекты используются в конвейере,...

23Янв

курсы hadoop sql, big data обучение, bigdata курсы, hadoop spark, анализ с использование spark, bigdata курсы,аналитика больших данных курсы, курсы spark, основы spark, основы hadoop, обучение администраторов spark

Автор Сергей Ушаков

10 вопросов на знание основ работы с RDD в Spark: открытый интерактивный тест для начинающих

Чтобы самостоятельное обучение по Spark стало еще интереснее, сегодня мы предлагаем вам простой тест по основам работы с наборами RDD в распределенном фреймворке Apache Spark,...

20Янв

Автор Роман Котюбеев

Статистка в Spark: корреляция

В рамках анализа данных и отбора признаков нередко вычисляется корреляция между признаками. Сегодня мы разберем, что такое корреляция, какие методы вычисления существуют, как найти коэффициенты...

17Янв

Автор Сергей Ушаков

10 вопросов на знание основ архитектуры Spark SQL: открытый интерактивный тест для начинающих

Чтобы самостоятельное обучение по Spark стало еще интереснее, сегодня мы предлагаем вам простой тест по основам архитектуры компонента Spark SQL, включая элементы, из которых она...

14Янв

Автор Сергей Ушаков

Как происходит сериализация данных в Spark

В прошлый раз мы говорили про популярные инструменты для сборки распределенных Spark-приложений. Сегодня поговорим про сериализацию данных распределенных приложений, созданных на базе Big Data фреймворка...

Пн	Вт	Ср	Чт	Пт	Сб	Вс
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

Увеличьте скорость обработки с помощью кэширования в Spark

3 совета по ускорению Apache Spark

Как работает SparkSQL изнутри и причем здесь Catalyst

3 метода параллельной обработки данных в Spark

Выбор наилучшей модели: кросс-валдиация и разбиение на выборки

Конвейеры машинного обучения в Spark

10 вопросов на знание основ работы с RDD в Spark: открытый интерактивный тест для начинающих

Статистка в Spark: корреляция

10 вопросов на знание основ архитектуры Spark SQL: открытый интерактивный тест для начинающих

Как происходит сериализация данных в Spark

ООО “УЦ Коммерсант”

О компании

Документы

Проекты