Архивы Data Science

24Май

Ансамблевые алгоритмы Spark ML: градиентный бустинг

В прошлой статье мы говорили о случайном лесе в Apache Spark. Сегодня рассмотрим еще один ансамблевый алгоритм машинного обучения – градиентный бустинг (Gradient Boosting). Читайте...

09Май

курсы hadoop sql, big data обучение, bigdata курсы, hadoop spark, анализ с использование spark, bigdata курсы,аналитика больших данных курсы, курсы spark, основы spark, основы hadoop, обучение администраторов spark, spark mllib, spark rdd, spark streaming, apache hadoop, обучение spark sql, курсы spark streaming, курсы по apache spark, обучение apache spark, apache hadoop курсы, spark streaming, apache spark курсы, обучение apache spark, курсы администрирования hadoop, pyspark что это

Автор Сергей Ушаков

Что такое архитектура распределенной среды Spark

В прошлый раз мы говорили деревья решений в Spark. Сегодня поговорим о том, как устроена распределенная архитектура Big Data фреймворка Apache Spark. Читайте далее про...

06Май

Автор Роман Котюбеев

Ансамблевые алгоритмы Spark ML: Случайный лес

В предыдущей статье мы говорили о таком алгоритме машинного обучения, как деревья решений (Decision Trees). Сегодня рассмотрим ансамблевый алгоритм, который состоит из множества таких деревьев...

03Май

Автор Роман Котюбеев

Деревья решений в Spark MLlib

Деревья решений (Decision trees) являются одним из самых популярных алгоритмов машинного обучения и используются для задач классификации (бинарной и многоклассовой) и регрессии. Деревья решений простоты,...

01Май

Автор Сергей Ушаков

Что такое деревья решений и для чего они нужны Spark’у

В прошлый раз мы говорили про особенности обработки файлов JSON в Spark. Сегодня поговорим про деревья решений в распределенном фреймворке Apache Spark. Читайте далее про...

30Апр

Автор Сергей Ушаков

10 вопросов на знание основ взаимодействия Spark с реляционными СУБД: открытый интерактивный тест для начинающих

Чтобы самостоятельное обучение по Spark стало еще интереснее, сегодня мы предлагаем вам простой тест по основам взаимодействия фреймворка Spark с реляционными СУБД, включая базовые компоненты...

22Апр

Автор Роман Котюбеев

Линейные модели Sparl MLlib: Логистическая регрессия

В прошлой статье мы говорили о таком линейном алгоритме машинного обучения (Machine Learning), как метод опорных векторов. Сегодня рассмотрим второй линейный классификатор Spark MLlib –...

21Апр

Автор Роман Котюбеев

Линейные модели Sparl MLlib: Метод опорных векторов

Классификация – одна из главных задач машинного обучения (Machine Learning). Сегодня рассмотрим один из линейных классификаторов Spark MLlib – метод опорных векторов (SVM). В этой...

20Апр

Автор Сергей Ушаков

Как Spark работает со структурированными JSON-файлами

В прошлый раз мы говорили про особенности взаимодействия Big Data фреймворка Spark с реляционными СУБД. Сегодня поговорим о том, как Spark обрабатывает данные, которые подаются...

16Апр

Автор Роман Котюбеев

Проверка статистических гипотез с Spark MLlib

В прошлой статье мы говорили о базовой статистике в Apache Spark. Сегодня рассмотрим проверку статистических гипотез с помощью Spark MLlib с примерами кода на Python....

Пн	Вт	Ср	Чт	Пт	Сб	Вс
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Ансамблевые алгоритмы Spark ML: градиентный бустинг

Что такое архитектура распределенной среды Spark

Ансамблевые алгоритмы Spark ML: Случайный лес

Деревья решений в Spark MLlib

Что такое деревья решений и для чего они нужны Spark’у

10 вопросов на знание основ взаимодействия Spark с реляционными СУБД: открытый интерактивный тест для начинающих

Линейные модели Sparl MLlib: Логистическая регрессия

Линейные модели Sparl MLlib: Метод опорных векторов

Как Spark работает со структурированными JSON-файлами

Проверка статистических гипотез с Spark MLlib

ООО “УЦ Коммерсант”

О компании

Документы

Проекты