Архивы Машинное обучение

03Май

Деревья решений в Spark MLlib

Деревья решений (Decision trees) являются одним из самых популярных алгоритмов машинного обучения и используются для задач классификации (бинарной и многоклассовой) и регрессии. Деревья решений простоты,...

01Май

курсы hadoop sql, big data обучение, bigdata курсы, hadoop spark, анализ с использование spark, bigdata курсы,аналитика больших данных курсы, курсы spark, основы spark, основы hadoop, обучение администраторов spark, spark mllib, spark rdd, spark streaming, apache hadoop, обучение spark sql, курсы spark streaming, курсы по apache spark, обучение apache spark, apache hadoop курсы, spark streaming, apache spark курсы, обучение apache spark

Автор Сергей Ушаков

Что такое деревья решений и для чего они нужны Spark’у

В прошлый раз мы говорили про особенности обработки файлов JSON в Spark. Сегодня поговорим про деревья решений в распределенном фреймворке Apache Spark. Читайте далее про...

22Апр

Автор Роман Котюбеев

Линейные модели Sparl MLlib: Логистическая регрессия

В прошлой статье мы говорили о таком линейном алгоритме машинного обучения (Machine Learning), как метод опорных векторов. Сегодня рассмотрим второй линейный классификатор Spark MLlib –...

21Апр

Автор Роман Котюбеев

Линейные модели Sparl MLlib: Метод опорных векторов

Классификация – одна из главных задач машинного обучения (Machine Learning). Сегодня рассмотрим один из линейных классификаторов Spark MLlib – метод опорных векторов (SVM). В этой...

17Мар

Автор Роман Котюбеев

Компоненты Spark NLP

В предыдущей статье мы обсудили преимущества использования Spark NLP. Сегодня рассмотрим основные компоненты Spark NLP - аннотаторы (annotators), и как они связаны с Spark ML....

12Мар

Автор Роман Котюбеев

Зачем Data Scientist’у понадобится библиотека Spark NLP

В предыдущей статье мы немного рассказали о Spark NLP. В этой статье дадим обоснование использования данной библиотеки для решения любых задач NLP. Читайте далее, почему...

10Мар

Автор Роман Котюбеев

3 причины использовать библиотеку Spark NLP

Область NLP (Natural language processing) обладает широким спектром инструментов обработки текстовых данных. Одним из таких инструментов является Spark NLP. В этой статье мы расскажем вам...

01Мар

Автор Сергей Ушаков

10 вопросов на знание основ работы с логистической регрессией в Spark MLlib: открытый интерактивный тест для начинающих изучать машинное обучение

Чтобы самостоятельное обучение по Spark Mllib стало еще интереснее, сегодня мы предлагаем вам простой тест по основам работы с логистической регрессией в распределенном фреймворке Apache...

10Фев

Автор Роман Котюбеев

3 метода параллельной обработки данных в Spark

Spark, как инструмент анализа данных, отлично подходит при увеличении масштаба задач и при увеличении размера самих данных Пока вы используете датафреймы и библиотеки Spark вы...

04Фев

Автор Роман Котюбеев

Выбор наилучшей модели: кросс-валдиация и разбиение на выборки

Тюнинг, или подбор параметров, является незаменимой частью при подборе модели Machine Learning, поскольку с одними параметрами модель может показывать высокие результаты, а с другими —...

Пн	Вт	Ср	Чт	Пт	Сб	Вс
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

Деревья решений в Spark MLlib

Что такое деревья решений и для чего они нужны Spark’у

Линейные модели Sparl MLlib: Логистическая регрессия

Линейные модели Sparl MLlib: Метод опорных векторов

Компоненты Spark NLP

Зачем Data Scientist’у понадобится библиотека Spark NLP

3 причины использовать библиотеку Spark NLP

10 вопросов на знание основ работы с логистической регрессией в Spark MLlib: открытый интерактивный тест для начинающих изучать машинное обучение

3 метода параллельной обработки данных в Spark

Выбор наилучшей модели: кросс-валдиация и разбиение на выборки

ООО “УЦ Коммерсант”

О компании

Документы

Проекты