Архивы Статьи

07Апр

Распределенные матрицы в Spark MLlib

В прошлой статье мы говорили о локальных векторах и матрицах. Сегодня рассмотрим распределенные матрицы Spark MLlib. В этой статье вы узнаете, как создаются строковая матрица...

05Апр

Автор Роман Котюбеев

Локальный вектор и матрица: базовые структуры данных Spark MLlib

В Spark MLlib есть разные типы векторов и матриц. MLlib поддерживает локальные векторы и матрицы, хранящиеся на одной машине, а также распределенные матрицы, поддерживаемые одним...

25Мар

Автор Роман Котюбеев

Первые шаги в Spark NLP: преобразование строковых данных

В прошлой статье мы говорили об установке Spark NLP на различные операционные системы, а теперь приступим уже к программированию. Сегодня затронем преобразование строковых данных в...

23Мар

Автор Роман Котюбеев

Установка Spark NLP в Windows, Linux и Google Colab

В прошлой статье мы говорили о преимуществах Spark NLP. Сегодня рассмотрим, как установить Spark NLP и PySpark в Windows, Linux (Ubuntu) и Google Colab. В...

20Мар

курсы hadoop sql, big data обучение, bigdata курсы, hadoop spark, анализ с использование spark, bigdata курсы,аналитика больших данных курсы, курсы spark, основы spark, основы hadoop, обучение администраторов spark, spark mllib, spark rdd, spark streaming, apache hadoop, обучение spark sql, курсы spark streaming

Автор Сергей Ушаков

Как происходит распределение данных в Spark

В прошлый раз мы говорили про механизм сериализации данных в распределенном фреймворке Apache Spark. Сегодня поговорим про управление распределением данных в Spark. Читайте далее про...

17Мар

Автор Роман Котюбеев

Компоненты Spark NLP

В предыдущей статье мы обсудили преимущества использования Spark NLP. Сегодня рассмотрим основные компоненты Spark NLP - аннотаторы (annotators), и как они связаны с Spark ML....

12Мар

Автор Роман Котюбеев

Зачем Data Scientist’у понадобится библиотека Spark NLP

В предыдущей статье мы немного рассказали о Spark NLP. В этой статье дадим обоснование использования данной библиотеки для решения любых задач NLP. Читайте далее, почему...

10Мар

Автор Роман Котюбеев

3 причины использовать библиотеку Spark NLP

Область NLP (Natural language processing) обладает широким спектром инструментов обработки текстовых данных. Одним из таких инструментов является Spark NLP. В этой статье мы расскажем вам...

01Мар

Автор Сергей Ушаков

10 вопросов на знание основ работы с логистической регрессией в Spark MLlib: открытый интерактивный тест для начинающих изучать машинное обучение

Чтобы самостоятельное обучение по Spark Mllib стало еще интереснее, сегодня мы предлагаем вам простой тест по основам работы с логистической регрессией в распределенном фреймворке Apache...

26Фев

Автор Роман Котюбеев

Ускоряем Apache Spark: тонкая настройка

В прошлой статье мы говорили о кэшировании данных в Apache Spark для более быстрой обработки больших данных (Big Data). Помимо кэширования, можно также оптимизировать производительность...

Пн	Вт	Ср	Чт	Пт	Сб	Вс
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Распределенные матрицы в Spark MLlib

Локальный вектор и матрица: базовые структуры данных Spark MLlib

Первые шаги в Spark NLP: преобразование строковых данных

Установка Spark NLP в Windows, Linux и Google Colab

Как происходит распределение данных в Spark

Компоненты Spark NLP

Зачем Data Scientist’у понадобится библиотека Spark NLP

3 причины использовать библиотеку Spark NLP

10 вопросов на знание основ работы с логистической регрессией в Spark MLlib: открытый интерактивный тест для начинающих изучать машинное обучение

Ускоряем Apache Spark: тонкая настройка

ООО “УЦ Коммерсант”

О компании

Документы

Проекты