Роман Котюбеев, Автор в Практические курсы по Apache Spark для аналитиков, разработчиков, администраторов Big Data

14Апр

Базовая статистика Spark MLlib

Статистика является неотъемлемой частью анализа данных, так как позволяет найти отношения между признаками. Сегодня поговорим о статистических функциях библиотеки Spark MLlib. Читайте в этой статье:...

07Апр

Автор Роман Котюбеев

Распределенные матрицы в Spark MLlib

В прошлой статье мы говорили о локальных векторах и матрицах. Сегодня рассмотрим распределенные матрицы Spark MLlib. В этой статье вы узнаете, как создаются строковая матрица...

05Апр

Автор Роман Котюбеев

Локальный вектор и матрица: базовые структуры данных Spark MLlib

В Spark MLlib есть разные типы векторов и матриц. MLlib поддерживает локальные векторы и матрицы, хранящиеся на одной машине, а также распределенные матрицы, поддерживаемые одним...

25Мар

Автор Роман Котюбеев

Первые шаги в Spark NLP: преобразование строковых данных

В прошлой статье мы говорили об установке Spark NLP на различные операционные системы, а теперь приступим уже к программированию. Сегодня затронем преобразование строковых данных в...

23Мар

Автор Роман Котюбеев

Установка Spark NLP в Windows, Linux и Google Colab

В прошлой статье мы говорили о преимуществах Spark NLP. Сегодня рассмотрим, как установить Spark NLP и PySpark в Windows, Linux (Ubuntu) и Google Colab. В...

17Мар

Автор Роман Котюбеев

Компоненты Spark NLP

В предыдущей статье мы обсудили преимущества использования Spark NLP. Сегодня рассмотрим основные компоненты Spark NLP - аннотаторы (annotators), и как они связаны с Spark ML....

12Мар

Автор Роман Котюбеев

Зачем Data Scientist’у понадобится библиотека Spark NLP

В предыдущей статье мы немного рассказали о Spark NLP. В этой статье дадим обоснование использования данной библиотеки для решения любых задач NLP. Читайте далее, почему...

10Мар

Автор Роман Котюбеев

3 причины использовать библиотеку Spark NLP

Область NLP (Natural language processing) обладает широким спектром инструментов обработки текстовых данных. Одним из таких инструментов является Spark NLP. В этой статье мы расскажем вам...

26Фев

Автор Роман Котюбеев

Ускоряем Apache Spark: тонкая настройка

В прошлой статье мы говорили о кэшировании данных в Apache Spark для более быстрой обработки больших данных (Big Data). Помимо кэширования, можно также оптимизировать производительность...

24Фев

Автор Роман Котюбеев

Увеличьте скорость обработки с помощью кэширования в Spark

В Apache Spark есть функции для кэширования промежуточных данных с целью получения повышения производительности при выполнении SQL запросов. В этой статье мы сравним различные методы...

Пн	Вт	Ср	Чт	Пт	Сб	Вс
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Базовая статистика Spark MLlib

Распределенные матрицы в Spark MLlib

Локальный вектор и матрица: базовые структуры данных Spark MLlib

Первые шаги в Spark NLP: преобразование строковых данных

Установка Spark NLP в Windows, Linux и Google Colab

Компоненты Spark NLP

Зачем Data Scientist’у понадобится библиотека Spark NLP

3 причины использовать библиотеку Spark NLP

Ускоряем Apache Spark: тонкая настройка

Увеличьте скорость обработки с помощью кэширования в Spark

ООО “УЦ Коммерсант”

О компании

Документы

Проекты