Главная страница » Services » Курсы » GRAS: Графовые алгоритмы в Apache Spark
Практический курс «Графовые алгоритмы в Apache Spark»
2-дневный практический курс для разработчиков Apache Spark, дата инженеров и аналитиков данных, Data Scientist’ов и других специалистов Big Data, которые используют или планируют использовать Spark для решения задач графовой обработки данных.
Код курса | Даты начала курса | Стоимость обучения | Длительность обучения | Формат обучения |
---|---|---|---|---|
GRAS | по запросу |
0 руб. | ак.часов | Дистанционный |
О курсе
Практический курс по Спарк рассчитан на разработчиков Big Data, дата инженеров и аналитиков данных, Data Scientist’ов и других специалистов по большим данным, которые хотят получить опыт настройки и использования Apache Spark Graphframe. На этом курсе вы изучите предоставляемые фреймворком Spark возможности графовой обработки данных, графовых алгоритмов, представления информации в графовом виде, а также парадигму Pregel.
В качестве прикладных примеров рассматриваются реальные бизнес-кейсы:
- формирование списка интересов потребителя для точной сегментации целевой аудитории;
- определение круга знакомых пропавшего человека;
- выявление подозрительных схем финансовых транзакций;
- рекомендательные и антифрод-системы;
- поиск мошеннических схем в страховании;
- оптимизация транспортных маршрутов.
Соотношение теории к практике 50/50
Предварительная подготовка
- Опыт работы в Unix/SQL;
- Знания в объеме, аналогичном курсу Core Spark
- Начальный опыт программирования (Python/Java);
- Начальный опыт в экосистеме Hadoop
Программа курса "Графовые алгоритмы в Apache Spark"
1. Введение в графовую модель
- Понятие графа, его реализация
- Графовые алгоритмы и задачи.
- Текущий статус поддержки графовых вычислений в Spark
- Основная абстракция Graphframe и работа с ней
- Представление графа в Spark Graphframe
- Основные атрибуты и методы.
- Реализованные графовые алгоритмы
- Применение для решения практических задач
- Парадигма Pregel и ее история
- Реализация в Spark
- Применение для решения практических задач
Кто проводит курс
Королев Михаил
МГУ им. М.В. Ломоносова (Москва, 1992)
Профессиональные компетенции:
- Сертифицированный разработчик Spark и Hadoop (CCA Cloudera)
- Сертифицированный разработчик (Cloudera Certified Professional Data Engineer)
- Построение корпоративных хранилищ и озер данных (Cloudera CDH, Hadoop)
- Организация ETL-конвейеров (ApacheAirflow, Spark, Apache Livy)
- Поддержка инфраструктуры больших данных (Apache Hive,HBase, Kafka,Elasticsearch)
- Руководитель проектов с корпоративными данными
- Ведущий Data Engineer АО “Альфастрахование”, Москва
Если у Вас остались вопросы Вы можете позвонить к нам по телефону +7 (495) 414-11-21 или заполнить форму обратной связи на сайте.