Анализ данных с помощью Microsoft R

Курс предназначен для специалистов, анализирующих огромные наборы данных, а также разработчиков, использующих R в своих проектах. После прохождения обучения учащиеся получат знания и навыки, необходимые для создания и запуска сценариев анализа больших данных на сервере Microsoft R. Также в курсе описано как работать с Microsoft R в средах обработки больших данных как Hadoop, кластер Spark или база SQL Server.

  Для кого:

Основная аудитория курса: инженеры, архитекторы, специалисты по подготовке данных и разработчики.

Результаты обучения

После прохождения этого курса студенты смогут:
  • описывать работу Microsoft R;
  • использовать клиента R и Server R для обработки больших данных из разных хранилищ;
  • визуализировать данные с помощью графиков и схем;
  • преобразовывать и очищать наборы больших данных;
  • использовать способы разделения аналитических задач на параллельные задачи;
  • строить и оценивать регрессионные модели, генерируемые на основе больших данных;
  • создавать, оценивать и разворачивать партиционированные модели на основе больших данных;
  • использовать язык R в средах SQL Server и Hadoop.

  • Программа обучения

    Модуль 1 Сервер и клиент Microsoft R▼

    • 1.1 Обзор сервера Microsoft R
    • 1.2 Использование клиента Microsoft R
    • 1.3 Функции ScaleR
    • Лаб. раб. Обзор сервера и клиента Microsoft R

    Модуль 2 Обзор больших данных▼

    • 2.1 Источники данных ScaleR
    • 2.2 Чтение данных в XDF-объекте
    • 2.3 Обобщение данных в XDF-объекте
    • Лаб. раб. Обзор больших данных

    Модуль 3 Визуализация больших данных▼

    • 3.1 Визуализация данных в памяти
    • 3.2 Визуализации больших данных
    • Лаб. раб. Визуализация данных

    Модуль 4 Обработка больших данных▼

    • 4.1 Преобразование больших данных
    • 4.2 Управление наборами данных
    • Лаб. раб. Обработка больших данных

    Модуль 5 Распараллеливание операций анализа▼

    • 5.1 Использование вычислительного контекста RxLocalParallel с функцией rxExec
    • 5.2 Использование пакета revoPemaR
    • Лаб. раб. Использование rxExec и revoPemaR для распараллеливания операций

    Модуль 6 Создание и оценка регрессионной модели▼

    • 6.1 Кластеризации больших данных
    • 6.2 Создание регрессионных моделей и подготовка прогнозов
    • Лаб. раб. Создание линейной регрессионной модели

    Модуль 7 Создание и оценка партиционированных моделей (Partitioning Model)▼

    • 7.1 Создание партиционированных моделей на основе дерева решений.
    • 7.2 Тестирование прогнозов партиционированных моделей
    • Лаб.раб. Создание и оценка партиционированных моделей

    Модуль 8 Обработка больших данных в SQL Server и Hadoop▼

    • 8.1 Использование R в SQL Server
    • 8.2 Использование Map/Reduce в Hadoop
    • 8.3 Использование Hadoop Spark
    • Лаб. раб. Обработка больших данных в SQL Server и Hadoop