Учебный курс: аналитик данных

Общая информация

Дата проведения: 24.08.2021 - 30.09.2021 Завершение регистрации: 23.08.2021 Продолжитель­ность: 50 академических часов Расположение: онлайн обучение Цена: 1788 € + km
Льготная цена для клиентов Эстонского центра обучения и конференций до 29 августа Льготная цена: 1308 € + km
Подпишись и получи скидку -30%

Самая востребованная профессия ближайших лет — аналитик данных.

За два последних года спрос на специалистов в сфере сбора и анализа данных (data-специалистов или data-аналитиков, аналитиков данных) вырос в два раза (по данным HeadHunter), прогноз на 2021 по 2024 год: этот рынок вырастет ещё на $64,27 млрд.

Почему же такой спрос на специалистов, умеющих собирать и обрабатывать данные и на аналитиков данных?

Объем данных в мире удваивается каждые три года. Все эти данные нужно уметь сортировать, обрабатывать и использовать с максимальной пользой для бизнеса.  Для этого и нужны data-специалисты и аналитики данных, которые при помощи структурного подхода к управлению данными, могут многократно повысить  эффективность любых бизнес-процессов.

Реальность же такова, что ¾  компаний сегодня повсеместно ощущают серьёзный дефицит специалистов, обладающих навыками и технологиями, которые позволяют использовать имеющиеся у них данные наилучшим образом.

Цель обучения : научить участников собирать и обрабатывать данные для повышения прибыльности своей компании, получать реальную пользу от структурного анализа данных, хранящихся в фирме.

Прошедший обучение научится:

  • Разбираться в индустрии данных и понимать, кто и чем занимается в этой сфере.
  • Работать с данными с нуля.
  • Работать с разными источниками данных и собирать данные, которые находятся в открытом доступе.
  • Анализировать данные и извлекать из них полезную именно для своей компании информацию.
  • Находить закономерности и тенденции, которые помогут принимать взвешенные решения в компании.
  • Автоматизировать процесс сбора данных и экономить массу времени на более важные процессы.
  • Овладеет Python на уровне, достаточном для анализа данных.
  • Сможет работать с различными форматами представления, хранения и передачи данных CSV, XML и XLS.
  • Использовать статистические калькуляторы.
  • Создавать, изменять и управлять базами данных при помощи SQL.

В группе 20 мест!

 

Цена 149€+НСО за один учебный день.
При покупке полной программы (12 дней) цена за один учебный день 109€+НСО (1308€+НСО за 12 учебных дней). Возможна оплата по частям.
Продолжительность одного учебного дня – 4 академических часа. 
По окончанию обучения — сертификат о прохождении программы. 

Программа

24.08.2021

1 модуль. Введение в специальность аналитик данных. Основы анализа данных.


10:00 - 13:00

  • Чем занимается аналитик данных?
  •  Основные навыки, которыми должен обладать аналитик данных.
  •  Различные направления в data-индустрии: ( Data Analyst, Data Scientist, Business Intelligence, администратор и инженер Big Data, DevOps-инженер, DataOps, Chief Data Officer, специалист по безопасности и др).
  •  Что такое датасеты?
  •  Анализ состояния предприятия на предмет необходимости data-специалиста.
  •  Формирование Data Driven в компании.
  •  Как понять, какие специалисты и знания нужны для внедрения data- технологий на вашем предприятии?
  •  По каким критериям структурировать информацию?
  •  Какие источники данных больше всего подходят для вашего   бизнеса?
  •  Инструменты и техники пассивного сбора информации.

26.08.2021

2 модуль. Фундаментальные основы для анализа данных. Источники данных и работа с ними.


14:00 - 17:00

  • Что входит в процесс анализа данных?
  • Процесс исследования, фильтрации, преобразования и моделирования данных с целью извлечения полезной информации для принятия оптимальных решений.
  • Автоматизация процесса сбора данных? Что можно, а что нельзя делать?
  • Сбор данных из различных источников.
  • Форматы данных: CSV, XML и XLS.
  • Методы и приложения, связанные с алгоритмами обработки данных.
  • Что такое фичеселект (feature selection) или препроцессинг?
  • Главные инструменты работы аналитика — язык SQL, основы языка Python, базовые библиотеки Python для анализа данных (NumPy, Pandas, Matplotlib, Scikit-learn).
  • Подключение к источникам данных (FTP, API).
  • Обработка и очистка данных после загрузки.
  • Автоматическая очистка.
  • Ручная очистка данных.
  • Набор инструментов для сбора и очистки данных.

31.08.2021

3 модуль. Excel - основной инструмент для анализа данных.


10:00 - 13:00

  • Екатерина Трунин

    Екатерина Трунин

    Присяжный аудитор, член Палаты аудиторов, специалист по корпоративным финансам и хозяйственному учёту

  • Сводные таблицы - базовый инструмент для работы с большим количеством неструктурированных данных.
  • Использование полей и элементов в сводной таблице, в том числе создание новых полей и элементов.
  • Группировка полей.
  • Систематизация и настройка данных в таблице Excel.
  • 4 техники анализа данных в Excel.
  • Анализ данных через сводные таблицы Excel.
  • Автоматизация анализа данных в Excel.
  • Дисперсионный анализ.
  • Корреляционный анализ.
  • Ковариация.
  • Вычисление скользящего среднего. Очень популярный метод в статистике и в трейдинге.
  • Случайные числа.
  • Операции с выборкой.
  • Быстрый анализ баз данных в Excel.
  • Лист прогнозов.

02.09.2021

4 модуль. Парсинг (web scraping) — это автоматизированный сбор открытой информации в интернете по заданным условиям.


14:00 - 17:00

  • Учащиеся будут собирать и структурировать элементарные базы данных под руководством преподавателя.
  • Практическая часть: анализ социальных сетей и других источников, где хранятся данные.
  • Практическое занятие. Процессы предобработки неструктурированных данных и их хранения в различных базах данных для дальнейшего анализа.
  • Примеры облачных парсеров с русскоязычным интерфейсом.
  • Примеры парсеров-программ.
  • Парсеры на основе Python.

07.09.2021

5 модуль. Python для анализа данных.


10:00 - 13:00

  • Глеб Михайлов

    Глеб Михайлов

    Эксперт международного уровня по анализу данных. Автор и ведущий обучений по анализу данных. Создатель системы обучения Python и SQL для начинающих.

  • В какой степени необходимо владеть Python data-специалисту?
  • Устанавливаем Python.
  • Рабочая среда аналитика: jupyter и colab.
  • Язык разметки Markdown.
  • Основной синтаксис языка Python. Синтаксис при сборе данных.
  • Методы работы со списками и словарями.
  • Методы работы с разными типами данных.
  • Работа с файлами.
  • Работа со строковыми величинам.
  • Работа со временем и датами.
  • Распознаем даты в Python.
  • Учимся складывать и вычитать даты.
  • Объединение данных из разных источников.

09.09.2021

6 модуль. Pandas - библиотека на языке Python для обработки и анализа данных.


14:00 - 17:00

  • Глеб Михайлов

    Глеб Михайлов

    Эксперт международного уровня по анализу данных. Автор и ведущий обучений по анализу данных. Создатель системы обучения Python и SQL для начинающих.

  • Библиотека Pandas: как с ней работать?
  • Учимся группировать данные по колонкам средствами Pandas.
  • Распределяем датасет поисковых запросов по количеству слов.
  • Знакомимся с Pivot и сложной агрегацией средствами Pandas.
  • Учимся работать со сводными таблицами.
  • Объект DataFrame для манипулирования индексированными массивами двумерных данных.
  • Инструменты для обмена данными между структурами в памяти и файлами различных форматов.
  • Встроенные средства совмещения данных и способы обработки отсутствующей информации.
  • Переформатирование наборов данных, в том числе создание сводных таблиц.
  • Срез данных по значениям индекса, расширенные возможности индексирования, выборка из больших наборов данных
  • Вставка и удаление столбцов данных.
  • Возможности группировки позволяют выполнять трёхэтапные операции типа «разделение, изменение, объединение» (англ. split-apply-combine).
  • Слияние и объединение наборов данных.
  • Иерархическое индексирование позволяет работать с данными высокой размерности в структурах меньшей размерности.
  • Работа с временными рядами: формирование временных периодов и изменение интервалов и т.д.

14.09.2021

7 модуль. Лайфкодинг: анализ реальных данных (EDA - exploratory data analysis).


10:00 - 13:00

  • Глеб Михайлов

    Глеб Михайлов

    Эксперт международного уровня по анализу данных. Автор и ведущий обучений по анализу данных. Создатель системы обучения Python и SQL для начинающих.

  • Загрузка данных на Google Drive.
  • Чтение данных в Google Colab.
  • Подготовка данных к анализу: переименование столбцов, замена форматов данных, проверка на дубликаты, анализ пропущенных значений.
  • Первичный анализ: распределение, поиск выбросов.
  • Анализ с помощью сводных таблиц.
  • Анализ непрерывных переменных с помощью разбиения на диапазоны.
  • Анализ с помощью графиков и диаграмм: line plot, bar plot, histogram, scatter plot.
  • Принципы проверки своих вычислений и преобразований.
  • Принципы написания аналитических выводов.
  • Принципы профессионального оформления Jupyter Notebook.
  • Практическая часть.

16.09.2021

8 модуль. SQL - незаменимый инструмент при сборе и анализе данных.


14:00 - 17:00

  • Глеб Михайлов

    Глеб Михайлов

    Эксперт международного уровня по анализу данных. Автор и ведущий обучений по анализу данных. Создатель системы обучения Python и SQL для начинающих.

  • SQL как основной инструмент для создания, модификации и управления данными.
  • Какие бывают базы данных?
  • Как подключиться к базе данных: SQL + python + jupyter?
  • Как при помощи SQL:
    - создать в базе данных новую таблицу;
    - добавить в таблицу новые записи;
    - изменить записи;
    - удалить записи;
    - сделать выборку записей из одной или нескольких таблиц (в соответствии с заданным условием);
  • Можно ли научиться писать простые SQL-запросы без образования программиста?
  • Как при помощи SQL-запроса получать данные из баз данных?
  • Аналитические функции SQL.
  • Оконные функции SQL.
  • Где тренировать SQL?

21.09.2021

9 модуль. Визуализация данных.


10:00 - 13:00

  • Визуализация больших массивов данных.
  • Выбор инструментария для визуализации.
  • Подключение к большим массивам данным. Типы, источники, возможности.
  • Преобразование данных на этапе подключения (схемы данных, очистка, трансформация).
  • Расчеты с помощью инструментария (быстрые расчеты, расчеты на разных уровнях агрегации данных).
  • Интеграция кода Python в расчеты
  • Основные типы графиков, построение.
  • Ключевые подходы к визуализации, ошибки новичков.

23.09.2021

10 модуль. Статистика и вероятность. Как отличить реальный эффект анализа от простой случайности?


14:00 - 17:00

  • Глеб Михайлов

    Глеб Михайлов

    Эксперт международного уровня по анализу данных. Автор и ведущий обучений по анализу данных. Создатель системы обучения Python и SQL для начинающих.

  • Закон больших чисел и Центральная предельная теорема: когда работают, а когда нет?
  • Метод Монте-Карло: как взломать вероятность?
  • АБ тестировние: как отличить случайное от не случайного?
  • Использование статистических калькуляторов.
  • Z-test, T-test, Chi-Square test.
  • Множественная проверка гипотез: как не стать жертвой случайности?

28.09.2021

11 модуль. Что нужно знать аналитикам и data-специалистам о защите личных данных?


10:00 - 13:00

  • Кристина Визнович

    Кристина Визнович

    Адвокат адвокатского бюро Pallo&Partnerid, специалист по защите данных. Тартуский университет право информационных технологий.

  • Обеспечение конфиденциальности и защиты при сборе и хранении личных данных.
  • Какие данные можно собирать и для чего?
  • Когда обработка персональных данных является незаконной?
  • Сбор, обработка и хранение персональных данных в маркетинговых целях.
  • Какие данные нельзя обрабатывать?
  • Права лиц, персональные данные которых подвергаются обработке.
  • Что такое нарушение  личных данных?
  • Как должна происходить защита данных?
  • Что делать, если права всё же нарушены?
  • Кто следит за исполнением регламента? Куда обращаться в случае выявленного нарушения?
  • Наказание за нарушение использования личных данных.
  • Дигитальное архивирование данных клиентов и партнёров.

30.09.2021

12 модуль. Основы методов машинного обучения.


14:00 - 17:00

  • Дмитрий Фишман

    Дмитрий Фишман

    Tartu Ülikool, лектор по тематике искусственного интеллекта. Инструктор в Data Carpentry и Software Carpentry.

  • В чем разница между искусственным интеллектом и машинным обучением?
  • Основные классы методов машинного обучения и их цели.
  • Самые базовые методы машинного обучения с учителем (k-ближайших соседей, линейная регрессия и дерево решений).
  • Проблема переобучения и что с ней делать.
  • Алгоритм перекрестной проверки.
  • Общий подход к применению методов машинного обучения для решения аналитических задач.
  • Практическая работа по предсказанию цен на поездки в такси в Нью-Йорке, на основании соревнования на Kaggle.com (если останется время).

Основы организации обучения

Тип мероприятия:

Webinar

Количество лекторов:

7

Целевая группа:

Руководители предприятий, менеджеры, специалисты, бухгалтеры, IT-специалисты, все лица, заинтересованные в эффективном использовании хранящихся в фирме данных для повышения производительности предприятия. А также лица, заинтересованные в получении новой профессии.

Методы обучения:

Практическое онлайн-обучение. Один учебный день - 4 академических часов. Весь курс - 50 академических часов.

Прошедший обучение получит свидетельство о прохождении курса в случае, если прослушает программу обучения в  объёме 80%.

Пожалуйста, ознакомьтесь с основами обеспечения качества обучения.

По окончании курса - сертификат.

Условия отказа:

100% от оплаченной суммы возвращаем в случае, если вы откажетесь от участия в мероприятии минимум за 30 дней до его начала, 50% от оплаченной суммы возвращаем в случае, если вы откажетесь от участия в мероприятии за 20 дней до его начала. Если вы откажетесь от участия в мероприятии менее, чем за 15 дней до его начала, то уплаченную сумму мы не возвращаем и счёт подлежит оплате.

Порядок решения споров: все проблемные ситуации стороны спора решают между собой в письменной форме. На претензии клиентов Eesti Koolitus-ja Konverentsikeskus отвечает в течение 7 дней. Если договорённости не удаётся достичь, то спор решается в судебном порядке в соответствии с законами Эстонской республики.

Руководитель проекта:

Оксана Кабритс

Кейтеринг:

Нет

*Eesti Koolitus- ja Konverentsikeskus оставляет за собой право вносить изменения в программу.