Обработка и анализ данных
Университет ИТМО. Высшая школа цифровой культуры.

Дисциплина состоит из двух разделов
Раздел "Первичная обработка данных" научит базовым приемам работы с данными – виды и источники данных, оценка и улучшение качества данных, преобразование и подготовка данных к разведочному анализу. Изучаются методы визуализации данных, описательные статистики, методы нормировки данных, построение целевых функций и работа с временными рядами.
Раздел "Элементы статистики" знакомит с практическими навыками статистической обработки данных, которые могут быть применены для решения аналитических задач и в личной, и в профессиональной сфере. Рассматриваются важнейшие понятия теории вероятностей, на которых основаны многие статистические конструкции и выводы. Повествуется о том, что такое случайное событие и случайная величина, обсуждается построение функции распределения и вычисление вероятности наступления различных событий, рассматриваются важнейшие распределения, встречающиеся в жизни на каждом шагу. Также приводятся примеры работы с выборкой и оценки важнейших параметров генеральной совокупности таких, как: математическое ожидание, дисперсия, плотность распределения, корреляция двух случайных величин, а также свойства этих оценок. Кроме того, студенты научатся построению доверительных интервалов для оценок параметров различных распределений: слушатели узнают, насколько оценки, полученные по выборке, точны, и пригодно ли их использовать в реальных задачах. В завершении рассматривается важнейшая задача проверки гипотез, где основное внимание обращается на критерии согласия.
Курс разработан и поддерживается Высшей школой цифровой культуры ИТМО.
