Лекториум / Каталог курсов / Сравнение и создание групп
Лекториум / Каталог курсов / Сравнение и создание групп

Сравнение
и создание групп

Вы научитесь сравнивать группы между собой и статистически оценивать значимость межгрупповых различий. Также вы освоите основные методы кластеризации и научитесь выделять группы объектов в наборе данных. Кроме того, вы выполните исследовательский проект на реальных данных компании 2GIS

34 лекций с заданиями
Чат в «Телеграме» с авторами
Свободное расписание
Сертификат
Присоединяйтесь к курсу в любое время! В бесплатном режиме доступен первый модуль. В платном — доступ к остальным модулям, заданиям и сертификации
Записаться
Курс посвящен статистическому сравнению групп и категорий. В первой части курса мы рассказываем о параметрических и непараметрических тестах сравнения средних и распределений, какие возможности и ограничения связаны с разными методами сравнения групп, говорим о сравнении связанных и несвязанных выборок.
Различаются ли регионы (или аудитории) по доходу или возрасту? Как отличается пользовательская активность в разные времена года? Случайны различия между группами или закономерны? Курс научит искать ответы на такие вопросы.
Вторая половина курса посвящена выделению групп на основе эмпирических данных. Есть ли в данных структура? Можно ли говорить о том, что люди, компании или университеты группируются в отличительные узнаваемые классы? Как найти и охарактеризовать такие группы? Мы покажем основные алгоритмы кластеризации, которые позволяют решать эти задачи.
В практических видео курса мы покажем реализацию основных инструментов сравнения и выделения групп, а также предложим практические задачи и задания для отработки полученных навыков.
Для кого

Курс будет полезен всем, кто:

  • Изучает анализ данных и хочет разобраться на простых и понятных примерах
  • Знает основы анализа данных и хочет прокачаться в сравнении групп, поиске структур в данных, а также научиться методам кластерного анализа
  • Хочет научиться работать в SPSS или R
  • Работает с аналитиками данных и хочет понимать их
  • Так или иначе имеет дело с данными и хочет научиться грамотно их анализировать
Зачем
  • Научиться сравнивать группы между собой, находить сходства и значимые отличия
  • Попрактиковаться в решении актуальных рыночных задач на реальных данных
  • Научиться находить группы в данных и описывать их характеристики
  • Познакомиться с инструментами анализа данных — SPSS и R
Авторский подход
Этот курс — результат совместной работы преподавателя анализа данных в НГУ Ольги Ечевской и аналитиков компании 2GIS Натальи Галановой и Виктора Демина.

Ценность курса — в комбинации систематичной и доступной подачи материала и практических кейсов, построенных на реальных данных компании 2GIS.
Нажмите на карточку, чтобы узнать больше
программа курса
Этот курс — третий в специализации «Анализ данных». Чтобы успешно его освоить, вам понадобятся знания основ теории вероятностей и математической статистики. Если вы не уверены в своих знаниях, рекомендуем начать с курса «Введение в данные».
Курс расскажет вам, как понять, различаются ли группы между собой, какие различия наиболее существенны и статистически значимы. Также вы узнаете, как находить группы в данных и выявлять характеристики этих групп. Мы начнем с обзора статистических гипотез и инструментов их проверки, поговорим о статистических тестах, параметрических и непараметрических, об их возможностях и ограничениях, разберем их на практических примерах.
Затем мы перейдем к выделению групп в данных и познакомимся с методами кластерного анализа, разберем основные инструменты статистической оценки взаимосвязей: таблицы сопряженности, коэффициенты корреляции, модели линейной регрессии. Научимся интерпретировать их смысл и оценивать качество построенных моделей.
Вы сможете применить полученные знания, выполнив небольшой проект на реальных данных, предоставленных компанией 2GIS.
Специализация «Анализ данных»
Этот курс — часть специализации. Вы можете приобрести сразу четыре курса со скидкой 15%
Авторы
  • Ольга Ечевская
    Социолог-исследователь, кандидат социологических наук, преподаватель курса «Анализ данных» в Новосибирском государственном университете
  • Виктор Демин
    Аналитик данных компании 2GIS, Team lead, кандидат технических наук
  • Наталья Галанова
    Аналитик данных компании 2GIS.
Как выглядит курс
Сравнение и создание групп
Курс посвящен статистическому сравнению групп и категорий. В первой части курса мы рассказываем о параметрических и непараметрических тестах сравнения средних и распределений, какие возможности и ограничения связаны с разными методами сравнения групп, говорим о сравнении связанных и несвязанных выборок.
Вторая половина курса посвящена выделению групп на основе эмпирических данных. Есть ли в данных структура? Можно ли говорить о том, что люди, компании или университеты группируются в отличительные узнаваемые классы? Как найти и охарактеризовать такие группы? Мы покажем основные алгоритмы кластеризации, которые позволяют решать такие задачи.
В практических видео курса мы покажем реализацию основных инструментов сравнения и выделения групп, а также предложим практические задачи и задания для отработки полученных навыков. Добро пожаловать на курс!
  • Что вы получите
    • 4 модуля, 34 видеолекции
    • 9 практических видео (скринкастов)
    • Авторская подача: просто, понятно, с примерами, разбором типичных ошибок, демонстрацией решения задач в SPSS и R
    • Практическое задание для отработки навыков анализа данных на реальных данных компании 2GIS
    • Свободное расписание: нет дедлайнов и сроков сдачи заданий
    • Тест после каждого модуля
    • Профессиональное видео и современная графика
    • Быстрая связь с техподдержкой и чат с автором
    • В бесплатном режиме первый модуль доступен вам полностью. После оплаты обучения для вас откроется полный доступ к курсу, проверочным заданиям после каждого урока и сертификации
  • Зачем
    • Научиться сравнивать группы между собой, находить сходства и значимые отличия
    • Попрактиковаться в решении актуальных рыночных задач на реальных данных
    • Научиться находить группы в данных и описывать их характеристики
    • Познакомиться с инструментами анализа данных — SPSS и R
Присоединяйтесь к курсу в любое время! В бесплатном режиме доступен первый модуль. В платном — доступ к остальным модулям, заданиям и сертификации
FAQ
Реквизиты курса
Длительность курса

5 недель
Организаторы

Новосибирский государственный университет, 2 GIS
Находясь на сайте, вы даете согласие на обработку файлов cookie. Это необходимо для более стабильной работы сайта