Из курса вы узнаете, как проходит полный цикл анализа, от сбора данных до выбора оптимального решения и оценки его качества, и научитесь пользоваться современными аналитическими инструментами, адаптировать их под особенности конкретных задач.
Специализация состоит из 6 курсов:
Математика и Python для анализа данных. В этом курсе вам напомнят основы математического анализа, линейной алгебры, методов оптимизации, теории вероятностей, необходимых для успешного освоения методов машинного обучения. Также вы сможете познакомиться с синтаксисом основного языка анализа данных Python, а также научиться работать с его основными библиотеками, полезными для анализа данных, например, NumPy, SciPy, Matplotlib и Pandas. Обучение на размеченных данных. В рамках этого курса вы познакомитесь с наиболее распространенным классом задач машинного обучения. Вы формулировать и, конечно, решать такие задачи. В центре внимания будут алгоритмы классификации и регрессии: линейные модели, нейронные сети, решающие деревья и так далее. Помимо предсказывающих алгоритмов, вы разберетесь также и с другими этапами решения задач классического анализа данных: оценивание обобщающей способности алгоритмов, подбор параметров модели, выбор и подсчет метрик качества.
Поиск структуры в данных. Этот курс посвящен решению задач, относящихся к классу «обучение без учителя». Из курса вы узнаете об алгоритмах кластеризации данных, научитесь строить матричные разложения и решать задачу тематического моделирования, понижать размерность данных, искать аномалии и визуализировать многомерные данные. Построение выводов по данным. Из курса вы узнаете все, что нужно для успешного превращения данных в выводы — организация экспериментов, A/B-тестирование, универсальные методы оценки параметров и проверки гипотез, корреляции и
Для тех, кто хочет освоить основы анализа данных и машинного обучения.
Комментарии
Комментировать