Специалисты по big data (аналитики big data, инженеры big data, data scientists) работают с большими массивами данных. Они могут применять свои навыки в областях медицины, нейробиологии, медиа, метеорологии, банковской сфере и не только. Например, они разрабатывают ботов, строят генетические карты, оценивают вероятность страхового случая, подбирают лекарства в фармацевтике, учат нейронные сети писать музыку или стихи. Если вы хотите развиваться в сфере больших данных, для начала ознакомьтесь с основами. Собрали 8 бесплатных онлайн-курсов от ведущих университетов мира, благодаря которым вы узнаете о принципах работы с big data.

A Crash Course in Data Science

Организатор: Университет Джонса Хопкинса
Продолжительность: 7 часов
Язык: английский

В этом курсе вас познакомят с принципами работы с большими данными. Вы узнаете, какую роль в науке о данных играют статистика, машинное обучение и разработка программного обеспечения, научитесь описывать структуру проекта по обработке и анализу данных, ознакомитесь с ключевыми терминами и инструментами, узнаете, как определять успешный и неудачный проект.

The Data Scientist’s Toolbox

Организатор: Университет Джонса Хопкинса
Продолжительность: 18 часов
Язык: английский

Авторы курса дают обзор типов данных, рассказывают о подходах и методологиях обработки информации и объясняют принципы работы основных инструментов. К ним относятся такие ресурсы, как Git, R и RStudio. Благодаря им можно обрабатывать массивы информации.

Machine Learning Fundamentals

Организатор: Университет Джонса Хопкинса
Продолжительность: 10 недель
Язык: английский

Благодаря этому курсу вы узнаете, как классифицировать изображения, определять основные темы в корпусе документов, автоматически фиксировать семантическую структуру слов. Все примеры программирования и задания будут на языке Python с использованием записных книжек Jupyter.

База данных

Организатор: СПбГУ
Продолжительность: 11 часов
Язык: русский

Данный курс познакомит слушателей с наиболее популярными системами управления базами данных, их особенностями и моделями. Вы научитесь проектировать базы данных, понимать, как составлять запросы и индексировать данные. Часть уроков посвящена языку программирования SQL. В курсе предусмотрено выполнение практических заданий на базе СУБД MySQL, что качественно улучшает восприятие материала.

Введение в машинное обучение

Организатор: НИУ ВШЭ
Продолжительность: 35 часов
Язык: русский

На этом курсе рассматриваются популярные задачи, решаемые с помощью машинного обучения: классификация, регрессия, кластеризация. Вы ознакомитесь с основными математическими понятиями: функциями, производными, векторами, матрицами. Для успешного прохождения курса желательно быть знакомым с языком программирования Python.

Введение в науку о данных

Организатор: СПбГУ
Продолжительность: 89 часов
Язык: русский

Авторы курса предоставляют обучающемуся необходимый теоретический минимум и показывают, как пользоваться инструментальной базой на практике. Вы узнаете о способах решения типичных задач, с которыми сталкивается в своей работе data scientist, ознакомитесь с подходами к сбору, анализу, обработке и визуализации массивов данных.

Специализация от Excel до MySQL: способы анализа бизнес-данных

Организатор: Duke University
Продолжительность: 8 месяцев
Язык: английский

В ходе этого курса вы узнаете, как использовать Excel, Tableau и MySQL для анализа данных, прогнозирования, создания моделей и визуализации данных для решения задач и улучшения бизнес-процессов. Теория подкреплена практическими заданиями.

Анализ данных

Организатор: Новосибирский государственный университет
Продолжительность: 5 месяцев
Язык: русский

Курсы содержат материалы по основам теории вероятностей и математической статистике, построению прогнозов на основе регрессионных моделей, кластерному и статистическому анализу. В курсах специализации вы узнаете, как оценить связь условий труда и удовлетворенности работой, спрогнозировать количество кликов на сайт компании, выявить стратегии поиска работы, и научитесь решать множество других практических задач.