Data Science — сочетание смежных научных дисциплин для работы с данными. «Наука о данных» основывается на методах, техниках и инструментах для работы с большими объемами информации. Конечная цель — раскрыть закономерности, проанализировать соотношения и принять на основе полученных результатов обоснованное решение.
Наука о данных включает в себя математические расчеты, машинное обучение, обработку звуков и изображений, статистический анализ, работу с базами данных, визуализацией данных, обработкой естественного языка. Эта дисциплина решает задачи, связанные с анализом и обработкой информации, например: прогнозирование событий, определение оптимальных стратегий, выявление скрытых зависимостей и паттернов, разработка и оптимизация продуктов и сервисов. Этапы работы с информацией в data science: сбор данных, их очистка, обработка, визуализация и анализ.
Широко применяется во всех сферах экономики: бизнес, медицина, образование, IT, маркетинг, государственное управление, наука. Data Science становится необходимой наукой для любого проекта с накопленными «сырыми данными», которые нужно проанализировать и получить результат.