09.09.2019 15:39
Новости.
Просмотров всего: 2385; сегодня: 2.

«Инфосистемы Джет» построила Data Lake для НЛМК

«Инфосистемы Джет» построила Data Lake для НЛМК

Эксперты «Инфосистемы Джет» разработали для мирового лидера сталелитейной промышленности систему анализа данных и моделирования (САДиМ), которая отвечает за доступность и качество данных, а также предоставляет инструментарий для вычислений и анализа. Внедренная система уже сейчас позволяет группе НЛМК эффективнее вести разработку цифровых сервисов и моделей машинного обучения для оптимизации производственных процессов.

В цехах и на агрегатах предприятия эксплуатируются десятки систем, которые накапливают и обрабатывают информацию о производственных и технологических процессах. Кроме того, в помещениях установлены десятки тысяч датчиков, которые непрерывно собирают и передают данные. Подразделению Data Science НЛМК требовался удобный инструмент для работы с получаемыми данными под разрабатываемые модели машинного обучения (ML).

Для решения задачи Центр программных решений ИТ-компании «Инфосистемы Джет» совместно с командой НЛМК создали Data Lake емкостью 300 терабайт на базе отечественного дистрибутива распределенной платформы хранения Hadoop. Для решения задач сбора, передачи, трансформации и накопления данных были использованы такие сервисы, как Apache Kafka, Apache NiFi, Apache Hive.

В рамках проекта специалисты запустили регулярную загрузку данных в Data Lake из более чем 70 источников (датчиков, а также MES и АСУ ТП), загрузили исторические данные за последние несколько лет работы предприятия и разработали карты данных технологических и производственных процессов отдельных цехов.

В рамках проекта команда «Инфосистемы Джет» разработала для НЛМК модель унифицированной витрины данных, а также процессы загрузки в неё, реализовала управление мета-данными средствами Apache Atlas (тэгирование, поиск и т. д.), настроила централизованную ролевую модель и её интеграцию с Active Directory. Это дало возможность дата-сайнтистам НЛМК оперативнее получать в Data Lake доступ к нужным им данным.

Для контроля работы Data Lake был также настроен комплексный мониторинг состояния сервисов системы в Zabbix, а также разработаны автотесты для контроля целостности и полноты данных. Для особо важных и уязвимых данных была создана возможность резервного копирования: то есть, в случае непреднамеренного уничтожения данных пользователем их можно будет восстановить.

«Создание озера данных, которое действительно приносит экономическую пользу заказчику – это непростая задача как с технической, так и с организационной точки зрения. И тут дело не только в железе, интеграции и программировании. Очень важна готовность производства собирать и передавать качественные данные, а потом использовать результаты анализа этих данных для принятия производственных решений. В сотрудничестве с коллегами из НЛМК, которые со стороны всех подразделений проявили высокий профессионализм и заинтересованность, нам удалось оперативно создать решение, сделавшее производство действительно цифровым», — подчеркивает Владимир Молодых, директор по разработке и внедрению программного обеспечения «Инфосистемы Джет».


Ньюсмейкер: Инфосистемы Джет — 157 публикаций
Поделиться:

Интересно:

Сегодня в Москве проходит фестиваль «Цифровая история»
20.04.2024 13:27 Мероприятия
Сегодня в Москве проходит фестиваль «Цифровая история»
20 апреля в Москве в Концертном зале МПГУ стартовал Шестнадцатый научно-популярный фестиваль «Цифровая история»  — «Неизвестная Вторая мировая». В мероприятии принимают участие российские историки, которые обсудят последние открытия в мире военной истории, расскажут о...
К годовщине окончания битвы за Москву в 1942 году
20.04.2024 09:02 Новости
К годовщине окончания битвы за Москву в 1942 году
Начавшаяся 30 сентября 1941 года битва за Москву завершилась 20 апреля 1942 года. Германия потерпела первое крупное поражение во Второй мировой войне. Враг потерял убитыми, ранеными и пропавшими без вести более 500 тысяч человек, 1300 танков, 2500 орудий и другой...
20 млн учащихся приняли участие в уроке о геноциде советского народа
19.04.2024 16:10 Новости
20 млн учащихся приняли участие в уроке о геноциде советского народа
Накануне Дня единых действий в память о жертвах преступлений против советского народа, совершенных нацистами и их пособниками в годы Великой Отечественной войны, который отмечают 19 апреля, в российских школах прошли занятия «Разговоры о важном».  В рамках «Разговоров о...
Подмосковье - в числе регионов-лидеров по объему закупок у самозанятых
19.04.2024 09:21 Новости
Подмосковье - в числе регионов-лидеров по объему закупок у самозанятых
С 1 апреля 2020 года самозанятым гражданам разрешили участвовать в закупках по 223-Федеральному закону «О закупках товаров, работ, услуг отдельными видами юридических лиц» на равных условиях с малым и средним бизнесом. Это способствовало значительному приросту объёма закупок у граждан, применяющих...
День единых действий в память о геноциде советского народа в годы ВОВ
19.04.2024 07:40 Интервью, мнения
День единых действий в память о геноциде советского народа в годы ВОВ
В деле сохранения исторической правды есть особая дата - 19 апреля. В этот день в 1943 году был издан Указ Президиума Верховного Совета СССР N39 "О мерах наказания для немецко-фашистских злодеев, виновных в убийствах и истязаниях советского гражданского населения и пленных красноармейцев, для...