Не утонуть в данных: Информационно-аналитическая система позволит быстрее принимать решения

Департамент перспективных исследований – научно-технический центр (ДПИ-НТЦ) ОАК разработал технические требования к информационно-аналитической системе для работы с большими массивами научно-технических документов и согласовал их с представителями всех конструкторских бюро корпорации. Такая система становится крайне необходимой в условиях наблюдающегося в последнее время лавинообразного роста объема информации. Она позволит существенно ускорить работу с «большими данными», находя среди них актуальную информацию, необходимую при создании новой конкурентоспособной продукции ОАК.

07 июня 2019

Благодарим Департамент корпоративных коммуникаций ПАО "Объединенная авиастроительная корпорация" за предоставление данного материала. 

Что понимается под термином «большие данные»? Это – огромные информационные массивы, состоящие из сотен тысяч, миллионов, иногда – даже сотен миллионов документов. Это не символы, не слова, а целые документы. Вот один из примеров. Фирма IHS Markit – английское аналитическое агентство, формирующее информационные отчеты для оценки рисков, потенциалов и перспектив для принятия значимых решений в различных бизнес-отраслях. В базах данных IHS Markit хранятся сотни миллионов патентов. Вот это и есть пример «больших данных».

На сегодняшний день при создании перспективных образцов авиационной техники в кооперации учувствуют несколько сотен предприятий и для принятия решений по выбору передовых технологий при создании конкурентоспособной авиационной техники необходимо не только знать суть этих технологий, но и понимать текущий уровень их готовности.

Компания АэроКомпозит

Компания АэроКомпозит

Ситуация осложняется еще и тем, что каждый день в мире появляются тысячи, а то и больше научно-технических статей и патентов. За год получается огромный массив новых данных. Инженеры, конструкторы, научные работники сами уже не способны не только изучить и отсортировать такой объем информации, но даже понять относится ли это к интересующей их области. Ведь в последнее время появляется много новых терминов, рождающихся на стыке различных областей науки и техники. Зачастую, чтобы понять, относится ли тот или иной термин, та или иная статья к исследуемой области, нужно эту статью прочитать хотя бы «по диагонали» и понять ее смысл. А на основе аннотации не всегда можно сделать корректные выводы.

«Умение наиболее эффективно распорядиться информационными ресурсами – одно из основных требований успешной деятельности любой организации, особенно в высокотехнологичной отрасли, работающей в условиях постоянно растущей конкуренции», – отмечает генеральный конструктор – вице-президент по инновациям ОАК Сергей Коротков.

По данным Федерального исследовательского центра «Информатика и управление» (ФИЦ ИУ) Российской академии наук (РАН), на сегодняшний день человек в своей области работы способен воспринять всего лишь 5 % от имеющейся информации. По прогнозам, дальше будет еще хуже: рост объемов информации будет нарастать лавинообразно.

Информационно-аналитические системы (ИАС) являются современным высокоэффективным инструментом поддержки принятия стратегических, тактических и оперативных управленческих решений на основе наглядного и оперативного предоставления пользователям всей необходимой совокупности данных.

«Использование современных информационно-аналитических систем позволяет в сжатые сроки проанализировать множество документов и предоставить инженеру полную и необходимую информацию для оценки применимости новых технологий в авиастроении, а также найти авторов этих технологий для создания кооперации», – комментирует директор департамента ДПИ-НТЦ Владимир Каргопольцев.

Человек уже «тонет» в потоке этой информации. «Поэтому сегодня сильно возрастает актуальность ИАС, которые “понимают” смысл статей и документов. Они ищут необходимую информацию среди “больших данных” уже не по словам, не по ключевым фразам, а по смыслу», – говорит начальник отдела ДПИ-НТЦ Александр Онуфриев.

Отечественные разработки высокого уровня в этой области имеются в ФИЦ ИУ РАН, руководителем которого является академик Игорь Соколов. Существуют готовые решения в Высшей школе экономики, в коммерческих фирмах, например, «Авикомп Сервисез», «Антиплагиат» и «Наумен» и другие. Эти решения позволяют находить документы, близкие по смыслу введенному запросу, фразе или исходному документу среди большого массива – тысячи, сотни тысяч и более – документов. Они позволяют обнаруживать заимствования и сравнивать текст с каждым из обнаруженных источников, проводить анализ количества публикаций по интересующей тематике и так далее. Анализ получается достаточно полный.

«Железо» ИАС

Как не удивительно, вычислительные мощности для работы с «большими данными» – не столь уж пугающая проблема. «Аппаратная реализация таких систем может быть разной, – рассказывает заместитель директора ДПИ-НТЦ Александр Георгиев. – Когда мы общались с разработчиками, у кого-то их продукт хорошо работает на видеокартах GPU, кому-то нужны мощные серверы. Это все зависит от программной реализации. Но очень дорогих суперкомпьютеров и создание специальной инфраструктуры на сегодняшний момент для этого не требуется».

Конечно же, все зависит от объема данных. Если работать с внешними источниками – интернетом и профильными сайтами по авиационно-космической тематике, – то объемы данных естественно вырастут. Ожидается, что при запуске ИАС в ОАК, массив данных, с которыми предстоит работать системе, будет исчисляться терабайтами на начальных этапах, а в последствии – десятками терабайт. Для этого необходимо будет наращивать как хранилище данных, так и компьютерные мощности. Но техника развивается. То, что недавно считалось супермощным компьютером, теперь уже вполне обычная машина.

ОКБ Сухой

ОКБ Сухого

Используемые в авиастроении технологии зачастую находятся в смежных областях. Например, в ОАК сейчас разрабатывается концепция полностью электрического самолета. Для этой задачи необходимо анализировать не только массивы данных по авиационной тематике, но и в области разработки электротехнических изделий, радиоэлектроники и в других прикладных областях.

«Школа» для машины

Более сложная задача при создании ИАС – научить такую систему понимать и распознавать слова-синонимы на выборке документов, которая ей будет предоставлена по определенной тематике. Тем самым система научится понимать смысл документа. «Основа построения системы – хорошие алгоритмы и их обучение на репрезентативной выборке, – уверен замдиректора ДПИ-НТЦ Александр Георгиев. – Формирование репрезентативной выборки, пожалуй, даже более важно. Есть, например, хорошие алгоритмы, зарекомендовавшие себя в определенных отраслях. Но при переносе их на другую отрасль не факт, что получится хороший результат».

Например, в технической документации встречаются термины «привод», «актуатор», «сервопривод». По сути, они означают одно и то же. К тому же приводы тоже бывают разных типов – электромеханические, электрогидростатические и так далее. Если искать только по словам, то можно многое упустить.

Кроме того, часто в документах и статьях используются аббревиатуры. Сейчас есть тенденция, что если русскоязычная статья помещается в международные издания, то, цитируя первоисточники, используются англоязычные сокращения. Совокупность всех этих сокращений и слов-синонимов затрудняет машинный поиск впрямую, то есть поиск «по словам». Попробуйте поискать эти слова, используя Google или Яндекс. У них тоже есть основы машинного обучения, помогающего более оперативно находить для пользователя релевантную информацию. Но они настроены на общий поиск. Специфические технические статьи и документы они, конечно, найдут, но, зачастую, эти статьи будут находиться на 10-20-й странице поиска. Например, в любом поисковике на запрос «система управления» мы получим массу статей про государственную систему управления, финансовую и другие. Среди них будут, конечно, и технические, но отнюдь не на первых местах.

А инженеры ищут «системы управления» применительно к технике. И не всегда они могут относиться к самолету, потому что часто рассматриваются соседние отрасли, где есть альтернативные решения. Порой, чтобы дважды не «изобретать велосипед», проще посмотреть у кого какие есть наработки, организовать сотрудничество и использовать их достижения для создания конкурентоспособной авиапродукции.

Поэтому одним из важнейших требований к ИАС для ОАК является обучение системы, в том числе в ходе работы с пользователями. Сотрудники корпорации должны иметь возможность ставить лайки и дислайки результатам поиска, выданным системой. Тем самым ИАС, анализируя эти оценки, смогла бы обучаться в ходе эксплуатации и лучше фильтровать данные.

Борьба с информационным вакуумом

Конечно, в первую очередь эта система делается для инженерно-технических работников и научных сотрудников конструкторских бюро (КБ) ОАК. Очень важно на самых ранних этапах – на этапе проектирования, когда определяются технологии для будущего самолета, выбрать те, которые имеют высокий уровень готовности. Если при этом обладать достоверной информацией, то в проект можно заложить такие технологии, которые повысят конкурентоспособность, а к моменту запуска самолета в серию будут доведены до нужного уровня.

Если же оказаться в информационном вакууме, то можно сделать ставку не на те технологии. Например, где-то на конференциях пройдет информация о каких-то хороших новых научных достижениях. Но без понимания хода развития науки и техники в этих направлениях в мире, можно сделать на них ставку, а окажется, что для доведения этой технологии до промышленного уровня необходимы большие финансовые вложения и длительные сроки. Тогда в ходе проектирования самолета потребуется или отказываться от использования этих технологий, или менять принятые конструктивные решения. Это неизбежно приведет к дополнительным задержкам и тратам. А вот использование ИАС позволит тщательно проработать большее количество вариантов за то же время, и снизить риски при выборе перспективных технологий.

Создавая ИАС, в ОАК ставят цель не просто организовать поиск по смыслу документов, но и проводить их аналитику. Насколько часто встречаются такие документы, когда были опубликованы, из каких они взяты источников – профильных сайтов, отчетов, патентов? По совокупности этих аналитических данных можно сделать выводы о достоверности или перспективности той или иной технологии.

Центр обработки данных компании Туполев

Центр обработки данных компании Туполев

В частности, по анализу патентов и патентных заявок можно понять – коммерциализирована ли технология и пошла в серию, или же развитие технологии на сегодняшний день трудно реализуемо. Например, на научных конференциях начинают много и часто делать доклады по какой-то тематике. Параллельно выходит масса научных статей и публикаций. А дальше вдруг наступает спад активности, который может означать либо закрытие исследований и разработок в данном направлении, либо создание коммерческих продуктов и оформление патентов. Поэтому до выхода патента взят тайм-аут, чтобы конкуренты не определили перспективное направление работ и не опередили. Тогда гнаться за их успехом в этом направлении и развивать аналогичные технологии у себя все равно, что бежать за ушедшим поездом. Лучше подумать об альтернативных путях – покупке патента и внедрении у себя этого изобретения, сократив тем самым сроки создания своих аналогичных технических решений.

Чтобы понять, по какому пути идет развитие технологий, требуется более глубокий анализ.

Полдня вместо нескольких месяцев

16 января 2013 года на самолете Boeing 787 японской авиакомпании ANA в ходе выполнения рейса из аэропорта Ямагути-Убе в аэропорт Токио-Ханеда возник пожар в аккумуляторном отсеке лайнера. Причиной стал неконтролируемый разогрев ячеек литий-ионных аккумуляторных батарей из-за использования небезопасной электрохимической схемы и несовершенства системы управления, контролирующей параметры заряда-разряда АКБ. Подобный инцидент произошел на стоявшем в бостонском международном аэропорту Логан Boeing 787 японской авиакомпании JAL. В результате американские и европейские авиационные власти ввели запрет на полеты этой марки самолетов, действовавший три месяца.

В ДПИ-НТЦ в 2018 году было разработано техническое задание на унифицированную аккумуляторную батарею нового поколения на основе импортонезависимых технологий. Техническое задание разрабатывалось при активном участии представителей авиационных КБ, компании «Вертолеты России», отраслевых институтов, институтов РАН и Минобороны России. В ходе работы по созданию техзадания проводился анализ и отбор наилучших технологий и технических решений, учитывался отечественный и мировой опыт эксплуатации авиационных автономных источников тока на ВС различного типа и назначения. При этом факторы безопасности и надежности перспективного аккумулятора стали определяющими.

В итоге были найдены решения, позволившие существенно улучшить энергетические и эксплуатационные характеристики при одновременном обеспечении требуемого уровня безопасности авиационной аккумуляторной батареи. Вместе с тем, «ручной» поиск решений, которые составили основу техзадания, занял достаточно продолжительное время – несколько месяцев.

Позже, имея уже все необходимые результаты поиска, было решено попробовать провести такую же аналитическую работу с использованием одной из существующих информационно-аналитических систем. В результате обработки десятков тысяч документов по теме электрохимических источников тока, проведя автоматический анализ научных статей, патентов и других технических документов из хранилищ данных, менее чем за полдня был получен практически тот же результат.

«На выбор оптимальной электрохимической схемы, ключевых энергетических и эксплуатационных характеристик, а также компоновочных решений с использованием ИАС специалистам ДПИ-НТЦ потребовалось всего несколько часов! Информационно-аналитическая система обеспечила тот необходимый базис, который требуется для принятия технических решений» – констатировал начальник отдела авиационного оборудования ДПИ-НТЦ Валерий Широбоков.

«Аналитическая составляющая при подготовке любой справки или предложения занимает не менее 30-40 % процентов времени, затрачиваемого на подготовку всего документа. При наличии ИАС эти затраты сократятся минимум в 1,5 – 2 раза», – заметил заместитель директора КБ по управлению проектными данными корпорации «Иркут» Юрий Логвин.

На базе пилотного района

На сегодня в ОАК сформированной рабочей группой были разработаны технические требования к такой ИАС, согласованные с представителями всех КБ корпорации. На базе этих требований с отечественными разработчиками аналитических систем проведена предварительная работа, получены технико-коммерческие предложения. Параллельно собрана информация об аналогичных системах в российских холдингах – Росатоме, ОДК, «Вертолетах России» и других. «У них те же проблемы, они с заинтересованностью смотрят на создание такой системы, – говорит Александр Георгиев. – На сегодняшний день ОАК в этой области ушла наиболее далеко: у нас уже формализованы технические требования, на основании которых можно запускать проект по созданию системы на базе пилотного района – ОАК и одно из КБ. Дальше этот опыт будет распространен на все КБ корпорации». О выборе конкретного КБ для пилотной зоны говорить еще рано: участники рабочей группы из разных КБ в инициативном порядке выразили готовность прямого участия в проекте, но сам проект пока проходит согласование.

Пилотный район потребовался потому, что помимо внешних источников информации в ОАК есть внутрикорпоративные источники данных – отчеты, технические задания. Анализируя только внешние источники, без учета внутреннего опыта, взгляд на эту проблему был бы слишком однобоким. Есть и проблема внутренних коммуникаций: в одном КБ порой не знают о достижениях своих коллег по корпорации, которые могли бы помочь ускорить процесс принятия конструкторских решений.

Когда ИАС отработают на базе пилотного района, система будет масштабирована с подключением источников информации остальных КБ и организаций, создав тем самым единое информационное пространство для предприятий ОАК.

Одним из важных моментов при создании ИАС является не только информационная составляющая, но и организационная. «Очевидным является определенный конфликт интересов в процессе реализации системы между инкорпорированными организациями. У каждого КБ имеется свой исторический базис отчасти дублирующих компетенций, конструктивных решений, соисполнителей по кооперации. Поэтому выбор пилотного КБ, отработка процесса внедрения системы на нем и дальнейшее распространение опыта на корпоративном уровне имеет важнейшее значение для успеха работы в целом», – отмечает заместитель начальника управления по работе с интеллектуальной собственностью компании «Туполев» Вадим Пушкин.

На этапе полномасштабного внедрения предстоит большая работа по созданию внутренних нормативных документов, регламентирующих порядок использования корпоративной технической документации, ее хранения в электронном виде. Ведь для ИАС нужны оцифрованные документы. В ОАК же часть документации до сих пор существует лишь в бумажном виде. Также необходимо обучение персонала предприятий работе с ИАС, обучение профильных подразделений по сопровождению системы.

Информационный экзоскелет

Главная задача корпоративной ИАС – взять на себя рутинную работу по поиску и анализу информации. Но человека из этого процесса исключить невозможно. Именно он должен сделать окончательный выбор и принять решение. Тем самым человек остается ключевым элементом этого процесса.

«Система, которая самостоятельно, без участия человека, ищет за него новые решения, да еще на стыке различных областей – в ближайшем будущем это не достижимо, но уже сейчас мы нуждаемся в интеллектуальных инструментах для работы с большими массивами научно-технической информации, – прокомментировал Александр Георгиев. – ИАС является системой поддержки принятия решений конструкторов, инженеров и научных сотрудников предприятий».

Уже сегодня для увеличения силы мышц человека разрабатываются устройства в виде внешнего каркаса и приводящих частей, называемые экзоскелетом. Проводя аналогию с ИАС, без такой системы – «экзоскелета» – имеющийся массив данных и информации нам сегодня уже не поднять.

Текст: Константин Лантратов, Фото: архив ОАК, ОКБ Сухого, «Туполев», «АэроКомпозит»

Начать обсуждение


UP-PRO в сетях