Автор: Борис Ноткин
Дата: 16.01.07 11:09
Чтобы вернуть разговор в конструктивное русло давайте на примере задачи "распознания частичных отказов измерительных каналов АЭС с ВВЭР-1000" рассмотрим типовые этапы синтеза нейросетевого решения и попытаемся определить, где здесь НИОКР, а где не очень.
Насколько я понимаю, в основу этого решения положена гипотеза о возможности косвенного оценивания значения измеряемой величины через значения других измеряемых величин. Существенное отклонение фактического измерения от оцениваемого косвенным путем, будет говорить о наличии неполадок в рассматриваемом измерительном канале (ИК).
Глобально это решение состоит из двух этапов.
1. Анализ и подготовка данных.
2. Представление решения путем обучения нейросети.
На первом этапе последовательно для каждой из прогнозируемых величин должны быть решены следующие задачи (лишь перечень наиболее очевидных).
1.1. Определение наиболее значащих ИК, т.е. ИК, которые физически, структурно или технологически связанных с диагностируемым ИК.
1.2. Выявление тех ИК, показатели которых интересны (полезны) в динамике (это касается как исходных, так и диагностируемых ИК).
1.3. Фильтрация. Особенно актуальна при необходимости оценивания динамики ИК (например может так получиться, что, вторая производная от какого-то одного ИК несет больше информации, чем все остальные ИК вместе взятые)
1.4. Если по каким-то ИК есть запаздывания, то их, скорее всего, необходимо будет компенсировать, а возможно и искусственно форсировать процесс, если последствия отказа ИК проявляются не в момент отказа, и по истечению некоторого времени.
Пояснения. Задачи по пунктам 1.3. и 1.4. решать "вручную" не обязательно. Но необходимо четко себе представлять, какая дополнительная информация необходима для их решения, и также подать эту информацию на вход ИНС, чтобы у нее был необходимый информационный ресурс для их разрешения в своем чреве.
Это только то, что касается входных данных. Отдельный вопрос – форма представления результатов диагностики Она может быть представлена как вероятность отказа ИК, как численное значение наиболее вероятностного отклонения (например, для введения поправок в системы регулирования), как степень износа ИК и прогнозируемое время до ремонта и т.д. В принципе, может быть даже предусмотрена следующая возможность. Если есть уверенность, что отказал лишь ИК, а сам узел (устройство, процесс) функционирует в штатном режиме, то на время ремонта ИК, дабы не останавливать весь процесс, фактические показания ИК могут быть кратковременно заменены на прогнозируемые (конечно, эта возможность зависит от точности прогноза и критичности ошибки измерения).
После того как решены все вышеперечисленные задачи (и решена еще целая куча проблем, которые обязательно возникнут в процессе исследования). Можно переходить ко второму и завершающему этапу - финальному обучению ИНС. Здесь схема "накатанная". Она универсальна для задач любой физической (или даже шире - информационной) природы. Настройки сети выбираются в зависимости от планируемого режима ее функционирования (в скобках рекомендации, для случая обучения по критерию минимума среднеквадратичной ошибки без регуляризации):
а) тупо в режиме памяти (выбирая количество нейронов можно не стесняться и ориентироваться лишь на показатель среднеквадратичной ошибки);
б) в режиме интерполяции (желательно найти разумный баланс между кол-вом нейронов и ошибкой обучения);
в) в режиме экстраполяции (здесь действует правило: чем ниже нелинейности нейросети (т.е. чем меньше нейронов) - тем выше вероятность качества экстраполяции, но гарантий никаких).
Первый этап рассмотренной схемы формально вообще может быть не привязан к нейронным сетям. Он не требует знания нейроинформатики, он требует глубоко понимания предметной области, или, как минимум, возможность продолжительного контакта с экспертами. Никакая нейроинформатика или генетический алгоритм за человека этот этап работы не выполнят. Если на этом этапе не будет проанализирована, собрана и подготовлена информация для принятия качественного решения, то никаким обучением нейросети это не восполнить. И именно этап подготовки и анализа данных для обучения ИНС является наиболее сложным, требует понимания решаемой задачи, профессиональной интуиции и творческого подхода.
Я еще раз хочу обратить внимание на то, что этап подготовки и анализа данных для обучения ИНС формально вообще не связан с обучением ИНС – он связан с исследованием проблемы. Не важно какими инструментами будет пользовать человек при решении этой задачи, это может быть и строгая аналитика и нейронные сети и что-то еще. В любом случае для достижения хоть сколько ни будь гарантировано качественного и надежного результата человек должен понимать решаемую задачу. Разница лишь в том, что в одном случае это понимание формализуется в виде строгих математических формул, а в другом, в виде обучающих выборок и "мягких формул", реализованных путем обучения ИНС.
Слить нейросети всю информацию, которой располагаем - не сложно. И в некоторых случаях такой подход даже приносит удовлетворительные плоды. Вот здесь действительно могут актуализироваться проблемы обучения, ведь нужно из мусора на входе получить качественный результат на выходе. Если же стоит задача получить не хоть какой-то, а действительно качественный результат, то действовать надо другим способом - попытаться понять решаемую задачу и сосредоточиться на подготовке и анализе данных для обучения, а не на самом процессе обучения. Кстати, в последнем случае проблем обучения, как правило, не возникает. А если и возникают, то их природа, по крайней мере, ясна, что положительно сказывается на преодолении этих проблем.
|
|