Номера

2017

2016

2015

2014

2013

2012

2011

2010

2009

2008

2007

2006

Главная / №6 (42) Ноябрь-Декабрь 2011 / Есть мнение

Для оценки надежности микропроцессорных устройств релейной защиты нужен новый критерий

Для оценки надежности в технике существует целый набор различных критериев и параметров, однако, для оценки надежности микропроцессорных устройств релейной защиты (МУРЗ) выбран один из них: «наработка на отказ», который получил повсеместное распространение и указывается в технической документации, рекламных проспектах, тендерной документации как основной показатель, характеризующий надежность МУРЗ. Но насколько оправдан выбор именно этого критерия? Ответ на этот вопрос пытается найти автор данной статьи.

В соответствии с ГОСТ27.002-89[1] надежность трактуется как свойство объекта сохранять во времени в установленных пределах значения всех параметров, характеризующих способность выполнять требуемые функции в заданных режимах и условиях применения, технического обслуживания, ремонта, хранения и транспортирования. Как видно из определения, надежность является комплексным свойством, которое в зависимости от назначения объекта и условий его пребывания может включать безотказность, долговечность, ремонтопригодность и сохраняемость или определенное сочетание этих свойств.

Одним из важнейших показателей надежности является «Наработка на отказ» — показатель, определяемый как отношение суммарной наработки восстанавливаемого объекта к математическому ожиданию числа его отказов в течение этой наработки. Иными словами, это один из параметров надежности восстанавливаемого устройства или технической системы, характеризующий среднюю продолжительность работы устройства (в часах) между отказами (ремонтами). Международный аналог этому параметру: MTBF — Mean (operating) time between failures.

В технической документации производителей этот показатель составляет, обычно период, эквивалентный 50–90 лет. Означает ли это, что интервал времени между двумя отказами МУРЗ должен быть 50–90 лет?

Определение, данное этому термину, утверждает именно это, хотя здравый смысл подсказывает, что в реальной, а не виртуальной жизни, такого быть не может. Как говорится, тем хуже здравому смыслу.

В западной технической литературе используется несколько дополнительных показателей надежности, одним из которых является «Mean Time Between Unit Replacement» (MTBUR) — средняя наработка до отказа (замены) сменного элемента. Аналогичный показатель рекомендуется использовать и в отраслевом российском РД 34.35.310-97 [2], хотя он и не предусмотрен в ГОСТ27.002-89.

Совершенно очевидно, что при модульной конструкции МУРЗ и неремонтопригодности многослойных печатных плат с электронными микрокомпонентами поверхностного монтажа — основы современных МУРЗ, под «сменными элементами» могут пониматься лишь целые модули (печатные платы), а ремонт (восстановление) МУРЗ может быть реализован в большинстве случаев лишь путем замены модуля (печатной платы). В этом случае никакой практической разницы между показателями MTBF и MTBUR не будет и потребители по-прежнему будут недоуменно разглядывать занятные цифры со многими нулями, соответствующие 50–90 годам, и гадать, что бы это значило и как это соотносится с 15–18 годами реального срока службы МУРЗ.

Откуда же берутся такие сногсшибательные цифры для MTBF? Естественно, они могут быть получены лишь теоретически, на основании расчетов. Схематически эти расчеты выглядят так. Допустим, в течение года тестировалось 1000 изделий.

За время теста 10 вышло из строя. Отсюда MTBF будет равно 1 год х (1000 шт/10 шт) = 100 годам или, округленно, 900 000 часам. Эту цифру со многими нулями потребитель и увидит в технической документации или рекламном проспекте на МУРЗ.

Но почему же, в таком случае, МУРЗ не живут так долго, если расчеты говорят, что должны жить. Для этого имеется множество причин. Во-первых, тестирование в течение одного (и даже нескольких) лет не позволяет получить достоверные результаты по отказам, поскольку интенсивность отказов существенно изменяется во времени и использование постоянного значения интенсивности отказов (как в рассмотренном выше примере) не дает достоверных результатов. В действительности же интенсивность отказов во времени постоянна лишь на одном участке и описывается функцией Вейбулла-Гнеденко :


Рис. 1. Зависимость интенсивности отказов от времени: 1 — период приработки (ранние отказы); 2 — период нормальной эксплуатации (случайные отказы); 3 — период старения (износовые отказы); t — время эксплуатации изделия, θ — масштабный коэффициент, β — параметр формы. В период приработки β<1, в период нормальной работы β=1 и в период старения β>1.

В случае непостоянства интенсивности отказов (то есть, когда λ(t) ≠ const) приведенный выше пример расчета MTBF неприменим и его нужно рассчитывать по другим, гораздо более сложным формулам.

Во-вторых, на практике многие производители вместо опытного тестирования большого количества своих изделий в реальных условиях эксплуатации (что дорого и долго) производят теоретический расчет MTBF лишь на основе данных по интенсивности отказов основных электронных компонентов, входящих в состав МУРЗ и их количества в МУРЗ. Выглядит такой расчет следующим образом. Скажем, в устройстве 10 компонентов, каждый из которых имеет интенсивность отказов 10-7 ч-1. Тогда интенсивность отказов всего устройства 10•10-7 ч-1 = 10-6 ч-1, а наработка на отказ 106 ч = 1 млн. ч. И вот тут-то появляется огромное количество неопределенностей, которые невозможно предусмотреть никакими расчетами. Сами по себе качественные электронные компоненты известного и надежного производителя могут надежно работать в аппаратуре в течение многих десятков лет и имеют достаточно низкую интенсивность отказов. Но все это справедливо лишь для определенных условий эксплуатации, на которые эти элементы рассчитаны. Именно для таких условий и приводятся показатели интенсивности отказов в справочных материалах по элементам. Именно эти показатели интенсивности отказов и принимаются в расчетах производителями МУРЗ. Что же мы имеем в реальности:

Пример 1. Электролитические конденсаторы, используемые в импульсных источниках питания МУРЗ. Даже высококачественные электролитические конденсаторы общепромышленного применения известных Японских производителей сравнительно быстро выходят из строя под действием высокочастотных токов, протекающих через них в импульсных источниках питания, рис. 2. При этом, вытекающий из них электролит приводит к значительным повреждениям и многих других компонентов схемы и даже проводников и межслойных соединений печатной платы.


Рис. 2. Неисправные импульсные источники питания МУРЗ различных типов с поврежденными электролитическими конденсаторами. На левом рисунке видны следы разрушения на печатных платах, вызванные протекшим электролитом.

Выход из строя источников питания по этой причине происходит, примерно, через 12—15 лет эксплуатации в МУРЗ разных типов, изготовленных разными производителями. Проблема обусловлена неправильным выбором типов электролитических конденсаторов производителями МУРЗ, отсутствием в схемах МУРЗ технических средств по защите электролитических конденсаторов от высокочастотных токов, вызывающих нагрев электролита и возрастание его химической активности. Была ли учтена эта проблема с электролитическими конденсаторами при расчетах MTBF? Разумеется, нет!

Пример 2. Дисковые керамические конденсаторы, опрессованные пластмассой, рис. 3.


Рис. 3. Фрагмент модуля логических входов МУРЗ типа REL316 с поврежденными конденсаторами С и с отказавшими оптронами Opt.

В процессе эксплуатации МУРЗ в субтропическом климате с высокой влажностью воздуха такие конденсаторы часто являются причиной отказа МУРЗ из-за появления проводимости между обкладками, обусловленной миграцией ионов серебра с одной поверхности керамического диска на другую, происходящую под воздействием приложенного напряжения в условиях повышенной влажности и при не очень качественной герметизации. В результате, керамические конденсаторы, которые обычно являются надежными элементами с большим сроком службы, становятся причиной многочисленных отказов МУРЗ примерно через 15 лет эксплуатации. Была ли учтена эта проблема при расчете MTBF? Разумеется, нет!

Пример 3. Транзисторные оптроны, имеющиеся в больших количествах в цепях логических входов любого МУРЗ, рис. 3. Характерной особенностью оптронов является постепенное уменьшение коэффициента передачи вследствие деградации оптической пластмассы, соединяющей светоизлучающий и световоспринимающий элементы оптрона. В результате, если режим работы оптрона в МУРЗ был выбран на начальном участке характеристики (для ограничения мощности, рассеиваемой цепями логических входов), то через 13–16 лет эксплуатации МУРЗ происходят массовые отказы их логических входов. Была ли учтена эта проблема при расчете MTBF? Ответ очевиден.

Пример 4. В технической документации на такие важнейшие элементы любого микропроцессорного устройства, как EEPROM (перезаписываемые элементы памяти) указан срок сохраняемости записанных данных 100 лет, рис. 4. На практике же, они в массовом количестве начали «сбрасывать» записываемые в них данные уже через 15 лет эксплуатации в составе МУРЗ. Был ли учтен такой эффект при расчетах MTBF?

В статье сотрудников одной из компаний производителей МУРЗ [3] отмечается, что их реле имеют MTBF 74 года и при этом абсолютно все неисправности были выявлены в процессе эксплуатации собственной встроенной системой самодиагностики МУРЗ. Позволим себе усомниться в правдивости таких заявлений, поскольку никакая внутренняя система самодиагностики МУРЗ не в состоянии зафиксировать утечку электролита из конденсаторов или ухудшение коэффициента передачи оптрона или ускоренный саморазряд элементов флэш-памяти или проблемы в функционировании контролирующего элемента под названием «watchdog». В результате получаем лавинообразный поток отказов МУРЗ возникающий через 15–18 лет эксплуатации при заявленном производителями MTBF в 50–90 лет.


Рис. 4. Отказавшие через 15 лет эксплуатации элементы памяти EEPROM, выпущенные в 1996 году на фоне выдержек из технической документации на них, гарантирующей сохранение записанных данных в течение 100 лет.

Интересно, что проблемы такого рода не возникали с электромеханическими реле защиты, которые верой и правдой служили (да и еще служат) многие десятки лет. В качестве примера можно привести токовое реле с зависимой выдержкой времени типа RI (предшественник и источник копирования хорошо известного советского реле РТ-80), которое выпускалось почти сто лет тому назад компанией Allmanna Svenska Elektriska Aktiebolaget — ASEA (в английской транскрипции: General Swedish Electrical Limited Company) в Шведском городе Vasteras. В верхнем левом углу реле можно заметить свастику с буквами: A, S, E, A — логотип (товарный знак) компании ASEA, рис.5, стоявший на этих реле до 1933 года, когда этим знаком начали пользоваться нацисты в Германии. Таких реле было достаточно много в электроэнергетике бывшего Советского Союза (но свастика на них была тщательно затерта) и они хорошо известны старому поколению релейщиков. Эти реле до недавнего времени кое-где еще можно было найти в эксплуатации, в том числе и в России, причем, заменены они были не потому, что утратили способность выполнять свои функции, а скорее потому, что продолжать эксплуатировать реле столетней давности уже просто совестно.


Рис. 5. Электромеханическое реле типа RI (ASEA), выпущенное почти сто лет тому назад и сохранившее свои эксплуатационные качества до наших дней.

В последние годы в среде специалистов приходит понимание того, что МУРЗ являются устройствами менее надежными, чем электромеханические реле. Решением этой проблемы принято считать резервирование МУРЗ. Актуальность этой проблемы возрастает с ростом количества функций, закладываемых в единичный терминал МУРЗ.

В многофункциональных реле, у которых «все яйца — в одной корзине» (рис. 6), отказ или неправильная работа всего лишь одного из этих «яиц» может привести к отключению генератора, что связано с огромным ущербом. Поэтому, при использовании многофункциональных МУРЗ для защиты ответственных объектов сами производители рекомендуют [3] (несмотря на приводимые ими же значения MTBF во много десятков лет!) применение сдвоенных, комплектов МУРЗ, рис. 7. При этом, расчетное значение MTBF для такого сдвоенного комплекта получилось в [4] равным ... 500 лет!

Здесь возникают дополнительные вопросы. Во-первых, кому нужны и чего стоят такие совершенно фантастические значения MTBF, не имеющие ничего общего с реальной практикой? Во-вторых, к тяжелым авариям в энергосистемах могут привести не только «не отключения» участков с аварийным режимом работы, но и ложные отключения неповрежденных участков энергосистемы (генераторов, нагруженных линий) с перебросом нагрузки на другие генераторы и линии именно по такому сценарию развивалась одна из крупнейших аварий в США. Это значит, что для МУРЗ существует не одно, а два неправильных состояния: и несрабатывание, и ложное срабатывание. В таком случае практическое использование двух идентичных комплектов: основного и резервного оказывается не таким простым делом, поскольку не понятно, как в этом случае должны быть соединены между собой выходные контакты МУРЗ, воздействующие на выключатели: по логической схеме «И» или по логической схеме «ИЛИ»?


Рис. 6. Многофункциональное МУРЗ типа М-3430. Номера, заключенные в белых кружках обозначают стандартные функции релейной защиты по классификации ANSI, принятой в мире.

Любой вариант соединения снижает вероятность одного из неправильных состояний МУРЗ, но при этом настолько же увеличивает вероятность другого. То есть, использование двух идентичных комплектов МУРЗ явно недостаточно для повышения надежности релейной защиты ответственных объектов и нужно применять три комплекта с мажорированием выходных сигналов по принципу «два из трех».


Рис. 7. Сдвоенный комплект защит генератора для повышения надежности защиты.

Еще одна проблема с использованием MTBF может появиться в ближайшем будущем. Появление на рынке универсальных функциональных модулей [5, 6], которые будут продаваться и приобретаться как отдельные независимые изделия из которых будет компоноваться МУРЗ (как это происходит сегодня с настольными персональными компьютерами), переводит эти отдельные печатные платы-модули из разряда сменных комплектующих в разряд самостоятельных неремонтируемых изделий, причем, изделий, весьма разнородных, имеющих различные показатели надежности.

Очевидно, что в этом случае, во-первых, показатели надежности должны рассчитываться для каждого такого модуля отдельно, а во-вторых, показатель MTBF к ним не может быть применим вообще, как к невосстаналиваемым изделиям.

Еще одно сомнение в использовании MTBF для МУРЗ заключается в том, что даже при единичном его отказе ущерб может быть очень значительным и поэтому тот факт, что между первым и вторым отказами будет большой интервал времени (большое значение MTBF) мало чем поможет делу.

В связи с тем, что показатель MTBF себя полностью дискредитировал огромными значениями, абсолютно не соответствующими действительности и не дающими никакой реальной информации о надежности МУРЗ, а также его очевидными недостатками, использование MTBF для оценки надежности МУРЗ должно быть прекращено.

В качестве нового показателя надежности для МУРЗ рекомендуется [7] использование гаммапроцентной наработки до отказа, то есть наработки, в течение которой отказ объекта не возникает с определенной вероятностью, выраженной в процентах. Например, 95%-ная наработка до отказа в течение не менее 5 лет означает, что за 5 лет работы должно отказывать не более 5% устройств находящихся в эксплуатации.

Причем, значение это должно указываться не только для МУРЗ в целом, но и для составляющих его функциональных модулей-плат. Имея такой удобный и понятный показатель, потребитель мог бы отследить количество вышедших из строя МУРЗ (или отдельных его модулей) за определенный промежуток времени и предъявить производителю претензии, если в течение этого промежутка отказало значительно большее количество реле, чем это было гарантировано производителем. Имея такой показатель, потребителю будет значительно легче ориентироваться и на будущем рыке универсальных модулей [6], выбирая для себя наиболее приемлемый вариант, по соотношению цена/качество.

В дополнение к этому, от производителей необходимо потребовать указания в технической и тендерной документации среднего срока службы отдельных модулей и рекомендации относительно периодичности превентивной замены этих модулей с целью поддержания высокого уровня надежности релейной защиты. Например, для источника питания это может быть 8–10 лет; для модуля логических входов — 12 лет; для модуля центрального процессора — 15 лет; для модуля аналоговых входов — 17 лет, и т.д. Эти данные должны быть известны добросовестному производителю, отслеживающему статистику отказов и повреждений своих изделий. Вопрос о том, за чей счет должна производиться такая превентивная замена модулей должен решаться по договоренности между производителем и потребителем. Например, производитель может гарантировать разовую (возможно, частичную, например, только для источников питания) превентивную замену модулей, а все последующие замены должны производиться за счет потребителя. Массовая превентивная замена, правда, не целых блоков, а лишь электролитических конденсаторов в исправных блоках питания МУРЗ типов REL/REC/RET серии 316, производства АВВ (технология которых еще допускает такую замену), уже проводится по рекомендации автора в одной из энергетических компаний, имеющей в эксплуатации большое количество МУРЗ этой серии. Рассматривается вопрос о начале превентивной замены конденсаторов и в блоках питания МУРЗ производства Siemens, отработавших более 10 лет, а также интегрального модуля типа DS1386-32K со встроенной литиевой батарейкой и гарантированным сроком службы 10 лет.

Использование предлагаемого критерия оценки надежности МУРЗ и дополнительных сведений о надежности, рассмотренных выше, позволит изменить характер взаимоотношений между потребителями и производителями МУРЗ и существенно увеличить надежность релейной защиты. Практическая реализация этого зависит от потребителя, который должен заложить необходимые требования к надежности МУРЗ в тендерной документации вместе с основными техническими требованиями [8], поскольку надеяться на скорые изменения нормативных документов не приходится.

Литература

  1. ГОСТ27.002-89Надежность в технике. Основные понятия. Термины и определения, 1989.
  2. РД 34.35.310-97.Общие технические требования к микропроцессорным устройствам защиты и автоматики. — М.:, ОРГРЭС, 1997.
  3. Mozina C. J, Yalla M. V.V.S. Design, Manufacturing and Application of Multifunction Digital Relays for Generator Protection. — Canadian Electrical Association, Montreal, 1996.
  4. Ward S. Improving reliability for power system protection — Relay Protection and Substation Automation of Modern Power Systems (RFL Electronics Inc., USA), Чебоксары, 9–13 сентября 2007 г.
  5. Гуревич В. И. Релейная защита: размышления о будущем. — Электрические сети и системы, 2011, № 1, с. 73–80.
  6. Гуревич В. И. Новая концепция построения микропроцессорных устройств релейной защиты. — Компоненты и технологи, 2010, № 6, с. 12-15.
  7. Гуревич В. И. Проблемы оценки надежности релейной защиты. — Электричество, 2011, № 2, с. 28–31.
  8. Гуревич В. И. Проблемы стандартизации в области микропроцессорных устройств релейной защиты. — Компоненты и технологи, 2012, № 1, с. 6–9.

В. И. ГУРЕВИЧ,
канд. техн. наук