Онлайн-версия CD-ROM приложения к книге Г.Р.Громова
"От гиперкниги к гипермозгу: информационные технологии
эпохи Интернета. Эссе, диалоги, очерки
."

Г.Р.Громов

Надежность персональных ЭВМ и производственная загрузка фирменной сети сервиса

"Микропроцессорные средства и системы."  - 1985. - № 4. - С. 89.

Введение

В статье сделана попытка оценить количественную связь надежности ПЭВМ с относительной нагрузкой, создаваемой действующим парком машин на сеть сервиса. При этом надежность ПЭВМ измеряется в часах наработки на отказ, а загрузка сети сервиса - долей общего числа произведенных машин, которые потребуют ремонта за фиксированный отрезок времени.

На рис. 3.1 приводится график интенсивности отказов массовых изделии радиоэлектроники. Традиционно на нем выделяют три основных этапа эксплуатации.

Рис. 3.1. Три периода эксплуатации:

I - выгорание; II - постоянная интенсивность отказов; III - старение.

 

Первый - с высокой интенсивностью отказов - получил название - период "выгорания". В этот период "выжигаются" дефектные микросхемы, проявляются наиболее грубые погрешности изготовления и сборки изделий электромеханики и т.д. Только после устранения всех этих неисправностей наступает второй этап - период активной эксплуатации изделия. В общем случае предполагается, что за это время интенсивность отказов меняется слабо[2]. Третий   этап - рост интенсивности отказов из-за физического износа оборудования. В дальнейшем изложении предполагается, что:

1) на предприятиях, производящих ПЭВМ, приняты необходимые меры, чтобы период "выгорания" был в основном завершен еще на цеховых испытательных стендах, где отдельные узлы и блоки, а затем и машину в целом "гоняют" для этого в условиях предельных напряжений питания, на "тепло" и "влагу", вибрацию и т.д.;

2) моральный износ ПЭВМ наступает значительно раньше их физического износа.

В случае, когда указанные выше предположения имеют под собой реальные основания, можно ожидать, что за период эксплуатации ПЭВМ интенсивность отказов окажется близко к постоянной и, соответственно, вероятность отказа будет характеризоваться экспоненциальным законом распределения. До сих пор экспоненциальное распределение применялось, в основном, в расчетах надежности той части военной и аэрокосмической техники, где предположения 1 и 2, как правило, выполняются [1]. Как уже неоднократно отмечалось, надежды на экономическую эффективность массового внедрения ПЭВМ в народное хозяйство теряют под собой всякую почву, если не будут приняты необходимые организационно-технические меры для обеспечения промышленностью, по крайней мере, столь же высокого уровня надежности[3] и для ПЭВМ [2,3].

Оценка экономической дилеммы распределения ресурсов: "надежность ПЭВМ - сеть сервиса" Известно, что в настоящее время большая часть неисправностей действующего парка ЭВМ устраняется непосредственно бригадами обслуживающего их персонала. Контакты со специализированной службой сервиса ограничиваются, как правило, лишь случаями достаточно тяжелых неисправностей или необходимостью получения ЗИПа. В отличие от этого сложившегося у нас в стране за последние десятилетия парка "самообслуживаемых" ЭВМ, машины индивидуального пользования - ПЭВМ - идут с завода-изготовителя непосредственно на рабочие столы специалистов, ранее незнакомых с вычислительной техникой. Поэтому ситуация здесь складывается принципиально иная - практически любая неисправность - повод к рабочему контакту со службой сервиса.

Таким образом, вероятность отказа ПЭВМ и вероятность поступления заявки в службу сервиса для парка ПЭВМ следует считать численно равными.

Из рис. 3.2, выполненного для экспоненциального закона распределения вероятности отказов, можно оценить, какая часть ПЭВМ останется работоспособной - не испытает ни одного отказа (т.е. не потребует внимания со стороны службы сервиса) за тот или иной отрезок времени при различных значениях надежности выпускаемых ПЭВМ.

Рис. 3.2. Относительная доля р [%] парка машин, сохранивших работоспособность за время эксплуатации t [ч], для различных - значений показателя надежности N (наработка на отказ).

Примечание. Рисунок выполнен для экспоненциального закона распределения в упрощающем качественный анализ предположения, что р (t) = еt/N (см., например, [1, с. 15])

 

Известно, что в условиях роста тиража массово-выпускаемых изделий микроэлектроники общая стоимость начальных затрат на исследования и разработку того или иного конкретного технологического решения (в данном случае решения, повышающего надежность ПЭВМ), приведенная к стоимости единичного изделия, быстро снижается.

В то же время "цена устранения одного отказа" изделия за период эксплуатации снижается (даже там, где она действительно снижается...) весьма медленно, так как уровень автоматизации работ, выполняемых в мастерских сети сервиса, неизбежно значительно отстает от уровня автоматизации заводского производства. Кроме того, непреодолимым барьером для снижения средней "цены единичного отказа" ПЭВМ остается стоимость доставки машины в пункт обслуживания (или, наоборот, вызова представителя службы сервиса). Поэтому с расширением масштабов массового производства ПЭВМ экономически целесообразно соответственно наращивать долю материально-технических ресурсов, направляемых на решение первоочередной, наиболее острой из всех задач массовой компьютеризации - повышение эксплуатационной надежности выпускаемых машин.

Техника оценки

Связь годовой производственной загрузки сети сервиса с надежностью парка выпускаемых ПЭВМ показана на рис. 3.3. Следует отметить, что переход от оси времени на рис.3.3 к "астрономическому" времени, т. е. от суммарного времени эксплуатации нерегулярно включаемого в работу индивидуального инструмента, каким является ПЭВМ, к "астрономическому" времени (например, для календарного планирования загрузки сети сервиса) - непростая операция.

В зависимости от типа и конфигурации ПЭВМ перерывы в работе различным образом влияют на интенсивность отказов. Например, как показывает опыт работы действующих в настоящее время вычислительных центров, интенсивность отказов твердотельных блоков электронной аппаратуры весьма заметно повышается после любого перерыва в работе машины и, кроме того, существенно связана с длительностью этого перерыва. Наиболее благоприятны для блоков электроники условия длительной круглосуточной работы, когда практически отсутствуют неизбежные при любых запусках машины резкие колебания напряжения питания; остаются относительно постоянными температурный режим, влажность и другие параметры эксплуатации. Поэтому, в первом приближении, можно считать, что для блоков твердотельной электроники резкое "ускорение бега часов" по шкале старения аппаратуры после перерыва в работе машины компенсирует (а нередко и значительно перекрывает) "остановку часов старения" на период выключения машины, т. е. эквивалентное время старения составит 9 тыс.ч. за календарный год.

Рис. 3.3 Увеличение доли р [%] парка работоспособных машин с ростом показателя надежности N для двух значений времени эксплуатации: t1=900 ч, t2=9 тыс.ч

 

В то же время электромеханические внешние устройства ЭВМ (диски, печатающие устройства и др.) подвергаются физическому износу, естественно, лишь в движении. Поэтому в "холодном" состоянии "часы времени эксплуатации" для электромеханических устройств почти полностью останавливаются[4] (если не учитывать рост интенсивности отказов от пребывания в "холодном" состоянии электронных блоков электромеханических устройств - контроллеров).

Оценим границы разброса значений на графиках, отражающих связь вероятности безотказной работы с показателем надежности ПЭВМ. Пусть рабочая загрузка парка ПЭВМ класса, например, ДВК-2 характеризуется средним временем полезной работы 3 ч за полный рабочий день, или около 900 ч. суммарного времени эксплуатации за календарный год (все остальное время машина, как предполагается, выключена). Для ЭЛТ дисплея и электромеханических устройств ПЭВМ такой режим эксплуатации означает около 900 "часов старения" за год работы машины у пользователя. Таким образом, в рамках принятых выше предположений об ожидаемом характере эксплуатации ПЭВМ, "темп старения" твердотельных блоков, оцениваемый на уровне 9 тыс.ч. старения в год, окажется в 10 раз выше, чем соответствующий темп для ЭЛТ и электромеханических устройств. Для других электромеханических устройств: принтеров, графопостроителей, дигитайзеров и т. д. - разница в темпе старения окажется еще больше, так как в среднем они включаются лишь на небольшую часть от общего времени работы ПЭВМ.

Итак, в первом приближении можно считать, что оценку вероятности безотказной работы твердотельных блоков ПЭВМ можно выполнять по нижней кривой рис.3.3, построенной в предположении, что "темп старения" ПЭВМ составляет 9 тыс.ч. в год, тогда как для ЭЛТ и электромеханических блоков - по верхней, соответствующей "темпу старения", - 900 ч в год.

Пример.

Пусть необходимо выполнить приближенную оценку ожидаемой нагрузки на сеть сервиса для парка профессиональных ПЭВМ, выпускаемых в следующей конфигурации:

-  микроЭВМ (процессор, ОЗУ, ПЗУ, контроллеры и бесконтактная клавиатура) с надежностью N1=20 тыс.ч.;

-  ЭЛТ с надежностью N2=15 тыс.ч. наработки на отказ:

-  гибкий диск с надежностью N3=10 тыс.ч.;

-  принтер с надежностью N4=5 тыс.ч.

По нижней кривой рис.3 находим, что для показателя надежности N1=20 тыс.ч. вероятность безотказной работы в течение года твердотельных блоков для микроЭВМ составляет р1=0,68.

По верхней кривой находим вероятности безотказной работы остальных блоков: для ЭЛТ р2=0,95; для диска p3=0,93; для принтера р4=0,84.

В предположении, что вероятности выхода из строя отдельных блоков статистически независимы, находим вероятность безотказной в течение года работы такой ПЭВМ: p=p1*p2*p3*p4 =0,5.

Таким образом, приближенная оценка вероятности безотказной работы ПЭВМ, выполненная по рис. 3.3 с учетом показателей надежности отдельных блоков и приведенных выше предположений о характере их эксплуатации, дает основания ожидать, что около половины из общего парка таких ПЭВМ в течение года эксплуатации потребуют внимания фирменной службы сервиса.

Примечание. Используемые в данном примере численные значения характеристик надежности отдельных блоков ПЭВМ не имеют отношения к реальным параметрам какой-либо из выпускаемых в настоящее время машин, а приводятся здесь с единственной целью проиллюстрировать возможную технику оценки при работе с графиками рис. 3.3.

Итак, системный коэффициент типа старения (КТС), связывающий календарное время и время активной эксплуатации машины, будет заметно отличаться для разного типа ПЭВМ и различных конфигураций одного типа ПЭВМ.

Разработка корректных методов оценки численного значения КТС для массовых изделий микропроцессорной техники, в том числе для основных классов выпускаемых в настоящее время ПЭВМ, - одна из актуальных задач, которые ставит перед наукой о надежности практика массового внедрения микроЭВМ. Решение этой задачи позволило бы, в частности, указывать в техническом паспорте на ПЭВМ раздельно две практически полезные характеристики надежности:

1)  для времени активной эксплуатации изделия;

2)  для периода длительных пауз в его работе.

В настоящее время именно так указывается гарантийный срок для значительной части радиоэлектронной аппаратуры - раздельно: на период хранения изделия и на время его активной эксплуатации (по существу те же два типа "старения").

В общем случае, до получения уточненных значений КТС для основных классов машин используемого парка ПЭВМ, рабочие оценки загрузки фирменной сети сервиса, выполняемые по рис.3.3, носят ориентировочный характер и должны корректироваться с накоплением опытных данных.

Заключение

Текущая крутизна характеристики "надежность - сервис" позволяет оценить, насколько заметно отражается на производственной загрузке сети сервиса изменение надежности машины. Например, как видно из рис. 3.3, после достижения такого уровня надежности ПЭВМ, при котором 70 - 80% машин уже не требуют внимания службы сервиса в течение года их эксплуатации, дальнейшее повышение надежности все слабее отражается на изменении загрузки сети сервиса. Не останавливаясь здесь на деталях разработки формального аппарата поиска экономически оптимальной стратегии распределения ресурсов между задачами развития сети сервиса и повышения надежности выпускаемых машин, отметим лишь, что с ростом тиража выпуска машин точка "экономического оптимума" на характеристике "надежность - сервис" перемещается вправо-вверх, так как с увеличением парка машин соответственно растет экономическая цена "процента отказов". И наоборот, для малых серий ПЭВМ точка экономического оптимума оказывается в области меньших значений показателя надежности на интервале более высокой крутизны характеристики "надежность - сервис".

ЛИТЕРАТУРА

1.  Лонгботтом Р. Надежность вычислительных систем. - М.: Энергоатомиздат, 1985. - С. 283.

2.  Громов Г.Р. Профессиональные  приложения персональных ЭВМ. //Микропроцессорные средства и системы. - 1985. - N93. - С.9 - 15.

3.  Громов Г.Р. Макси-проблема микропроцессоров. - Известия, 20 июля 1985г. - №201. - С. 2.


 

[2] Практически это зависит, разумеется, от многих, в том числе и не всегда учитываемых традиционными моделями надежности [1] факторов, которые определяются, в основном, конкретными областями приложений и соответственно различными условиями эксплуатации ЭВМ.

[3] Как отмечалось в работе [2], согласно одному из последних определений. "ПЭВМ - это вычислительная машина с надежностью военной аппаратуры и ценой изделия бытовой электроники".

 

[4] Как, по-видимому, в значительной степени приостанавливается ход "часов старения" на время, пока выключены электровакуумные приборы, например электронно-лучевая трубка (ЭЛТ) дисплее.