Evitar avarias, tolerando falhas
M 116
Na primeira parte (revista “Manutençãoâ€? 114/115) foi abordado como evitar as falhas. Nesta segunda parte, descrevem-se as tĂŠcnicas de conceção de hardware para fazer face a falhas transitĂłrias e permanentes nos sistemas baseados em microcontroladores uma vez que sĂŁo produzidos.
vel: consideremos o que aconteceria se
sem condutor deixassem de funcionar em plena manobra a alta velocidade. Neste caso, a tolerância às falhas Ê a única opção.
A tolerância às falhas pressupþe que
avaria transitĂłria, um simples "tentar
O conceito de cobertura permite ava-
' ! -
de novo9
-
das para as evitar.
O mais indicado seria que os trĂŞs pro-
pacidade para detetar todos os modos
›
Um sistema Ă prova de falhas nĂŁo
cessos ocorressem o mais depressa
possĂveis de avarias e lidar com as mes-
pode retomar um funcionamen-
possĂvel, para que a interrupção da
mas de forma adequada. A cobertura
to seguro depois da deteção de
transmissĂŁo de dados se mantenha no
deve ser quase completa se se preten-
*
mĂnimo. A redundância de proteção
-
encerrado de forma previsĂvel, sem
ĂŠ introduzida na forma de software e
rar e evitar avarias não são açþes mutu-
produzir resultados errados;
hardware adicionais, numa tentativa de
amente exclusivas. Ambas as tĂŠcnicas
Um sistema que tolera falhas tem a
alcançar o objetivo do projeto, ou seja,
capacidade incorporada (sem ajuda
a recuperação quase instantânea das
um desenho em particular. A introdu-
externa) para preservar a correta
4 < !
ção de componentes redundantes e a
execução continuada dos seus pro-
impossĂvel lidar com todos os tipos de
inclusão de módulos de reposição não
gramas e funçþes de entrada/saĂda
falhas que possam ocorrer nos compo-
-
perante certas falhas de funciona-
nentes. Algumas falhas sĂŁo muito sus-
dade do sistema. De facto, a repetição
mento.
cetĂveis de causar uma perda grave no
de componentes de baixa qualidade
sistema, e a Ăşnica coisa que pode fazer
!
4 # -
ĂŠ reduzir aceitavelmente essa perda.
tenha menos probabilidades de com-
ples ĂŠ, de facto, muito difĂcil de aplicar
Os circuitos sem redundância, como os
pletar a sua missĂŁo do que um sistema
num sistema real. Se assumirmos que,
geradores de relĂłgio, necessitam de um
simples. A utilização de componentes
no sistema temos uma falha perma-
cuidado especial na conceção para redu-
de elevada qualidade e um design redu-
nente ou transitĂłria, para satisfazer a
zir a probabilidade de que apenas uma
" #
necessidade de uma execução correta
falha termine com um sistema que, caso
$ #
e de forma continuada devem ser cum-
* <
% &
â&#x20AC;ş
68
NOTA TĂ&#x2030;CNICA
William Marshall RS Components Tel.: +351 800 102 037 ¡ Fax: +351 800 102 038 marketing.spain@rs-components.com ¡ rsportugal.com
lhas, apesar de todas as medidas toma-
! -
pridos trĂŞs requisitos. A saber: â&#x20AC;ş
â&#x20AC;ş
â&#x20AC;ş
Deteção de erros:
A cobertura ĂŠ a probabilidade condicio-
O sistema deve ser capaz de dete-
nal de que uma falha seja detetada e
de atingir a missĂŁo com sucesso, inclu-
tar os seus prĂłprios erros;
tratada de forma segura. O termo â&#x20AC;&#x153;se-
sivamente com componentes que te-
gurança=
nham falhado. A atenção especial dada
DiagnĂłstico de avarias:
sistema sem efeitos adversos (Ă prova
para os problemas de disponibilidade
Depois de detetar um erro durante
de avarias) ou o isolamento de compo-
na etapa da elaboração do desenho
a execução da aplicação do progra-
nentes defeituosos mantendo um fun-
permite que os módulos de exploração
ma, o sistema deve conseguir isolar
cionamento continuado (tolerância a
utilizados em Marte em 2003 tenham
a falha de um grupo de componen-
falhas) ou o isolamento do componen-
superado por muitos anos o seu perĂo-
tes ou mĂłdulos que possam ser
te defeituoso mantendo um funciona-
do de vida de missĂŁo.
negligenciados, substituĂdos sob o
mento continuado (tolerância a falhas
controlo do processador ou desli-
num sistema baseado na redundância).
gados;
Este termo Ê tambÊm conhecido como Safe Failure Fraction (SFF), ou fração de
SIMPLEX E SIMPLEX + DIAGNĂ&#x201C;STICO
Recuperação após a falha:
avarias seguras, e expressa-se em per-
Os sistemas Simplex, o 1oo1 (um de
Uma vez localizada a falha, o sistema
> ! ?
um), nĂŁo tĂŞm nenhuns meios para de-
deve tomar medidas para eliminar
quais, inclusivamente, uma perda con-
tetar falhas e possuem uma grande
ou minimizar o seu efeito. Para uma
# < -
probabilidade de avaria de uma forma