Strona główna Zawody w Przemyśle Ciężkim Inżynier ds. niezawodności: jak liczy się MTBF i planuje przestoje w fabryce

Inżynier w kasku i kamizelce kontroluje duże maszyny w hali produkcyjnej — Źródło: Pexels | Autor: Kateryna Babaieva

Zawody w Przemyśle Ciężkim

Inżynier ds. niezawodności: jak liczy się MTBF i planuje przestoje w fabryce

Przez

IndustrialSoul

29 grudnia, 2025

299

Rate this post

Spis Treści:

Rola inżyniera ds. niezawodności w fabryce ciężkiego przemysłu

Inżynier ds. niezawodności w środowisku przemysłu ciężkiego łączy w sobie kompetencje technika utrzymania ruchu, analityka danych i planisty produkcji. Jego główne zadanie to takie zarządzanie parkiem maszynowym, aby maszyny pracowały stabilnie, przewidywalnie i z możliwie najmniejszą liczbą awarii. Kluczowymi narzędziami są tutaj wskaźniki niezawodności, z których szczególnie ważny jest MTBF (Mean Time Between Failures – średni czas między awariami).

W fabrykach hutniczych, górniczych, cementowniach czy zakładach chemicznych każda nieplanowana przerwa w pracy linii oznacza potężne koszty. Zatrzymanie pieca hutniczego, młyna cementu czy kruszarki w kopalni przekłada się nie tylko na utratę produkcji, ale także na wzrost ryzyka wypadków, pogorszenie jakości i większe zużycie energii podczas ponownego rozruchu. Z tego powodu planowanie przestojów ma tak duże znaczenie, a inżynier ds. niezawodności musi umieć liczyć i interpretować MTBF znacznie precyzyjniej niż tylko „na oko”.

W odróżnieniu od klasycznego utrzymania ruchu, które często działa reakcyjnie (naprawa po awarii), podejście niezawodnościowe koncentruje się na analizie danych, wyciąganiu wniosków i modelowaniu ryzyka awarii. Dzięki temu można ustalić optymalne momenty przestojów planowych, dobrać odpowiednie strategie konserwacji (reakcyjna, prewencyjna, predykcyjna) oraz zaplanować zasoby (ludzi, części, narzędzia) tak, aby minimalizować łączny koszt eksploatacji.

W praktyce inżynier ds. niezawodności zajmuje się m.in. tworzeniem i aktualizacją strategii RCM (Reliability Centered Maintenance), analizą FMEA, wdrażaniem systemów monitoringu warunków pracy (CM – Condition Monitoring) oraz raportowaniem wskaźników: MTBF, MTTR, MTTF, dostępności technicznej, wskaźników przestojów i awaryjności. Każdy z tych elementów jest powiązany, a umiejętność poprawnego liczenia i wykorzystywania MTBF stanowi fundament do skutecznego planowania przestojów w fabryce.

Podstawowe pojęcia niezawodności: MTBF i jego „rodzina”

MTBF – co to jest i kiedy ma sens

MTBF (Mean Time Between Failures) to średni czas pracy urządzenia między kolejnymi awariami. W praktyce przemysłowej definiuje się go jako stosunek całkowitego czasu pracy danego urządzenia do liczby awarii występujących w tym okresie (z pominięciem planowanych przestojów, zależnie od przyjętej definicji w danym zakładzie).

MTBF ma sens analityczny głównie dla urządzeń naprawialnych, które po awarii są przywracane do pracy. Dotyczy więc np. pomp, przekładni, sprężarek, suwnic, walcarek, przenośników, silników elektrycznych. Nie stosuje się go natomiast wprost do elementów jednorazowych (bez naprawy), jak bezpieczniki czy filtry, gdzie bardziej adekwatny będzie wskaźnik MTTF.

Ważne jest też rozróżnienie, czy MTBF liczymy dla pojedynczego urządzenia, całej klasy maszyn (np. wszystkie pompy danego typu) czy też całego systemu (np. linia pakująca). Inżynier ds. niezawodności musi jasno zdefiniować, jakiego obiektu dotyczy dane MTBF, bo od tego zależy późniejsza interpretacja i planowanie przestojów.

MTTR, MTTF, dostępność techniczna – kluczowe uzupełnienia MTBF

Sam MTBF niewiele mówi o tym, jak często i jak długo linia rzeczywiście stoi. Dlatego zwykle analizuje się go razem z innymi wskaźnikami. Najważniejsze z nich to:

MTTR (Mean Time To Repair) – średni czas naprawy, liczony od momentu wystąpienia awarii do pełnego przywrócenia zdolności do pracy. Obejmuje diagnozę, zamówienie części (jeśli krytyczne elementy nie są na magazynie), fizyczną naprawę, testy i uruchomienie.
MTTF (Mean Time To Failure) – średni czas do pierwszej awarii, stosowany głównie dla elementów nienaprawialnych. Pomaga określić cykle wymiany części eksploatacyjnych, np. łożysk lub filtrów, gdy nie zakłada się ich regeneracji.
Dostępność techniczna (Availability) – udział czasu, w którym maszyna jest zdolna do pracy, w całkowitym czasie rozpatrywanego okresu. W prostym ujęciu dla pojedynczego urządzenia można ją w przybliżeniu liczyć ze wzoru: A = MTBF / (MTBF + MTTR).

Dla inżyniera ds. niezawodności istotne jest wspólne analizowanie MTBF i MTTR. Może się zdarzyć, że maszyna ma całkiem wysoki MTBF (mało awarii), ale każda awaria jest bardzo długa i kosztowna. Wtedy samo „podniesienie MTBF” niewiele da, jeśli nie zostanie jednocześnie obniżony MTTR poprzez działania organizacyjne (lepsze przygotowanie części, standaryzacja procedur, szkolenia, narzędzia).

Wskaźniki przestojów i OEE a niezawodność

W wielu zakładach przemysłowych wprowadzono wskaźnik OEE (Overall Equipment Effectiveness), który łączy dostępność, wydajność i jakość. Inżynier ds. niezawodności skupia się przede wszystkim na tej pierwszej składowej – dostępności, która bezpośrednio zależy od MTBF i MTTR.

Oprócz OEE monitoruje się też:

całkowity czas przestojów nieplanowanych w danym okresie (godziny/dzień, godziny/tydzień),
liczbę awarii na jednostkę czasu, np. awarie/miesiąc dla danej linii,
czas przestojów planowych (konserwacje, remonty generalne) oraz ich udział w całkowitym czasie postojów.

Odpowiednia kombinacja MTBF, MTTR, OEE i wskaźników przestojów pozwala inżynierowi ds. niezawodności nie tylko liczyć, ale i sensownie planować przestoje, tak aby utrzymać wysoką dostępność przy akceptowalnym poziomie ryzyka awarii.

Mechanik w warsztacie samochodowym podczas naprawy auta — Źródło: Pexels | Autor: Pixabay

Jak poprawnie liczyć MTBF w realnej fabryce

Definicja czasu pracy i czasu awarii

Najczęstszy błąd przy liczeniu MTBF polega na wrzucaniu do jednego worka wszystkich minut, kiedy maszyna nie produkuje. Tymczasem konieczne jest bardzo precyzyjne rozdzielenie:

czasu pracy – kiedy urządzenie jest w ruchu i wykonuje swoją funkcję (produkuje, transportuje, tłoczy),
przestojów planowych – remonty, przeglądy, zaplanowane postoje produkcyjne (np. brak zamówień),
przestojów nieplanowych – awarie techniczne, zatrzymania bezpieczeństwa, nieprzewidziane usterki,
przestojów zależnych od procesu – np. brak surowca, brak energii, zatkanie na dalszym etapie linii.

MTBF powinien uwzględniać tylko czas, w którym urządzenie było gotowe do pracy i pracowało, czyli czas, w którym potencjalnie mogło dojść do awarii. Przerwy z powodu braku zamówień, braku materiału czy planowanych przeglądów nie mogą być doliczane do czasu pracy, bo zaburzą obraz niezawodności.

Z tego powodu inżynier ds. niezawodności musi zadbać o prawidłową konfigurację systemu MES/SCADA, aby sygnały statusów maszyny (praca, postój planowy, awaria, postój z przyczyny procesowej) były jednoznaczne i spójne. Bez porządnych danych każde liczenie MTBF zamienia się w zgadywanie.

Podstawowy wzór na MTBF i przykład obliczeniowy

Najprostsza postać wzoru na MTBF wygląda tak:

MTBF = (Całkowity czas pracy urządzenia) / (Liczba awarii)

Przykładowa sytuacja z linii w stalowni:

Analizowany okres: 6 miesięcy.
Piec łukowy pracował łącznie (bez planowych remontów) 3000 godzin.
Wystąpiły 4 awarie, które zatrzymały piec (drobnych zakłóceń nie liczymy jako awarii, jeśli nie zatrzymują procesu lub trwają poniżej zdefiniowanego progu, np. 5 minut).

Wtedy:

MTBF = 3000 h / 4 = 750 h

Oznacza to, że średnio co 750 godzin pracy występuje awaria zatrzymująca piec. Ten wynik jest punktem wyjścia do dalszej analizy: czy 750 godzin to dużo czy mało w porównaniu do innych zakładów, innych pieców, innych okresów? Jak wygląda MTTR dla tych awarii? Czy istnieje korelacja z sezonem, zmianą, konkretną ekipą serwisową?

Warte uwagi: Operator Piły Taśmowej – Precyzyjne Cięcie na Miarę Giganta

MTBF ważony i dla grupy maszyn

W rzeczywistości inżynier ds. niezawodności rzadko analizuje pojedynczą maszynę w próżni. Znacznie częściej liczy MTBF dla floty podobnych urządzeń (np. wszystkie pompy wody chłodzącej danego typu) lub dla systemu (np. ciąg transportu taśmowego od kruszarki do bunkra). Wtedy trzeba uwzględnić, że poszczególne maszyny mają różny czas pracy w analizowanym okresie.

Dla grupy N urządzeń podobnego typu można zastosować podejście:

sumujemy całkowity czas pracy wszystkich maszyn z grupy,
sumujemy liczbę awarii w całej grupie,
dzielimy: MTBF_grupy = (∑ czasów pracy) / (∑ awarii).

Takie uśrednienie bywa przydatne przy planowaniu zapasu części zamiennych czy polityki serwisowej, ale trzeba pamiętać, że ukrywa ono różnice między poszczególnymi egzemplarzami maszyn. Dlatego często łączy się analizę globalną z tzw. analizą „bad actors” – identyfikacją urządzeń o najgorszej niezawodności (najniższy MTBF, najwyższe przestoje).

Jak radzić sobie z danymi niekompletnymi lub zniekształconymi

W wielu fabrykach, szczególnie starszych zakładach przemysłu ciężkiego, dane o czasach pracy i awariach są niepełne lub rozproszone. Część jest w zeszytach na warsztacie, część w arkuszach Excela, część w systemach CMMS. Inżynier ds. niezawodności musi umieć z tym pracować i stopniowo poprawiać jakość danych, zamiast czekać na „idealny system”.

Praktyczne podejścia:

rozpoczęcie od krytycznych urządzeń – wdrożenie dokładniejszej rejestracji danych najpierw dla maszyn kluczowych dla produkcji, zamiast dla całego zakładu na raz,
jasne kryteria, co liczymy jako awarię (czas trwania, wpływ na produkcję), aby uniknąć sytuacji, że jedna brygada zapisuje wszystko, a inna tylko duże postoje,
wprowadzenie prostych formularzy zgłoszeń awarii w CMMS, z obowiązkowymi polami: czas start/stop, przyczyna pierwotna, przyczyna wtórna, działania naprawcze,
cykliczne przeglądy jakości danych – korekty oczywistych błędów, np. awaria trwająca „0 minut” albo 10 godzin dla prostej wymiany czujnika.

Bez tej pracy przygotowawczej każde liczenie MTBF będzie obarczone błędem. Inżynier ds. niezawodności powinien więc równolegle rozwijać kulturę poprawnego raportowania awarii na wydziale produkcji i utrzymania ruchu.

Statystyczne podejście do MTBF: nie tylko średnia arytmetyczna

Rozkład awarii i okresy życia urządzenia

Maszyny w przemyśle ciężkim nie psują się w sposób całkowicie losowy. Często obserwuje się tzw. krzywą wannową niezawodności:

wczesne awarie („dziecięce”) – na początku eksploatacji, wynikające z wad montażu, błędów projektowych, problemów wdrożeniowych,
okres eksploatacji stabilnej – niska i względnie stała intensywność awarii,
awarie starzeniowe – wzrost liczby uszkodzeń wraz z wyczerpywaniem się resursu, zużyciem elementów, zmęczeniem materiału.

Prosta średnia MTBF liczona z całego okresu życia urządzenia może zafałszować obraz. Dlatego inżynier ds. niezawodności często analizuje MTBF w określonych oknach czasowych (np. last 12 months, last 24 months) i porównuje je między sobą. Trendy w MTBF są tak samo ważne, jak jego absolutna wartość.

Rozkład wykładniczy i przybliżenia w analizie niezawodności

W wielu prostych analizach zakłada się, że czas do awarii ma rozkład wykładniczy, a więc intensywność uszkodzeń jest stała w czasie. W takim uproszczeniu MTBF jest bezpośrednio związany z parametrem rozkładu, a prawdopodobieństwo, że maszyna wytrzyma czas t bez awarii, dane jest wzorem:

R(t) = exp(-t / MTBF)

Przykład praktyczny: jeżeli MTBF linii wynosi 500 godzin, to prawdopodobieństwo, że linia przepracuje 100 godzin bez awarii (przy założeniu rozkładu wykładniczego) wynosi:

R(100) = exp(-100/500) ≈ exp(-0,2) ≈ 0,82

Planowanie przestojów na podstawie MTBF i MTTR

Same liczby MTBF i MTTR niewiele zmieniają, dopóki nie przełoży się ich na konkretny harmonogram przestojów. Inżynier ds. niezawodności musi połączyć trzy perspektywy: ryzyko awarii, dostępność ludzi i części oraz wymagania produkcji (okna, kiedy można zatrzymać linię).

Praktyczne kroki przy planowaniu:

określenie docelowej dostępności dla kluczowych linii (np. 95%, 97%),
powiązanie tej dostępności z akceptowalną częstością awarii – im wyższa dostępność, tym więcej działań zapobiegawczych i krótsze czasy napraw,
analiza MTBF oraz wariancji czasów między awariami (czy przerwy są regularne, czy bardzo rozstrzelone),
przegląd MTTR i identyfikacja elementów, które najbardziej wydłużają naprawy (np. oczekiwanie na części, brak dostępu do stanowiska).

Na tej podstawie wyznacza się okresy międzyprzeglądowe dla kluczowych podzespołów. Dla elementów krytycznych często stosuje się zasadę, że planowy przegląd lub wymiana następuje przed upływem pewnej części MTBF, np. 60–70% średniego czasu między awariami, skorygowane o realne warunki pracy (temperatura, obciążenie, tryb pracy).

Okna serwisowe i synchronizacja z produkcją

Planowanie przestojów nie odbywa się w próżni – każdy postój to utracona produkcja, ale także szansa na wykonanie pakietu prac. Dobrą praktyką jest tworzenie okien serwisowych, czyli stałych, powtarzalnych terminów, kiedy linia lub jej fragment może być zatrzymany.

Typowy schemat:

krótkie okna tygodniowe (np. 2–4 godziny) – drobne przeglądy, inspekcje, wymiany „na szybko zużywające się” elementy,
średnie okna miesięczne/kwartalne (kilkanaście godzin – 1 dzień) – przegląd rozszerzony, regulacje, testy funkcjonalne,
duże postoje roczne/wieloletnie – remonty kapitalne, modernizacje, testy odbiorcze po większych modyfikacjach.

MTBF pomaga osadzić te okna w czasie. Jeżeli wskaźnik dla kluczowego podzespołu jest niski i awarie pojawiają się częściej niż planowane okna tygodniowe, harmonogram trzeba zagęścić albo zmienić strategię: z „reaktywnej z domieszką prewencji” na bardziej agresywną prewencję lub predykcję.

W praktyce inżynier ds. niezawodności przychodzi na narady planistyczne z prostymi symulacjami: co się stanie z dostępnością i liczbą awarii, jeśli skrócimy/przedłużymy okno serwisowe albo przesuniemy je o tydzień. Do tego często używa prostych arkuszy kalkulacyjnych, nie od razu wyszukanych narzędzi do symulacji Monte Carlo.

Od MTBF do strategii utrzymania: reaktywne, prewencyjne, predykcyjne

Sam MTBF nie mówi, jaką strategię utrzymania przyjąć, ale pozwala porównać scenariusze. Dla tej samej linii różne podejścia mogą dawać inne koszty i inną dostępność:

reaktywne – naprawiamy, kiedy się zepsuje; dobre tylko dla elementów tanich i niekrytycznych,
prewencyjne – wymieniamy lub przeglądamy w określonych odstępach czasu (np. co 3 miesiące lub co 1000 h pracy),
predykcyjne (CBM) – działamy na podstawie stanu technicznego (wibracje, temperatura, analiza oleju) i prognozy ryzyka awarii.

Inżynier, dysponując historią MTBF i danymi o kosztach, może policzyć koszt jednostkowy przestoju w każdej strategii. Przykładowo, jeśli średni czas awarii łożyska przekracza koszt planowej wymiany dwa–trzy razy, a do tego powoduje uszkodzenia wtórne, natychmiast widać, że warto skrócić odstępy między przeglądami albo wdrożyć monitoring drgań.

Łączenie MTBF z analizą krytyczności i RCM

W zaawansowanych zakładach MTBF jest jednym z wejść do metodyk RCM (Reliability-Centered Maintenance) oraz analiz krytyczności. Chodzi o to, aby nie wszystkie urządzenia traktować tak samo, lecz podzielić je wg wpływu na bezpieczeństwo, środowisko i produkcję.

Typowe kroki:

Klasyfikacja urządzeń: krytyczne dla ciągłości produkcji, krytyczne dla bezpieczeństwa, reszta.
Dla urządzeń krytycznych – zebranie historii awarii i ocena MTBF/MTTR.
Identyfikacja głównych trybów uszkodzeń (FMEA/FMECA) i określenie, które z nich są akceptowalne, a które muszą być praktycznie wyeliminowane.
Dopasowanie strategii: inspekcje, testy funkcjonalne, redundancja, modyfikacje projektowe, zmiana technologii.

W takiej strukturze MTBF przestaje być suchą liczbą, a staje się kryterium decyzji inwestycyjnych. Jeśli np. zawór bezpieczeństwa w kluczowym obiegu ma niski MTBF, to nie wystarczy częściej go przeglądać – być może trzeba zmienić typ zaworu, wprowadzić redundancję lub przebudować fragment instalacji.

Planowanie części zamiennych w oparciu o MTBF

Magazyn części to jedno z miejsc, gdzie MTBF przekłada się na konkretne złotówki. Zbyt mały zapas oznacza długie przestoje w oczekiwaniu na dostawę, zbyt duży – zamrożony kapitał. Inżynier ds. niezawodności pomaga działowi logistyki dobrać poziomy zapasów tak, aby zachować balans.

Do podstawowych obliczeń potrzebne są:

MTBF danego elementu (lub grupy elementów tego samego typu),
czas dostawy (lead time) od dostawcy,
liczba fizycznych sztuk tego elementu w zakładzie,
akceptowalny poziom ryzyka, że zabraknie części (np. 1% przypadków w roku).

Prosty przykład: jeżeli w zakładzie pracuje 10 podobnych pomp, a ich średni MTBF wynosi 2 lata, oczekiwane jest ok. 5 awarii pomp rocznie. Jeśli czas dostawy nowej pompy to 3 miesiące, magazyn musi zapewnić, że w tym okresie nie wyczerpią się zapasy. Do tego dodaje się bufor bezpieczeństwa zależny od zmienności rzeczywistych czasów między awariami.

Warte uwagi: Inżynier Elektryk w Przemyśle Ciężkim – Codzienne Wyzwania

W bardziej zaawansowanym podejściu wykorzystuje się rozkład probabilistyczny awarii (np. wykładniczy albo Weibulla) i symuluje się tysiące scenariuszy, aby dobrać minimalny zapas zapewniający wymagany poziom serwisu (np. 99% prawdopodobieństwa, że część będzie dostępna). Nawet jednak proste uśrednienie często poprawia sytuację w stosunku do magazynu opartego tylko na „przeczuciu”.

Redundancja i MTBF układu: jak projekt wpływa na planowanie przestojów

Na MTBF całego systemu wpływa nie tylko jakość pojedynczych maszyn, ale także sposób ich połączenia. W zakładach o wysokich wymaganiach dostępności (np. huty, rafinerie, zakłady chemiczne) często stosuje się redundancję:

układy 1+1 – dwie równoległe maszyny, z których jedna jest w rezerwie,
układy n+1 – kilka urządzeń pracuje jednocześnie, jedno pozostaje w rezerwie,
ścieżki obejściowe (by-passy) pozwalające utrzymać część funkcji mimo awarii fragmentu linii.

Dla układów równoległych i szeregowych można wyznaczyć ekwiwalentny MTBF systemu. Na przykład dla dwóch niezależnych pomp połączonych równolegle (jedna wystarcza do utrzymania przepływu) dostępność układu jest dużo wyższa niż dostępność pojedynczej pompy. To z kolei zmienia sposób planowania przestojów: można naprawiać jedną pompę bez zatrzymywania instalacji, planować dłuższe okna serwisowe lub wykonywać remonty naprzemiennie.

Zestawienie MTBF systemu z jego konfiguracją techniczną pozwala bronić decyzji inwestycyjnych przed zarządem: czasem dokładanie trzeciej pompy to nie „fanaberia utrzymania ruchu”, lecz jedyny sensowny sposób na spełnienie wymagań dostępności kontraktowej.

Wykorzystanie danych z CMMS/MES do codziennego zarządzania niezawodnością

Nowoczesny inżynier ds. niezawodności nie „rzeźbi” danych w ciemno – opiera się na systemach CMMS/MES, ale umie też dostrzegać ich ograniczenia. Kluczowe jest zbudowanie prostych, stałych raportów, które co tydzień lub co miesiąc pokazują:

aktualny MTBF i MTTR dla krytycznych linii i urządzeń,
trend tych wskaźników w ostatnich miesiącach,
listę „bad actors” – maszyn z największym udziałem w przestojach nieplanowanych,
rozbicie czasu awarii na kategorie przyczyn (mechaniczne, elektryczne, błędy obsługi, organizacyjne).

Na tej podstawie ustala się priorytety działań: jedne maszyny wymagają inwestycji (modernizacja, wymiana na nowszy typ), inne – zmiany procedur obsługi albo szkoleń operatorów. Samo obliczanie MTBF bez wyciągania wniosków i bez działań korygujących nie przyniesie efektu.

Dobrym zwyczajem jest krótkie, regularne spotkanie (np. raz w tygodniu) z udziałem utrzymania ruchu, produkcji i jakości, na którym przegląda się ostatnie awarie i ich wpływ na MTBF/OEE. Nie chodzi o szukanie winnych, lecz o wskazanie miejsc, gdzie prosta zmiana może wyraźnie podnieść niezawodność – np. poprawa procedury rozruchu, zmiana ustawień zabezpieczeń, doprecyzowanie listy czynności w przeglądzie.

MTBF a bezpieczeństwo: blokady, testy okresowe, systemy SIS

W wielu zakładach przemysłu ciężkiego równie ważne jak ciągłość produkcji jest bezpieczeństwo procesowe. W systemach zabezpieczeń (SIS, blokady, wyłączniki bezpieczeństwa) stosuje się pojęcia MTBF, PFH czy PFD, powiązane z poziomami nienaruszalności bezpieczeństwa (SIL). Choć metodologia ich liczenia jest bardziej sformalizowana niż dla zwykłych maszyn, logika pozostaje podobna: im rzadziej zawodzą elementy barier bezpieczeństwa, tym niższe ryzyko katastroficznych zdarzeń.

Planowanie przestojów w tym obszarze oznacza m.in.:

okresowe testy funkcjonalne zaworów bezpieczeństwa, wyłączników, przekaźników,
przeglądy i kalibracje czujników (ciśnienia, temperatury, poziomu),
weryfikację pełnej ścieżki sygnału: od czujnika, przez sterownik, po element wykonawczy.

Z punktu widzenia produkcji są to często „uciążliwe” przestoje, ale ich harmonogram musi być spięty z wymaganiami standardów (np. IEC 61511) oraz obliczeniami niezawodnościowymi. Inżynier ds. niezawodności jest tutaj łącznikiem między służbami BHP, automatyką a produkcją; musi umieć przełożyć liczby MTBF i poziomy SIL na konkretne daty i zakresy prac.

Przykładowa ścieżka poprawy MTBF w istniejącej linii

W wielu zakładach praca nad niezawodnością zaczyna się od prostego wniosku: „ta linia psuje się za często”. Zamiast ogólnych narzekań, inżynier ds. niezawodności układa sekwencję kroków:

Zebranie danych z ostatniego roku lub dwóch: awarie, czasy przestojów, kluczowe elementy linii.
Obliczenie MTBF dla całej linii oraz dla głównych podzespołów.
Wytypowanie „top 5” urządzeń najbardziej obniżających MTBF (wysoka częstotliwość awarii lub bardzo długie naprawy).
Dla każdego z nich – prosta analiza przyczyn (5xWhy, Pareto przyczyn, FMEA uproszczone).
Opracowanie konkretnych działań: zmiana części na wyższą klasę, korekta geometrii, dodatkowe smarowanie, szkolenie obsługi, zmiana zakresu przeglądów.
Wdrożenie i monitorowanie MTBF/MTTR w kolejnych miesiącach.

W praktyce już pierwsza iteracja takiego cyklu potrafi przynieść odczuwalną różnicę: spadek liczby awarii o kilkanaście–kilkadziesiąt procent na wybranej linii. Kluczowe jest, aby nie rozpraszać się na cały zakład naraz, tylko skupić na ograniczonej liczbie urządzeń o największym wpływie na przestoje.

Rola inżyniera ds. niezawodności w kulturze organizacyjnej

MTBF, MTTR, OEE i wszystkie wskaźniki pozostaną zestawem liczb, jeśli nie staną się elementem codziennego języka w fabryce. Zadaniem inżyniera ds. niezawodności jest nie tylko liczyć i raportować, lecz także uświadamiać reszcie organizacji skutki decyzji dotyczących przestojów.

Kilka nawyków, które pomagają:

- krótkie omówienie każdej większej awarii z operatorami i brygadzistami – co się stało, jak wpłynęło na MTBF i co można poprawić,
- pokazywanie w raportach nie tylko „winnych maszyn”, ale także pozytywnych przykładów – gdzie działania przyniosły wzrost MTBF,

Komunikacja liczb: jak przedstawiać MTBF zarządowi i produkcji

Surowe liczby rzadko kogokolwiek przekonują. Inżynier ds. niezawodności musi przełożyć MTBF na język, który rozumieją różne grupy w zakładzie:

- - dla zarządu – utracona marża, koszty godzin przestoju, zwrot z inwestycji w modernizację,
  - dla produkcji – liczba nieplanowanych zatrzymań zmiany, przepustowość linii, poziom stresu operatorów,
  - dla utrzymania ruchu – obciążenie brygad, liczba wyjazdów „na sygnale”, dostępność części.

Zamiast mówić, że „MTBF wzrósł z 200 do 300 godzin”, lepiej pokazać: „średnio o jedno nieplanowane zatrzymanie mniej na tydzień na tej linii” lub „dodatkowe X ton produktu miesięcznie bez zmiany obsady”. Taka narracja ułatwia uzyskanie zgody na przestoje planowane i inwestycje.

Pomagają tu proste wizualizacje: wykres słupkowy liczby awarii przed i po zmianie procedury, wykres trendu MTBF z zaznaczonymi datami kluczowych działań, diagram Pareto przyczyn przestojów. Kluczowe, by każdy raport kończył się konkretnym wnioskiem i propozycją działania, a nie tylko tabelą liczb.

Typowe błędy przy liczeniu i interpretacji MTBF

W praktyce wiele zespołów zniechęca się do MTBF, bo „nic z niego nie wynika”. Najczęściej problemem nie jest sam wskaźnik, lecz sposób jego liczenia i użycia. Kilka typowych pułapek:

- - mieszanie awarii i planowanych zatrzymań – jeżeli w systemie CMMS każde zatrzymanie jest wpisane jako „awaria”, MTBF będzie dramatycznie zaniżony, a wnioski zupełnie błędne,
  - statystyka bez minimalnej liczby zdarzeń – liczenie MTBF po jednej awarii w roku i wyciąganie daleko idących wniosków,
  - brak rozróżnienia na fazę wczesnych awarii i zużycia – mieszanie danych z rozruchu, gdy „choroby wieku dziecięcego” są normą, z danymi z ustabilizowanej eksploatacji,
  - porównywanie „jabłek z gruszkami” – MTBF dla starej linii pracującej na trzy zmiany vs. nowa linia z jedną zmianą i innym asortymentem.

Rolą inżyniera jest prostowanie takich uproszczeń: wprowadzanie poprawnych kategorii zdarzeń w CMMS, filtrowanie danych (np. odrzucenie pierwszych miesięcy po rozruchu), dodawanie komentarzy kontekstowych do raportów. Bez tego liczby bardziej szkodzą, niż pomagają.

MTBF a strategie utrzymania ruchu: od reakcji do predykcji

Sam MTBF nie mówi, jak naprawiać – pokazuje jedynie, jak często pojawia się problem. Na tej podstawie dobiera się strategię utrzymania ruchu dla różnych klas urządzeń. W uproszczeniu:

- - niski koszt awarii, wysoki MTBF – strategia „run to failure”, czyli naprawa dopiero po uszkodzeniu,
  - średni koszt awarii, przewidywalne zużycie – utrzymanie prewencyjne oparte na czasie pracy lub cyklach,
  - wysoki koszt awarii, zmienny charakter uszkodzeń – utrzymanie predykcyjne oparte na monitoringu i diagnostyce.

Przykład z hali: wentylatory pomocnicze o tanich silnikach można spokojnie prowadzić w trybie „run to failure” z minimalnym zapasem części. Natomiast kluczowa sprężarka linii, której awaria zatrzymuje całą produkcję, wymaga zupełnie innego podejścia – tu wykorzystuje się analizę drgań, monitoring temperatur, a MTBF służy jako punkt odniesienia do oceny skuteczności tych działań.

Im lepiej zrozumiany jest MTBF dla danej grupy urządzeń, tym łatwiej dobrać optymalny miks strategii utrzymaniowych i ułożyć harmonogram przestojów tak, by ograniczyć niespodzianki.

Warte uwagi: Zawód Frezera – Mistrzowska Obróbka Gigantycznych Detali

Łączenie MTBF z monitorowaniem stanu: kiedy „średnia” przestaje wystarczać

W wielu instalacjach samo liczenie średniego czasu między awariami to za mało, bo zużycie elementów jest mocno zależne od obciążenia, warunków środowiskowych czy jakości surowca. Wtedy MTBF staje się tłem dla danych z monitoringu stanu:

- - wibrodiagnostyki łożysk,
  - analizy oleju,
  - monitoringu temperatur, prądów silników, ciśnień,
  - analizy trendów z systemów sterowania (SCADA, DCS).

Scenariusz z praktyki: dla określonego typu silników katalogowy MTBF wynika z danych producenta. Po roku monitoringu drgań okazuje się, że przy aktualnym obciążeniu i warunkach smarowania pierwsze symptomy uszkodzeń pojawiają się znacznie wcześniej niż „średnio”. Na tej podstawie zmienia się harmonogram przeglądów, a katalogowy MTBF przestaje być głównym punktem odniesienia – liczy się rzeczywiste tempo degradacji.

Rolą inżyniera ds. niezawodności jest spięcie obu światów: klasycznych obliczeń MTBF i twardych pomiarów diagnostycznych. To połączenie pozwala przesuwać przestoje z „nagłych” w „planowane” z odpowiednim wyprzedzeniem.

MTBF a kontrakty serwisowe i gwarancyjne

W wielu fabrykach znacząca część parku maszynowego jest objęta kontraktami serwisowymi lub rozszerzonymi gwarancjami. Dane o MTBF są wtedy argumentem w rozmowach z dostawcami:

- - gdy rzeczywisty MTBF jest znacznie gorszy niż deklarowany – jest podstawa do reklamacji, przedłużenia gwarancji lub renegocjacji warunków,
  - gdy MTBF wypada lepiej – można rozważyć optymalizację zakresu przeglądów lub wydłużenie interwałów, obniżając koszty serwisu.

Przy zawieraniu nowych kontraktów inżynier ds. niezawodności powinien dopilnować, by w umowie pojawiły się konkretne zapisy dotyczące:

- - oczekiwanego MTBF lub dostępności urządzenia,
  - sposobu liczenia tych wskaźników (co jest, a co nie jest „awarią”),
  - konsekwencji ich niedotrzymania (kary, dodatkowy serwis, zapewnienie części).

Bez liczb dyskusja z dostawcą sprowadza się do „u nas się psuje, a miało być dobrze”. Z dobrze prowadzoną historią MTBF można jasno pokazać, jak wygląda rzeczywistość w konkretnych warunkach pracy fabryki.

Integracja planowania przestojów z planem produkcji

Wysoki MTBF ułatwia rozmowę z planistami produkcji, ale nie zwalnia z synchronizowania przestojów z zamówieniami klientów. W praktyce oznacza to trzy obszary współpracy:

- 1. Plan roczny – na bazie MTBF i zalecanych interwałów serwisowych szacuje się liczbę dni przestoju w roku dla głównych linii. Ten pakiet trafia do planu produkcji jako „koszt techniczny”.
  2. Plan miesięczny – przestoje są dosuwane do okresów o najniższym obciążeniu zamówieniami albo do okien, w których można wykonać kilka rodzajów prac jednocześnie (mechanika, automatyka, inspekcje). MTBF pomaga bronić te daty jako racjonalne – „jeśli nie zatrzymamy się w tym oknie, ryzyko nieplanowanego przestoju rośnie o X%”.
  3. Plan tygodniowy/dzienny – krótkie przeglądy, drobne inspekcje, wymiany przewidziane na podstawie bieżących symptomów i trendów. Tu przydaje się znajomość czasu do kolejnej spodziewanej awarii w odniesieniu do historycznego MTBF.

Dzięki takiemu spięciu dział produkcji zaczyna postrzegać planowane przestoje nie jako „fanaberię utrzymania ruchu”, lecz jako sposób na ochronę realizacji planu i stabilność dostaw dla klientów.

Wskaźniki uzupełniające MTBF: czas do pierwszej awarii, dostępność, OEE

W codziennej pracy inżynier ds. niezawodności łączy MTBF z innymi wskaźnikami, aby nie wyciągać wniosków z jednego wymiaru:

- - MTTF / czas do pierwszej awarii – szczególnie istotny przy nowych liniach lub po większej modernizacji; pokazuje, czy projekt i rozruch były wykonane poprawnie,
  - MTTR – średni czas naprawy; wysoki MTBF połączony z wysokim MTTR może dawać równie niski poziom dostępności jak odwrotna konfiguracja,
  - dostępność techniczna – stosunek czasu, gdy maszyna jest gotowa do pracy, do całkowitego czasu; łączy MTBF i MTTR w jeden obraz,
  - OEE – efektywność wykorzystania linii; tu MTBF przekłada się głównie na składnik „dostępność”.

Analiza tych wskaźników razem pozwala zdecydować, w co inwestować najpierw. Jeżeli MTBF jest przyzwoity, ale MTTR wysoki, większy efekt da usprawnienie organizacji napraw (standaryzacja procedur, lepsze przygotowanie części, szkolenia) niż kosztowna modernizacja samej maszyny.

Praktyczne checklisty dla inżyniera ds. niezawodności

Aby dane o MTBF realnie wspierały planowanie przestojów, przydają się proste rutyny. Przykładowa lista kontrolna na koniec miesiąca:

- - aktualizacja MTBF/MTTR dla topowych linii i urządzeń,
  - porównanie z celem rocznym i z poprzednimi miesiącami,
  - identyfikacja trzech urządzeń o największym ujemnym wpływie na dostępność,
  - sprawdzenie, czy przyczyną są częste awarie, czy długie naprawy,
  - przegląd statusu działań korygujących z poprzedniego miesiąca,
  - propozycja przesunięć/zmian w planie przestojów na kolejny miesiąc.

Analogiczna, krótsza checklista tygodniowa może dotyczyć tylko najważniejszej linii produkcyjnej. Regularność takiej pracy sprawia, że MTBF staje się żywym narzędziem, a nie jednorazowym ćwiczeniem do prezentacji.

Kompetencje inżyniera ds. niezawodności w praktyce

Stanowisko kojarzy się często z „człowiekiem od statystyki”, w rzeczywistości wymaga połączenia kilku obszarów:

- - technika – dobra znajomość maszyn, procesów, podstaw mechaniki, elektryki i automatyki,
  - analityka danych – praca z CMMS/MES, arkuszami kalkulacyjnymi, narzędziami do wizualizacji,
  - organizacja pracy – umiejętność układania harmonogramów, łączenia prac różnych służb,
  - komunikacja – tłumaczenie danych na skutki biznesowe i wpływanie na decyzje.

W codzienności oznacza to np. poranny obchód z brygadzistą, popołudniową analizę wykresów z CMMS, a później krótkie spotkanie z planistą produkcji, żeby ustalić, w które okno wstawić przestój na remont wymiennika. MTBF jest jednym z narzędzi, które spina te działania w logiczny ciąg.

Najczęściej zadawane pytania (FAQ)

Kim jest inżynier ds. niezawodności w przemyśle ciężkim?

Inżynier ds. niezawodności to specjalista odpowiedzialny za to, aby park maszynowy w fabryce pracował możliwie stabilnie, przewidywalnie i z jak najmniejszą liczbą awarii. Łączy kompetencje utrzymania ruchu, analizy danych i planowania produkcji.

W praktyce zajmuje się on m.in. analizą awaryjności, wyliczaniem wskaźników niezawodności (MTBF, MTTR, MTTF, dostępność techniczna), planowaniem przestojów, wdrażaniem strategii RCM oraz systemów monitoringu stanu maszyn (Condition Monitoring).

Co to jest MTBF i jak obliczyć MTBF w fabryce?

MTBF (Mean Time Between Failures) to średni czas pracy urządzenia pomiędzy kolejnymi awariami. Liczy się go jako stosunek całkowitego czasu pracy urządzenia do liczby awarii w danym okresie, zwykle z pominięciem planowanych przestojów:

MTBF = (całkowity czas pracy urządzenia) / (liczba awarii).

Przykład: jeśli piec w stalowni pracował 3000 godzin (bez planowych remontów) i w tym czasie wystąpiły 4 awarie zatrzymujące proces, to MTBF = 3000 h / 4 = 750 h. Oznacza to, że średnio co 750 godzin pracy pojawia się awaria.

Jaka jest różnica między MTBF, MTTR i MTTF?

MTBF (Mean Time Between Failures) opisuje średni czas między kolejnymi awariami urządzenia naprawialnego (np. pompy, sprężarki, przenośniki). MTTR (Mean Time To Repair) to średni czas naprawy – od wystąpienia awarii do pełnego przywrócenia zdolności do pracy.

MTTF (Mean Time To Failure) stosuje się głównie do elementów nienaprawialnych (jednorazowych), jak bezpieczniki czy filtry, i opisuje średni czas do pierwszej awarii. W praktyce inżynier ds. niezawodności analizuje MTBF i MTTR razem, bo dopiero ich kombinacja pokazuje, jak często i jak długo linia realnie stoi.

Dlaczego poprawne liczenie MTBF jest takie ważne w planowaniu przestojów?

W przemyśle ciężkim każda nieplanowana przerwa pracy linii oznacza duże koszty: utratę produkcji, ryzyko wypadków, spadek jakości i wyższe zużycie energii przy ponownym rozruchu. MTBF pozwala oszacować, jak często statystycznie można spodziewać się awarii.

Dzięki temu inżynier ds. niezawodności może wyznaczyć optymalne terminy przestojów planowych, tak aby wymiany i przeglądy wykonywać przed spodziewanym „szczytem” awaryjności. Pozwala to ograniczyć liczbę nieplanowanych postojów i utrzymać wysoką dostępność techniczną maszyn.

Jak odróżnić przestój planowy od nieplanowego przy liczeniu MTBF?

Przy obliczaniu MTBF do czasu pracy wlicza się tylko godziny, w których maszyna była gotowa do pracy i faktycznie mogła ulec awarii. Trzeba więc rozdzielić:

- - czas pracy – urządzenie wykonuje swoją funkcję,
  - przestoje planowe – remonty, przeglądy, zaplanowane postoje produkcyjne,
  - przestoje nieplanowe – awarie techniczne, zatrzymania bezpieczeństwa, usterki,
  - przestoje procesowe – np. brak surowca, energii, zator na dalszym etapie linii.

Do liczenia MTBF nie wolno wliczać postojów planowych ani przestojów z przyczyn procesowych (np. brak zamówień), bo sztucznie zawyżą one wskaźnik i zafałszują obraz niezawodności.

Jak MTBF i MTTR wpływają na dostępność techniczną i OEE?

Dostępność techniczną maszyny można w prostym ujęciu przybliżyć wzorem: A = MTBF / (MTBF + MTTR). Im wyższy MTBF (rzadsze awarie) i niższy MTTR (krótsze naprawy), tym wyższa dostępność. Ta z kolei jest jednym z trzech głównych składników wskaźnika OEE (obok wydajności i jakości).

Inżynier ds. niezawodności, analizując MTBF i MTTR oraz całkowity czas przestojów nieplanowanych, szuka działań, które jednocześnie wydłużą czas między awariami i skrócą czas ich usuwania. Dzięki temu rośnie zarówno dostępność, jak i OEE całej linii produkcyjnej.

Najważniejsze punkty

- Inżynier ds. niezawodności łączy kompetencje technika utrzymania ruchu, analityka danych i planisty, aby minimalizować awarie oraz zapewniać stabilną i przewidywalną pracę parku maszynowego.
- W przemyśle ciężkim każda nieplanowana przerwa generuje ogromne koszty i ryzyka, dlatego kluczowe jest precyzyjne planowanie przestojów na podstawie wskaźników niezawodności, zamiast działania reakcyjnego.
- MTBF (średni czas między awariami) ma sens głównie dla urządzeń naprawialnych i musi być zawsze liczony względem jasno zdefiniowanego obiektu (konkretna maszyna, grupa maszyn, system), bo od tego zależy interpretacja wyniku.
- MTBF sam w sobie nie opisuje realnych przestojów – dopiero łączna analiza MTBF, MTTR (średni czas naprawy), MTTF oraz dostępności technicznej pozwala zrozumieć faktyczny wpływ awarii na produkcję.
- Możliwa jest sytuacja, w której wysoki MTBF współistnieje z bardzo długimi i kosztownymi naprawami; wtedy kluczowe jest równoczesne skracanie MTTR poprzez lepszą organizację, dostępność części i standaryzację procedur.
- Wskaźniki takie jak OEE, całkowity czas przestojów (planowych i nieplanowanych) oraz liczba awarii w czasie uzupełniają obraz niezawodności i pomagają inżynierowi optymalizować dostępność linii produkcyjnych.
- Poprawne liczenie MTBF wymaga dokładnego rozdzielenia czasu pracy od różnych typów postojów; wrzucanie wszystkich okresów „nieprodukcji” do jednego zbioru prowadzi do zafałszowania danych i błędnych decyzji o przestojach.