Dlaczego przestaliśmy ufać automatyzacji?

Automatyzacja testów miała zmniejszyć niepewność w procesie wytwarzania oprogramowania. Paradoksalnie w wielu projektach stała się źródłem nowego rodzaju frustracji i złudzeń, szczególnie wtedy, gdy wyniki testów interpretuje się bez kontekstu.

Automatyczne testy są dziś powszechnym elementem cyklu wytwarzania oprogramowania. Wiele zespołów buduje złożone zestawy testów jednostkowych, integracyjnych czy E2E, a ich wynik traktuje jako miarę jakości oprogramowania. Jednak sam fakt, że test został wykonany i „przeszedł”, nie oznacza, że system jest wolny od defektów ani że wszystkie istotne aspekty funkcjonowania aplikacji są zabezpieczone. Warto zastanowić się nad tym, co testy nam rzeczywiście mówią, jakie założenia stoją za ich wynikami i gdzie mogą prowadzić do fałszywego poczucia bezpieczeństwa.

Różne poziomy testów i zakres informacji

Testy jednostkowe koncentrują się na najmniejszych elementach kodu – pojedynczych funkcjach czy klasach. Ich celem nie jest jedynie potwierdzenie, że fragment kodu działa zgodnie z oczekiwaniem, ale też, żeby zapewnić wczesne wykrywanie regresji podczas zmian implementacji. Testy integracyjne rozszerzają perspektywę: sprawdzają, jak różne moduły współdziałają, czy komunikacja między komponentami przebiega poprawnie. End-to-end testy mają jeszcze szerszy zasięg, oceniając przepływy obejmujące interfejs użytkownika, backend, bazy danych i usługi zewnętrzne, by odtworzyć realne scenariusze użycia systemu i to, jak wszystkie części współpracują ze sobą.

W praktyce oznacza to, że każdy z tych poziomów daje inną informację: jednostkowe testy wskazują, że poszczególne fragmenty kodu zachowują się poprawnie w określonych warunkach, integracyjne – że części systemu poprawnie się komunikują, a end-to-end – że pełna ścieżka działa jak przewidziano.

Jednak pozytywny wynik testu nie gwarantuje, że system jest wolny od defektów poza zakresem pojedynczego testu.

Co naprawdę oznacza „zielony test”?

Gdy test przechodzi, oznacza to jedynie, że w warunkach określonych przez test nie stwierdzono odchylenia od oczekiwanego zachowania. Sam fakt przejścia testu nie mówi nic o tym, co się dzieje poza tym zakresem. Na przykład:

test może nie uwzględniać wszystkich możliwych danych wejściowych czy ścieżek wykonania (problem próbki),
wynik testu zależy od poprawności samego testu; jeśli jego założenia są błędne, przejście testu niczego nie dowodzi (problem błędnego testu),
testy mogą nie obejmować wszystkich scenariuszy (problem pokrycia).

W przypadku testów E2E, choć ich nazwa sugeruje szeroki zakres, nawet takie testy mogą nie uwzględniać rzeczywistych warunków środowiskowych, skrajnych obciążeń czy danych produkcyjnych – a ich przejście nie eliminuje możliwości wystąpienia błędów w innych, niepokrytych scenariuszach.

Fałszywe poczucie bezpieczeństwa

Jednym z najczęstszych problemów w praktyce testowania jest poczucie bezpieczeństwa wynikające z długiej listy testów, które przechodzą bez błędów. Taki stan może prowadzić do przekonania, że kod jest „dobry”, że nie ma problemów jakościowych, a zmiany w systemie są bezpieczne. To przekonanie często ignoruje fakt, że testy mogły:

nie zostać zaprojektowane tak, by wykrywać realne, istotne defekty,
mieć zbyt wąski zakres danych wejściowych lub scenariuszy,
być oparte na nieaktualnych założeniach dotyczących wymagań,
albo po prostu nie obejmować wszystkich zależności i interakcji w systemie.

W praktyce oznacza to, że pozornie kompletny zestaw testów, który zawsze przechodzi, buduje jedynie iluzję bezpieczeństwa, a nie rzeczywiste potwierdzenie jakości systemu.

Nauka z nieudanych testów

Każdy analityk jakości wie, że prawdziwa wartość testów ujawnia się, gdy test nie przejdzie. Awaria zgłoszona przez test wskazuje jasno, że istnieje luka w implementacji albo w założeniach testu i daje podstawę do weryfikacji tych założeń. To właśnie sytuacje, w których testy pokazują defekty, dostarczają największej ilości informacji zwrotnej zespołowi.

To przekonanie leży u podstaw metod, które korzystają z efektów testów nie tylko jako sygnału sukcesu, ale jako informacji epistemicznej o systemie. Testy, które wielokrotnie przechodzą, mogą być użyteczne, ale ich wynik należy interpretować w kontekście tego, jak szeroki zakres zachowań i jakiego rodzaju defekty są w stanie w ogóle wykrywać.

Alternatywnie zbiór testów można poddać testom stresowym, które pokażą nam czy rzeczywiście one działają. Spróbuj użyć podstawowych weryfikacji technik

Przykład 1. Uruchom testy na celowo zepsutej gałęzi kodu (posiew defektów) i sprawdź, jaki procent uszkodzeń w systemie zostało wykrytych.

Przykład 2. Uszkodź testy przy pomocy techniki mutacyjnej. Celowo wprowadź drobne zmiany (mutacje) w kodzie źródłowym testu (np. zmiana > na <) i sprawdź, jak się zachowają.

Przykład 3. Podepnij pod testy generator danych losowych.

W skrócie - sprawdź, czy testy faktycznie wykrywają defekty, a nie tylko pokrywają kod.

Jak komunikować ograniczenia testów w zespole

Na poziomie praktycznym testerzy i inżynierowie jakości muszą jasno komunikować, co oznacza zaliczenie testów i czego nie oznacza. Pozytywny wynik testu powinien być traktowany jako informacja, że badany scenariusz w określonych warunkach nie ujawnił odchyleń od oczekiwanego zachowania, a nie jako dowód braku defektów w całym systemie.

Zespoły mogą w tym celu ustalać wspólne definicje tego, co oznacza „zaliczenie testów”, oraz doprecyzować, jaki poziom ryzyka jest akceptowalny w kontekście danego zestawu testów. Warto też uświadamiać interesariuszy, że pokrycie testowe, choć ważne, nie jest równoważne z gwarancją jakości – wskaźniki te dają tylko fragmentaryczny obraz, który trzeba uzupełniać innymi technikami, na przykład analizą ryzyka, eksploracyjnym testowaniem czy monitorowaniem zachowania systemu w środowisku produkcyjnym.

Wnioski

Automatyczne testy są nieodzownym narzędziem w nowoczesnym procesie jakości. Ich wynik to ważna informacja zwrotna dla zespołu. Jednak ich zdolność do „udowadniania” jakości jest ograniczona przez zakres pokrycia, jakość projektowania testów i realne warunki ich działania. „Zielony test” oznacza, że testowana właściwość spełnia założenia testu, ale nie musi oznaczać, że system działa poprawnie w perspektywie użytkownika lub właściciela. Rozumienie granic tego, co testy mogą powiedzieć, i umiejętność komunikowania tych ograniczeń w zespole, to kompetencje, które zwiększają skuteczność testowania oprogramowania.

Czy w Twoim projekcie ktoś realnie kwestionuje założenia testów automatycznych?

Tak, regularnie

Sporadycznie, przy większych incydentach

Raczej nie, testy są „święte”

Nie, zakładamy, że skoro są, to działają

Nazwa	Opis
PHPSESSID	Ciasteczko pozwalające na zapamiętywanie danych dotyczących stanu sesji.
_GRECAPTCHA	Ciasteczko pomagające zabezpieczyć formularze na stronie.
cookie_law_confirmed	Ciasteczko służące do wyświetlania tego okienka.
cookie_law_google_analytics	Ciasteczko zapamiętujące stan zgody użytkownika dotyczącej Google Analytics.
cookie_law_disqus	Ciasteczko zapamiętujące stan zgody użytkownika dotyczącej Disqus.
cookie_law_share_this	Ciasteczko zapamiętujące stan zgody użytkownika dotyczącej ShareThis.
article_visited	Ciasteczko pomagające ustalić, które artykuły są najbardziej popularne.
service_visited	Ciasteczko pomagające ustalić, które usługi są najbardziej popularne.
event_visited	Ciasteczko pomagające ustalić, które wydarzenia są najbardziej popularne.
training_visited	Ciasteczko pomagające ustalić, które szkolenia są najbardziej popularne.
external_training_visited	Ciasteczko pomagające ustalić, które zewnętrzne szkolenia są najbardziej popularne.

Nazwy	Opis
_utma	Unikalny użytkownik. Ciasteczko to zawiera unikalny numer identyfikacyjny, dzięki któremu narzędzie potrafi określić unikalnego i nowego użytkownika. Żywotność tego ciasteczka wynosi 2 lata i zapisywane jest w przeglądarce.
_utmb	Śledzenie odwiedzin. Ciasteczko przechowuje informację na temat danej odwiedziny.
_utmc	Śledzenie odwiedzin. Jego zadaniem jest ustalenie czy rozpocząć śledzenie nowej odwiedziny, czy też zbierane dane powinny zostać zaliczone do starej. Ciasteczko wygasa po zamknięciu przeglądarki.
_utmz	Źródła odwiedzin. Ciasteczko zawiera informację na temat źródeł odwiedzin. Dzięki niemu możliwe jest policzenie odwiedzin z wyszukiwarek oraz danych z kampanii marketingowych. Jego żywotność wynosi 6 miesięcy.
_utmv	Zmienne niestandardowe. Ciasteczko pojawia się tylko wtedy kiedy na witrynie zastosujemy śledzenie niestandardowych zmiennych. Jego żywotność to 2 lata.

Dlaczego przestaliśmy ufać automatyzacji?

Różne poziomy testów i zakres informacji

Co naprawdę oznacza „zielony test”?

Fałszywe poczucie bezpieczeństwa

Nauka z nieudanych testów

Jak komunikować ograniczenia testów w zespole

Wnioski

Powiązane szkolenia

Powiązane usługi

Seria Automatyzacja

Popularne

Najnowsze

Bądź na bieżąco

Dlaczego przestaliśmy ufać automatyzacji?

Różne poziomy testów i zakres informacji

Co naprawdę oznacza „zielony test”?

Fałszywe poczucie bezpieczeństwa

Nauka z nieudanych testów

Jak komunikować ograniczenia testów w zespole

Wnioski

Powiązane szkolenia

Powiązane usługi

Automatyzacja testów

Outsourcing

Testowanie oprogramowania

Seria Automatyzacja

Popularne

Najnowsze

Bądź na bieżąco

To powinno Cię zainteresować