Kumulowanie się defektów jest możliwe (i można to udowodnić)

Klasteryzacja defektów (ang. defects clustering) czy też, jak przyjęło się oficjalnie tłumaczyć – "kumulowanie się błędów" jest zjawiskiem opisanym przez jedną z ogólnych zasad testowania oprogramowania.

Zasada 4 - Kumulowanie się błędów

Pracochłonność testowania jest dzielona proporcjonalnie do spodziewanej oraz zaobserwowanej gęstości błędów w modułach. Niewielka liczba modułów zwykle zawiera większość usterek znalezionych przed wydaniem lub jest odpowiedzialna za większość awarii na produkcji.

Źródło [2]

Jest to swoiste odzwierciedlenie zasady Pareto 80/20, według której 20% kodu będzie przyczyną 80% problemów.

20% of the code will cause 80% of the problems.

Źródło [3]

Znajomość tej zasady może być pomocna podczas planowania testów.

Focusing on defects can help us plan our tests

Reviewing defects and failures in order to improve processes allows us to improve our testing and our requirements, design and development processes. One phenomenon that many testers have observed is that defects tend to cluster. (…) Testers will often use this information when making their risk assessment for planning the tests, and will focus on known 'hot spots'.

Źródło [3]

Powinniśmy zatem wyciągać wnioski z zaobserwowanych defektów i awarii, aby usprawnić proces testowy poprzez bardziej świadomą ocenę ryzyka i skupienie na "gorących punktach" podczas planowania testów.

Uważne monitorowanie i kontrola procesu testowego pozwala na zlokalizowanie "podejrzanych" modułów i przetestowanie ich w pierwszej kolejności. Dzięki temu małym nakładem pracy w szybkim czasie wykryjemy znaczną liczbę usterek.

Źródło [1]

Zasada jednak mówi nie tylko o zaobserwowanej, ale również spodziewanej gęstości błędów, czyli ilości błędów na (K)LOC – ang. (Kilo) Lines Of Code, w modułach. Jak więc możemy wykorzystać wiedzę o kumulowaniu się błędów podczas procesu planowania, zanim w nasze ręce trafi testowany program?

Możemy przewidywać, gdzie wystąpią "klastry błędów" na podstawie wielkości danego modułu i chociaż intuicyjnie wydaje się, że im więcej linii kodu, tym więcej powinno być defektów, to w rzeczywistości najbardziej podejrzane są największe i najmniejsze moduły.

W inżynierii oprogramowania zaobserwowano także inny fenomen – okazuje się, że rozkład gęstości defektów w funkcji rozmiaru modułu jest rozkładem U-kształtnym. Angielska nazwa tego typu krzywej to bathtube curve. (…) w pierwszej kolejności należy zwrócić uwagę na moduły bardzo małe i bardzo duże, gdyż w niech może znajdować się największa liczba defektów.

Źródło [1]

Możemy ponadto wzbogacić wstępną analizę o dane historyczne, by z większym prawdopodobieństwem wyznaczyć moduły podejrzane, a nawet optymalny rozmiar modułu pod kątem gęstości defektów (do którego powinien dążyć zespół developerski).

Oczywiście (…) optymalny rozmiar modułu, będzie zależeć od wielu różnych czynników, takich jak:

użytego języka programowania;
typu projektu;
rodzaju środowiska produkcyjnego;
umiejętności zespołu deweloperskiego.

Źródło [1]

Jakie mogą być przyczyny kumulowania się błędów i U-kształtnego rozkładu gęstości defektów w funkcji rozmiaru modułu?

This can happen because an area of the code is particularly complex and tricky, or because changing software and other products tends to cause knock-on defects.

Źródło [3]

"Klastry" błędów mogą pojawiać się w szczególnie skomplikowanym kodzie lub być spowodowane zmianami w oprogramowaniu.

Można również spróbować wytłumaczyć zależność U-kształtną, porównując moduły o podobnej funkcjonalności, lecz innej wielkości (strukturze kodu) .

Załóżmy, że mamy rozmiar modułu o określonej gęstości defektów. Im moduł będzie większy, tym więcej będzie okazji do popełnienia błędów, zatem gęstość defektów wzrośnie. Jednocześnie, jeśli rozmiar modułu będzie coraz mniejszy, to – aby utrzymać podobną funkcjonalność – jego wewnętrzna struktura będzie coraz bardziej skomplikowana, co również stwarza więcej okazji do popełnienia błędów.

Źródło [1]

Powstało wiele publikacji opisujących empiryczne badania korelacji ilości błędów w stosunku do złożoności, czy też wielkości modułu oprogramowania. Udowadniają one występowanie zjawiska kumulowania się błędów.

Kończąc, chcę przytoczyć wyniki i spostrzeżenia opisane w trzech publikacjach często cytowanych przy okazji opisywania zjawiska klasteryzacji defektów.

Wyniki pracy Basili & Perricone [4]:

Autorzy stwierdzili kumulowanie się błędów w mniejszych modułach. Było to dla niech zjawisko zaskakujące, które tłumaczyli następująco:

Some tentative explanations for this behavior are that: the majority of the modules examined were small (…), causing a biased result; larger modules were coded with more care than smaller modules because of their size; and errors in smaller modules were more apparent. There may still be numerous undetected errors present within the larger modules since all the "paths" within the larger modules may not have been fully exercised.

Źródło [4]

Wyniki pracy Withrow [5]:

Autorka i współpracownicy zebrali i usystematyzowali wyniki w dużym projekcie, stwierdzając kumulowanie defektów w małych i dużych modułach (na diagramie widać wyraźnie rozkład U-kształtny) oraz wysnuwając hipotezę o istnieniu optymalnego, średniego rozmiaru modułu o najmniejszej gęstości defektów.

Model Malaiya & Denton [6]:

Bazując na wcześniejszych badaniach, autorzy zaproponowali model umożliwiający wyznaczenie optymalnego rozmiaru modułu pod kątem gęstości defektów:

It provides an interpretation for both declining defect density for smaller modules and gradually rising defect density for larger modules. We observe that for several projects, distribution of module sizes is given by an exponential expression. (…) We identify the condition for optimal distribution. A model for characterizing variation of defect density due to module size variation has been obtained which can be used as a sub-model for a multi-factor defect density model.

Źródło [6]

Podsumowując, zjawisko kumulowania się defektów zostało udowodnione i jest już od dawna elementem testerskiego uzusu. Dzięki jego świadomości możemy lepiej planować test, skupiając się na modułach obarczonych największym ryzykiem, przyjmując za nie moduły najmniejsze i największe (gdy bazujemy jedynie na teorii), lub moduły wyznaczone na podstawie modelu i/lub danych historycznych w podobnych projektach.

Pamiętajmy jednak, że istnieją wyjątki od każdej zasady, dlatego też pozostańmy czujni podczas wykonywania testów, aby świadomość częstego występowania "klastrów" defektów nie sprawiła, że przeoczymy pojedyncze bugi.

O autorze

Małgorzata Ciwoniuk

Oprogramowanie testuję od ponad 3 lat. Zaczynałam w software house’ach, gdzie testowałam głównie aplikacje webowe, w mniejszym stopniu desktopowe i mobilne. Obecnie pracuję w Amazon Development Center na stanowisku Quality Assurance Engineer, gdzie mam możliwość testowania wiodących rozwiązań w technologii Text-to-Speech. Ukończyłam Politechnikę oraz Wyższą Szkołę Bankową w Gdańsku. Wierzę, że największą siłą oraz potencjałem branży IT jest gotowość do współpracy i dzielenia się wiedzą.

Opracowanie zostało przygotowane w ramach konkursu zorganizowanego przez organizatorów TestingCup 2018 oraz testerzy.pl.

Źródła

[1] Roman A., "Testowanie i jakość oprogramowania. Modele, techniki, narzędzia.", Wydawnictwo Naukowe PWN, 2016

[2] "ISTQB Certyfikowany tester - Poziom Podstawowy – Sylabus", wersja 2011.1.3 (pobrany ze strony SJSI: http://sjsi.org/ist-qb/do-pobrania/)

[3] Graham D., Van Veenendaal E., Evans I., Black R., "Foundations of Software Testing: ISTQB Certification", Cengage Learning EMEA, 2008

[4] Basili V., Perricone B., "Software Errors and Complexity: An Empirical Investigation", Communications of the ACM, 1984, 27(1), 42-52

[5] Withrow C., "Error Density and Size in Ada Software", IEEE Software, 1990, 11(4), 26-30

[6] Malayia Y., Denton J., "Module size distribution and defect density", IEEE Proc. 11th Symposium on Software Reliability Engineering, 2000, 62-71

Nazwa	Opis
PHPSESSID	Ciasteczko pozwalające na zapamiętywanie danych dotyczących stanu sesji.
_GRECAPTCHA	Ciasteczko pomagające zabezpieczyć formularze na stronie.
cookie_law_confirmed	Ciasteczko służące do wyświetlania tego okienka.
cookie_law_google_analytics	Ciasteczko zapamiętujące stan zgody użytkownika dotyczącej Google Analytics.
cookie_law_disqus	Ciasteczko zapamiętujące stan zgody użytkownika dotyczącej Disqus.
cookie_law_share_this	Ciasteczko zapamiętujące stan zgody użytkownika dotyczącej ShareThis.
article_visited	Ciasteczko pomagające ustalić, które artykuły są najbardziej popularne.
service_visited	Ciasteczko pomagające ustalić, które usługi są najbardziej popularne.
event_visited	Ciasteczko pomagające ustalić, które wydarzenia są najbardziej popularne.
training_visited	Ciasteczko pomagające ustalić, które szkolenia są najbardziej popularne.
external_training_visited	Ciasteczko pomagające ustalić, które zewnętrzne szkolenia są najbardziej popularne.

Nazwy	Opis
_utma	Unikalny użytkownik. Ciasteczko to zawiera unikalny numer identyfikacyjny, dzięki któremu narzędzie potrafi określić unikalnego i nowego użytkownika. Żywotność tego ciasteczka wynosi 2 lata i zapisywane jest w przeglądarce.
_utmb	Śledzenie odwiedzin. Ciasteczko przechowuje informację na temat danej odwiedziny.
_utmc	Śledzenie odwiedzin. Jego zadaniem jest ustalenie czy rozpocząć śledzenie nowej odwiedziny, czy też zbierane dane powinny zostać zaliczone do starej. Ciasteczko wygasa po zamknięciu przeglądarki.
_utmz	Źródła odwiedzin. Ciasteczko zawiera informację na temat źródeł odwiedzin. Dzięki niemu możliwe jest policzenie odwiedzin z wyszukiwarek oraz danych z kampanii marketingowych. Jego żywotność wynosi 6 miesięcy.
_utmv	Zmienne niestandardowe. Ciasteczko pojawia się tylko wtedy kiedy na witrynie zastosujemy śledzenie niestandardowych zmiennych. Jego żywotność to 2 lata.

Kumulowanie się defektów jest możliwe (i można to udowodnić)

Źródła

Powiązane szkolenia

Powiązane usługi

Popularne

Najnowsze

Bądź na bieżąco

Kumulowanie się defektów jest możliwe (i można to udowodnić)

Źródła

Powiązane szkolenia

Powiązane usługi

Certyfikacja oprogramowania

Testy wydajności

Audyt kodu

Popularne

Najnowsze

Bądź na bieżąco

To powinno Cię zainteresować