Testowanie hurtowni danych a testowanie Big Data - podstawy

Testowanie hurtowni danych a testowanie Big Data - podstawy
Temat testowania hurtowni danych często jest mylony z testowaniem Big Data. Koncept HD jest już dość utrwalony, a testowanie BD nie ma jeszcze jasnej i ostatecznej definicji. Głównie ze względu na swoją świeżość.

Koncept Big Data to hasło z innego poziomu niż hurtowanie danych. To, że oba te hasła odnoszą się do danych wcale nie oznacza, że jest to to samo.


W dużym skrócie w hurtowniach są terabajty danych, które potrzebne są do zrozumienia prowadzonego biznesu, w BD mówimy o zbieraniu olbrzymiej ilości danych, których przeznaczenia jeszcze nie znamy.

W hurtowniach testowanie jest łatwiejsze ze względu na dobrze zdefiniowane parametry danych i ich ciągłe użycie. Głównym problemem będzie tu ogrom danych i związany z tym czas przetwarzania, czyli wydajność. Drugim głównym problemem będzie pewność, że wygenerowane z danych raporty są poprawne.

W Big Data danych jest jeszcze więcej, więc nie do końca wiadomo, jak zadbać o ich jakość, spójność, poprawność i jednocześnie kontrolować, aby nie zostały uszkodzone. Mówimy więc o testowaniu w bardzo niedodefiniowanym i nie do końca jasnym środowisku.

 

 

Reasumując w przykładach:

  • Testowanie wydajności sprawdzi się i w HD i BD.
  • Testowanie klas równoważności i wartości granicznych będzie bardziej miało sens w HD.
  • Monitorowanie poprawności danych przez analizę porównawczą w dłuższym okresie czasu głównie dla BD.
  • Zastosowanie klasycznych strategii testowych może odnosić się zarówno do BD jak i do HD.

 

Więcej infografik z danymi:

http://imgrin.pl/meme/5031

http://imgrin.pl/meme/5032

 

Ciekawa analiza Gartnera o przyszłości zarządzania danymi: http://www.forbes.com/sites/louiscolumbus/2012/08/16/roundup-of-big-data-forecasts-and-market-estimates-2012/

 

 

To powinno Cię zainteresować