Koncept Big Data to hasło z innego poziomu niż hurtowanie danych. To, że oba te hasła odnoszą się do danych wcale nie oznacza, że jest to to samo.
W dużym skrócie w hurtowniach są terabajty danych, które potrzebne są do zrozumienia prowadzonego biznesu, w BD mówimy o zbieraniu olbrzymiej ilości danych, których przeznaczenia jeszcze nie znamy.
W hurtowniach testowanie jest łatwiejsze ze względu na dobrze zdefiniowane parametry danych i ich ciągłe użycie. Głównym problemem będzie tu ogrom danych i związany z tym czas przetwarzania, czyli wydajność. Drugim głównym problemem będzie pewność, że wygenerowane z danych raporty są poprawne.
W Big Data danych jest jeszcze więcej, więc nie do końca wiadomo, jak zadbać o ich jakość, spójność, poprawność i jednocześnie kontrolować, aby nie zostały uszkodzone. Mówimy więc o testowaniu w bardzo niedodefiniowanym i nie do końca jasnym środowisku.
Reasumując w przykładach:
- Testowanie wydajności sprawdzi się i w HD i BD.
- Testowanie klas równoważności i wartości granicznych będzie bardziej miało sens w HD.
- Monitorowanie poprawności danych przez analizę porównawczą w dłuższym okresie czasu głównie dla BD.
- Zastosowanie klasycznych strategii testowych może odnosić się zarówno do BD jak i do HD.
Więcej infografik z danymi:
Ciekawa analiza Gartnera o przyszłości zarządzania danymi: http://www.forbes.com/sites/louiscolumbus/2012/08/16/roundup-of-big-data-forecasts-and-market-estimates-2012/