Jak testować LLM-y?

12 listopada 2025

Dołącz do dyskusji

James Bach opublikował niedawno tekst, w którym porządkuje swoje przemyślenia na temat testowania systemów opartych na dużych modelach językowych (LLM). W przeciwieństwie do dominującego w branży entuzjazmu, Bach proponuje podejście ostrożnie, krytyczne i wymagające, ale przede wszystkim merytoryczne.

GenAI to nie aplikacja

Zasadniczy punkt wyjścia Bacha jest prosty: nie da się testować GenAI tak, jak testuje się klasyczne aplikacje. Nie mamy tu do czynienia z zamkniętym zakresem funkcjonalności, ale z probabilistycznym systemem o zmiennym zachowaniu. Działanie LLM-ów jest częściowo nieprzewidywalne, zależne od parametrów generacji i trudne do powtórzenia. Nie istnieje „jedno prawidłowe zachowanie”, a każda interakcja z modelem jest potencjalnie nowym przypadkiem testowym.

Pełną treść artykułu oraz więcej materiałów dla testerów znajdziesz na platformie testerzy+

Czytaj dalej na testerzy+

AI genai llm

Czytaj następny

Pokrycie instrukcji i decyzji już nie takie ważne w ISTQB®?

Powiązane szkolenia

Nowość

Bestseller
Gwarantowany termin
Dostępne miejsca
Bestseller

Testing with Generative AI

13.04.2026

2 dni • 16h • online

Cena netto

1 800 zł

To powinno Cię zainteresować

Baza wiedzy Artykuły

Junior tester czy operator algorytmu?

Baza wiedzy Artykuły

Automatyzacja testów vs orkiestracja testów

Baza wiedzy Artykuły

AI przygotowuje do egzaminu ISTQB® Advanced

Używamy plików cookies lub podobnych technologii w celu zapewnienia Ci dostępu do serwisu, usprawniania jego działania, profilowania i wyświetlania treści dopasowanych do Twoich potrzeb. Klikając „Zapisz”, zgadzasz się na przechowywanie ich na swoim urządzeniu lub ustaw własne preferencje. Pamiętaj, że zmiana ta może spowodować brak dostępu do serwisu lub niektórych jego funkcji.

Ustawienia plików cookies

Tutaj możesz dokonać szczegółowych ustawień w zakresie plików cookies innych niż podstawowe do prawidłowego funkcjonowania strony.

Podstawowe

Podstawowe ciasteczka służą do zapewnienia prawidłowego funkcjonowania naszej strony internetowej, właściwej obsługi użytkowników, m.in. przez zapewnienie bezpieczeństwa czy prawidłowe dostarczenie i dostosowanie usługi. Nie umożliwiają one identyfikacji konkretnego użytkownika. Strona internetowa nie może funkcjonować poprawnie bez tych ciasteczek.

Nazwa	Opis
PHPSESSID	Ciasteczko pozwalające na zapamiętywanie danych dotyczących stanu sesji.
_GRECAPTCHA	Ciasteczko pomagające zabezpieczyć formularze na stronie.
cookie_law_confirmed	Ciasteczko służące do wyświetlania tego okienka.
cookie_law_google_analytics	Ciasteczko zapamiętujące stan zgody użytkownika dotyczącej Google Analytics.
cookie_law_disqus	Ciasteczko zapamiętujące stan zgody użytkownika dotyczącej Disqus.
cookie_law_share_this	Ciasteczko zapamiętujące stan zgody użytkownika dotyczącej ShareThis.
article_visited	Ciasteczko pomagające ustalić, które artykuły są najbardziej popularne.
service_visited	Ciasteczko pomagające ustalić, które usługi są najbardziej popularne.
event_visited	Ciasteczko pomagające ustalić, które wydarzenia są najbardziej popularne.
training_visited	Ciasteczko pomagające ustalić, które szkolenia są najbardziej popularne.
external_training_visited	Ciasteczko pomagające ustalić, które zewnętrzne szkolenia są najbardziej popularne.

Google Analytics

Narzędzie Google Analytics służy do analizowania ruchu, ale nie gromadzi żadnych danych, które mogłyby Cię zidentyfikować. Google Analytics informuje w szczególności o: czasie spędzonym na stronie, przejściach pomiędzy poszczególnymi podstronami czy źródłach ruchu. Jeżeli wyłączysz Google Analytics, pozbawisz nas możliwości prowadzenia skutecznych działań analitycznych.

Nazwy	Opis
_utma	Unikalny użytkownik. Ciasteczko to zawiera unikalny numer identyfikacyjny, dzięki któremu narzędzie potrafi określić unikalnego i nowego użytkownika. Żywotność tego ciasteczka wynosi 2 lata i zapisywane jest w przeglądarce.
_utmb	Śledzenie odwiedzin. Ciasteczko przechowuje informację na temat danej odwiedziny.
_utmc	Śledzenie odwiedzin. Jego zadaniem jest ustalenie czy rozpocząć śledzenie nowej odwiedziny, czy też zbierane dane powinny zostać zaliczone do starej. Ciasteczko wygasa po zamknięciu przeglądarki.
_utmz	Źródła odwiedzin. Ciasteczko zawiera informację na temat źródeł odwiedzin. Dzięki niemu możliwe jest policzenie odwiedzin z wyszukiwarek oraz danych z kampanii marketingowych. Jego żywotność wynosi 6 miesięcy.
_utmv	Zmienne niestandardowe. Ciasteczko pojawia się tylko wtedy kiedy na witrynie zastosujemy śledzenie niestandardowych zmiennych. Jego żywotność to 2 lata.

Disqus

Wtyczka z modułem komentarzy wykorzystuje pliki cookies firmy Disqus Inc, która zapewnia o anonimowości informacji w ramach gromadzonych ciasteczek. Może jednak wykorzystać te informacje dla własnych celów marketingowych, na co nie mamy wpływu. Ich wyłączenie uniemożliwi Ci korzystanie z systemu komentarzy.

ShareThis

Wtyczka łączy naszą stronę internetową z popularnymi mediami społecznościowymi, takimi jak Facebook, Twitter, LinkedIn czy wykop.pl i pozwala na łatwiejsze udostępnianie treści w tych mediach. Kontrolę nad tymi plikami sprawują wymienione platformy.

HubSpot

Nasz czat live, dostarczany przez HubSpot, wykorzystuje pliki cookies, aby usprawnić Twoją obsługę, ale nie gromadzi żadnych danych, które mogłyby Cię osobiście zidentyfikować. Pliki cookies informują nas o tym, jak korzystasz z czatu, na przykład jak długo trwa Twoja rozmowa, jakie pytania zadajesz czy z jakiego źródła trafiłeś na nasz czat. Jeśli wyłączysz pliki cookies, uniemożliwisz nam analizowanie tych informacji i ulepszanie naszego czatu, aby jeszcze lepiej odpowiadał na Twoje potrzeby.

Jak testować LLM-y?

GenAI to nie aplikacja

Powiązane szkolenia

Seria AI w testowaniu

Popularne

Najnowsze

Bądź na bieżąco