Playwright + LLM + MCP: wykorzystanie AI do testów API i UI

Jak podejść do testowania LLM-ów?

Duże modele językowe (LLM) nie działają jak klasyczne aplikacje. Ich odpowiedzi są zmienne, probabilistyczne i zależne od parametrów generacji, więc nawet pozornie identyczne zapytania mogą prowadzić do różnych wyników. James Bach przypomina, że jeśli chcemy je testować uczciwie, musimy zmienić sposób myślenia.

Playwright 1.56.0

Nowa wersja Playwrighta to jedno z tych wydań, które oprócz poprawy wygody pracy, zmieniają też sposób myślenia o automatyzacji testów. Zamiast kolejnych usprawnień frameworku, dostaliśmy kompletny system oparty na agentach AI, które potrafią samodzielnie analizować aplikację, generować testy, a nawet je naprawiać.

Czy BDD ma jeszcze sens?

Behavior-Driven Development (BDD) ma za sobą dwie dekady historii. Dla wielu zespołów był impulsem do zbliżenia biznesu, testerów i programistów wokół wspólnego celu, jakim jest zrozumienie i dostarczenie wartościowego zachowania systemu. Dziś coraz częściej pojawia się pytanie: czy BDD jeszcze żyje? I co ważniejsze – czy nadal warto się nim zajmować?

Automatyzacja AGENTLESS

Czy do automatyzacji zadań programistycznych potrzebujemy złożonych agentów AI, które planują, analizują, używają narzędzi i samodzielnie uczą się na błędach? Zespół badaczy z University of Illinois proponuje inne rozwiązanie – AGENTLESS – które pokazuje, że prosta architektura może być bardziej skuteczna, tańsza i łatwiejsza do zrozumienia niż wieloetapowe systemy agentowe.

Testowanie z AI w praktyce. Modele, narzędzia i podejścia

Nie wszystkie narzędzia AI sprawdzają się tak samo w testowaniu. Jedne dobrze radzą sobie z prostymi przypadkami, inne potrafią analizować cały kod i samodzielnie uruchamiać testy. Rodzi się jednak pytanie, które modele i narzędzia faktycznie warto włączyć do procesu testowania?

Vibium. Proof of concept

Twórca Selenium i Appium, Jason Huggins, wraca z kolejnym projektem testowym. Tym razem stawia na decentralizację, realizm środowisk i zminimalizowaną konfigurację. Vibium, bo o nim mowa, ma być próbą stworzenia alternatywy dla dotychczasowych rozwiązań w testowaniu aplikacji webowych, opartą na rzeczywistych urządzeniach i sztucznej inteligencji. Brzmi ambitnie. Ale czy faktycznie działa?

Negatywne scenariusze testowe. Przykłady

Nie każda awaria oprogramowania to efekt źle napisanej funkcji. Często problem leży w tym, czego nikt nie sprawdził albo w sytuacjach, które wydają się zbyt mało prawdopodobne, by brać je pod uwagę. A jednak właśnie takie "nieprawdopodobne" scenariusze potrafią sparaliżować działanie systemu w najmniej oczekiwanym momencie.

Test Dive 2025. Rejestracja i agenda

9 października Kraków znów będzie miejscem, gdzie spotkają się testerzy. Test Dive 2025 to jedna z największych w Polsce konferencji o jakości i testowaniu oprogramowania. Rejestracja na wydarzenie już trwa, a agenda pokazuje, że w tym roku również możemy liczyć na wyjątkowo różnorodny program.