Rok temu, w Q1 2025, GPT-4 Turbo był najlepszym dostępnym modelem, Claude 3 Opus kosztował fortunę za milion tokenów, a "agenci AI" istnieli głównie w demo na konferencjach. Mamy marzec 2026 i sytuacja wygląda zupełnie inaczej. Zebrałem zmiany, które widzę z perspektywy kogoś, kto codziennie buduje rozwiązania AI dla firm.
Modele - skok jakości przy spadku cen
Zacznę od tego, co najbardziej rzuca się w oczy: nowe modele są lepsze i tańsze jednocześnie.
OpenAI wypuściło GPT-4o w maju 2025, potem serię o1 i o3 z reasoning capabilities. GPT-4o kosztuje $2.50 za milion tokenów wejściowych - porównaj to z $30 za milion tokenów w GPT-4 Turbo z marca 2025. Spadek 12x w ciągu roku. Model o3 rozwiązuje zadania matematyczne i programistyczne na poziomie, który rok temu wydawał się odległy o kilka lat.
Anthropic zrobił jeszcze większy skok. Claude 3 miał 200k kontekstu. Claude 4.6 ma milion tokenów kontekstu - pięć razy więcej. Mogę wrzucić cały codebase średniego projektu i zadawać pytania o architekturę. Rok temu musiałem kroić dokumenty na kawałki i liczyć tokeny. Teraz wrzucam wszystko i działa.
Google z Gemini 2.5 Pro dogonił konkurencję w benchmarkach, a w niektórych zadaniach (długi kontekst, multimodalność) przegonił. Gemini 2.5 obsługuje do 1 miliona tokenów kontekstu i radzi sobie z analizą wideo - coś, co rok temu było na etapie wczesnych eksperymentów.
Mam mieszane uczucia co do tempa tych zmian. Z jednej strony buduję lepsze rzeczy szybciej. Z drugiej - rozwiązanie, które wdrożyłem klientowi w styczniu, w marcu mogę zrobić za ułamek kosztu na nowszym modelu. Planowanie w takim otoczeniu to trochę strzelanie do ruchomego celu.
Ceny API - wyścig w dół
Spadki cen to osobny temat, bo są tak duże, że zmieniają ekonomikę całych projektów.
W marcu 2025 przetworzenie miliona tokenów na GPT-4 Turbo kosztowało $30 (input) i $60 (output). Dziś GPT-4o mini kosztuje $0.15 za input i $0.60 za output. To spadek 200x na wejściu. Claude 3.5 Sonnet kosztuje $3 za milion tokenów wejściowych - pięć razy mniej niż Claude 3 Opus rok temu.
Co to oznacza w praktyce? Chatbot obsługujący 1000 rozmów dziennie, który w 2025 generował rachunek $500-800 miesięcznie za API, teraz kosztuje $30-60 na lepszym modelu. Projekty, które rok temu nie miały sensu ekonomicznego (np. AI analizujące każdy email przychodzący do firmy), teraz mieszczą się w budżecie małego zespołu.
Widzę to u klientów. Firmy, które rok temu testowały AI na jednym procesie, teraz wdrażają je w trzech-czterech kolejnych, bo koszty spadły na tyle, że ROI jest oczywiste.
Narzędzia do kodowania - nowa era
Rok temu Copilot był jedynym poważnym narzędziem AI do kodowania. Teraz mam Cursor, Claude Code, Windsurf, Copilot X, Cline, Aider i kilkanaście mniejszych. Każde podchodzi do problemu inaczej.
Cursor i Windsurf dają AI kontekst całego projektu - otwarte pliki, strukturę katalogów, historię zmian. Claude Code działa z terminala i obsługuje cały workflow: czyta kod, edytuje pliki, uruchamia testy, commituje zmiany. Nie asystuje przy kodowaniu - koduje.
Pojawił się termin "vibe coding" - podejście, w którym opisujesz co chcesz, a AI generuje kod, ty sprawdzasz i ewentualnie korygujesz. Rok temu to był żart. Teraz programiści, których szanuję, używają tego podejścia do prototypowania i mniejszych feature'ów. Nadal czytają wygenerowany kod, nadal go rozumieją, ale piszą mniej ręcznie.
Używam Claude Code codziennie i oszczędzam kilka godzin tygodniowo na powtarzalnych zadaniach - testy, refactoring, boilerplate. Przy złożonej logice biznesowej nadal piszę sam, bo modele gubią kontekst wymagań. Ale proporcja "piszę sam" do "AI pisze, ja weryfikuję" przesunęła się z 90/10 na mniej więcej 60/40.
MCP - protokół, który połączył narzędzia
Model Context Protocol (MCP) to chyba najważniejsza zmiana infrastrukturalna tego roku. Anthropic opublikował specyfikację pod koniec 2024, a w 2025 adopcja eksplodowała.
MCP to otwarty standard, który pozwala modelom AI łączyć się z zewnętrznymi narzędziami - bazami danych, API, systemami firmowymi - przez ujednolicony interfejs. Przed MCP każda integracja wymagała dedykowanego kodu. Teraz piszę jeden serwer MCP i działa z Claude, GPT, Gemini - z każdym klientem, który obsługuje protokół.
W praktyce oznacza to, że agent AI może sprawdzić kalendarz Google, odczytać dane z Garmin, pobrać pogodę i zaplanować dzień - wszystko przez standardowe połączenia MCP. Rok temu każda z tych integracji to byłby osobny projekt. Teraz to konfiguracja na godzinę.
Adopcja jest szeroka. Cursor, Claude Code, Windsurf - wszystkie wspierają MCP. Powstały setki gotowych serwerów MCP dla popularnych usług. Dla mnie jako developera to zmiana porównywalna z tym, czym REST API było dla web developmentu.
Open source - Llama, Mistral, Qwen, DeepSeek
Rok temu open source'owe modele były wyraźnie gorsze od komercyjnych. Ta luka się skurczyła.
Meta wydała Llama 3 z wariantami od 8B do 405B parametrów. Llama 3 70B osiąga wyniki porównywalne z GPT-4 z marca 2025 - model, który rok temu był szczytem możliwości, teraz można uruchomić na własnym serwerze za darmo.
Mistral z Francji, Qwen od Alibaby, DeepSeek z Chin - każdy wypuszcza modele co kilka miesięcy. DeepSeek R1 zrobił sporo szumu swoimi zdolnościami rozumowania przy relatywnie małym rozmiarze.
Dla firm to dobra wiadomość z perspektywy prywatności danych. Klient, który nie chce wysyłać dokumentów do API OpenAI, może postawić Llama 3 70B na własnym serwerze i mieć model, który obsłuży 80% typowych zastosowań biznesowych. Rok temu self-hosting oznaczał kompromis na jakości. Teraz kompromis jest dużo mniejszy.
Agenci - z konferencji do produkcji
W 2025 "agenci AI" to był buzzword. Prezentacje na konferencjach pokazywały demo, które działały pod kontrolą, ale w realnych warunkach się sypały. Agenty gubiły kontekst, halucynowały, wpadały w pętle.
W 2026 agenci działają w produkcji - z ograniczeniami, ale działają. Widzę agentów obsługujących L1 support (zbieranie informacji, kategoryzacja zgłoszeń, odpowiedzi na FAQ). Agentów przetwarzających dokumenty (faktury, umowy, formularze). Agentów monitorujących dane i wysyłających alerty.
Co się zmieniło? Dłuższy kontekst (milion tokenów zamiast 128k), lepsze narzędzia do orkiestracji (LangGraph, CrewAI, frameworki agentowe), MCP do integracji i reasoning models (o1, o3), które lepiej planują wieloetapowe zadania.
Nadal nie ufam agentom w zadaniach, gdzie błąd kosztuje dużo - wysyłanie maili do klientów, modyfikacja danych produkcyjnych, decyzje finansowe. Ale w zadaniach, gdzie agent przygotowuje draft a człowiek zatwierdza, oszczędności czasu są realne. Jeden z moich klientów skrócił czas obsługi zapytań ofertowych z 2 godzin do 15 minut - agent zbiera dane, analizuje wymagania i generuje szkic oferty, handlowiec przegląda i wysyła.
Co mnie zaskoczyło
Nie spodziewałem się, że vibe coding tak szybko stanie się normalnym podejściem. Myślałem, że programiści będą się opierać dłużej. Okazało się, że kiedy narzędzie oszczędza 2-3 godziny dziennie, ideologia ustępuje pragmatyzmowi.
Nie spodziewałem się też, że ceny spadną aż tak. 10-200x taniej w ciągu roku to tempo, które łamie kalkulacje biznesowe. Klienci, którym rok temu mówiłem "to się nie opłaci przy tej skali", teraz wracają z pytaniem "a teraz?". I teraz się opłaca.
Zaskoczyło mnie natomiast, jak wolno firmy adoptują te zmiany. Mimo niższych cen i lepszych narzędzi, większość polskich firm nadal jest na etapie "ChatGPT do pisania maili". Przepaść między tym, co AI potrafi, a tym, jak firmy tego używają, rośnie zamiast się kurczyć.
Co dalej
Q2 i Q3 2026 przyniosą pewnie kolejne modele i kolejne spadki cen. Ale największy potencjał widzę w integracji - łączeniu modeli AI z istniejącymi systemami firmowymi przez MCP i agentów. Technologia jest gotowa. Teraz chodzi o to, żeby firmy ją wdrożyły w sposób, który ma sens dla ich procesów.
Jeśli zastanawiasz się, jak AI może usprawnić procesy w Twojej firmie - od automatyzacji powtarzalnych zadań po inteligentnych chatbotów i agentów - napisz do mnie. Przeanalizuję Twoje procesy i pokażę, gdzie AI da realny zysk czasu i pieniędzy.