Gemini notuje 4-krotny spadek ruchu Na OpenRouter po wyłączeniu darmowych modeli

Ostatnie dni przyniosły znaczące zawirowania na rynku modeli AI, a w centrum uwagi znalazł się model Gemini 2.5 Flash. Raport z 21 czerwca 2025 roku wskazuje na dramatyczny, czterokrotny spadek dziennego użycia tego modelu na platformie OpenRouter, co jest bezpośrednią konsekwencją podwyżki cen przez Google. Przed zmianą cen Gemini 2.5 Flash przetwarzał imponujące 20 miliardów tokenów dziennie, by po podwyżce zanotować spadek do zaledwie 5 miliardów. To dobitnie świadczy o wysokiej wrażliwości cenowej deweloperów, którzy natychmiastowo zaczęli migrować do tańszych alternatyw, takich jak Gemini 2.0 Flash czy Flash Lite, które łącznie przetwarzały 21.8 miliarda tokenów dziennie. Okazuje się, że nawet minimalne opóźnienia, rzędu 25 ms na OpenRouter, nie były w stanie zrekompensować wyższych kosztów, co sugeruje, że podniesiona wartość modelu nie była postrzegana jako wystarczające uzasadnienie dla nowej, wyższej ceny.

Wzrost Popularności Darmowych Alternatyw

W obliczu spadku użycia Gemini 2.5 Flash, rynek AI dynamicznie zareagował, a konkurencja nie spała. Na horyzoncie pojawiło się wiele atrakcyjnych i, co najważniejsze, darmowych alternatyw dostępnych na OpenRouter.

DeepSeek: Modele takie jak 671B-parametrowe DeepSeek R1 (w tym wersje R1 0528) są niezwykle cenione za silne możliwości rozumowania, szczególnie w obszarach kodowania, matematyki i logiki. Ich dostępność bezpłatnie na OpenRouter czyni je niezwykle atrakcyjnymi kosztowo opcjami dla deweloperów.
Qwen: Rodzina modeli od Alibaba Group, w tym Qwen2.5-VL 7B Instruct i Qwen3 32B, wyróżnia się szerokimi zdolnościami w rozumieniu języka naturalnego, generowaniu tekstu, a także rozumieniu obrazu i dźwięku. Wiele wariantów, w tym modele multimodalne i MoE (Mixture of Experts), jest dostępnych bezpłatnie, co poszerza ich zastosowanie.
Phi (Microsoft): Małe modele językowe (SLM) od Microsoft Research, takie jak Phi-3 Medium 128K Instruct, zostały zaprojektowane do wydajnej pracy w środowiskach z ograniczoną pamięcią lub wymagających szybkich odpowiedzi. Są zoptymalizowane pod kątem złożonych zadań rozumowania i rozwiązywania problemów matematycznych, często dostępne w bardzo konkurencyjnych cenach, a nawet bezpłatnie na OpenRouter.
Inne darmowe modele: Platforma OpenRouter regularnie oferuje również darmowe warianty innych modeli, w tym popularne Llama 3 (np. meta-llama/llama-4-maverick:free) oraz specjalistyczne modele od mniejszych dostawców. Warto regularnie monitorować listę dostępnych opcji, aby być na bieżąco z darmowymi możliwościami.

Co Czeka Gemini w Przyszłości?

Spadek użycia o 75% to wyraźny sygnał, którego Google nie może zignorować. Eksperci przewidują korektę cenową już w lipcu 2025 roku. Może ona przyjąć formę wprowadzenia warstwowego cennika, który rozróżni zadania “myślące” od “niemyślących”, lub powrotu do stawek sprzed 19 czerwca. Możemy również spodziewać się rozwoju linii modeli w sierpniu-wrześniu 2025 roku, na przykład poprzez wprowadzenie Gemini 2.5 Flash Lite, bardziej zoptymalizowanego pod kątem tanich zadań.

W dłuższej perspektywie, na IV kwartał 2025 roku, prognozuje się dalszą poprawę wydajności, być może w postaci aktualizacji 2.5 Pro lub zapowiedzi Gemini 3.0 z nowymi funkcjami. Niewykluczone są również szersze integracje z ekosystemem Google w latach 2025-2026, w tym programy lojalnościowe i darmowe tiery, mające na celu przyciągnięcie i zatrzymanie deweloperów.

Rekomendacje dla Deweloperów

W krótkoterminowej perspektywie, deweloperom zaleca się rozważenie przejścia na Gemini 2.0 Flash/Lite w celu zapewnienia płynnego przejścia i obniżenia kosztów. Alternatywnie, warto przetestować dostępne darmowe modele, takie jak DeepSeek, Qwen czy Phi, aby zweryfikować, która opcja najlepiej odpowiada ich specyficznym potrzebom i budżetowi.

Długoterminowo, kluczowe będzie monitorowanie zapowiedzi Google, zwłaszcza tych planowanych na lipiec 2025 roku, które mogą przynieść istotne zmiany w strategii cenowej i rozwoju modeli. Aby podjąć świadome decyzje, rekomenduje się przeprowadzenie testów porównawczych wydajności (uwzględniających liczbę tokenów, opóźnienie i dokładność) za pomocą API OpenRouter, a także śledzenie aktualizacji na blogach Google i OpenRouter. Rynek AI pozostaje niezwykle dynamiczny, a elastyczność i gotowość do adaptacji są kluczowe dla sukcesu w tej rapidly zmieniającej się dziedzinie.

Table of Contents