Najgłośniejsze tematy w lutym to:

Gemini 2.0

Gemini 2.0 Pro (bo Flash widzieliśmy już w styczniu)

Grok 3

Grok 3 oczywiście w wersji Reasoning Model. Dostępne są właściwie dwa modele w wersji beta, Grok 3 (Think) i Grok 3 mini (Think). Zostały one przeszkolone przy użyciu Reinforcement Learning (RL). Poza wieloma odniesieniami do benchamarków, mi osobiście nie udało się znaleźć wielu szczegółów technicznych. Większość to domysły. Bardzo zamknięty ten model jak na firmę, na której czele stoi wojownik o formułę non-profit z OpenAI.

Claude 3.7 (sonnet)

Osobiście kibicuje Anthropic i temu jak sprawnie dotrzymują kroku innym konkurentem, ale przede wszystkim temu, że starają się mimo wszystko sporo pokazać i wytłumaczyć. Oczywiście daleko szukać tutaj otwartości i szczegółowości DeepSeek, ale nadal kultura Anthropic jest warta pochwały.

Wracając do modelu – mamy tutaj model hybrydowy, niejako przygotowany do pracy agentowej, świetny (i twórcy wprost przyznają, że taki był cel) w kodowaniu, wykonywaniu instrukcji, CoT i działań muli modalnych,

Write A Comment