AI - podsumowanie Luty 2025

Najgłośniejsze tematy w lutym to:

Gemini 2.0

Gemini 2.0 Pro (bo Flash widzieliśmy już w styczniu)

https://blog.google/technology/google-deepmind/gemini-model-updates-february-2025/

Grok 3

Grok 3 oczywiście w wersji Reasoning Model. Dostępne są właściwie dwa modele w wersji beta, Grok 3 (Think) i Grok 3 mini (Think). Zostały one przeszkolone przy użyciu Reinforcement Learning (RL). Poza wieloma odniesieniami do benchamarków, mi osobiście nie udało się znaleźć wielu szczegółów technicznych. Większość to domysły. Bardzo zamknięty ten model jak na firmę, na której czele stoi wojownik o formułę non-profit z OpenAI.

https://x.ai/news/grok-3

Claude 3.7 (sonnet)

Osobiście kibicuje Anthropic i temu jak sprawnie dotrzymują kroku innym konkurentem, ale przede wszystkim temu, że starają się mimo wszystko sporo pokazać i wytłumaczyć. Oczywiście daleko szukać tutaj otwartości i szczegółowości DeepSeek, ale nadal kultura Anthropic jest warta pochwały.

Wracając do modelu – mamy tutaj model hybrydowy, niejako przygotowany do pracy agentowej, świetny (i twórcy wprost przyznają, że taki był cel) w kodowaniu, wykonywaniu instrukcji, CoT i działań muli modalnych,

https://www.anthropic.com/news/claude-3-7-sonnet

AI – podsumowanie Luty 2025

Gemini 2.0

Grok 3

Claude 3.7 (sonnet)

Styczeń 2025 w AI – podsumowanie

Marzec 2025 w AI

Related Posts

Digital Red Queen – ewolucja programów w środowisku Core War z wykorzystaniem LLMów

Tytani Pamięci – Titans: Learning to Memorize at Test Time – analiza publikacji

Measuring Agents in Production – Analiza systemów agentowych w środowiskach produkcyjnych

DeepSeek-V3.2 – nowy model. Podsumowanie raportu.

Write A Comment Cancel Reply