Anthropic przywrócił Fable 5 na całym świecie 1 lipca z zachowaniem wszystkich jego możliwości, dodając filtr, który blokuje oznaczony prompt hakerski w ponad 99% prób.
Departament Handlu USA uchylił awaryjne zarządzenie eksportowe 30 czerwca, a model ponownie dotarł do użytkowników następnego dnia w ramach platformy Claude, Claude.ai, Claude Code i Claude Cowork. Dostęp za pośrednictwem głównych platform chmurowych zostanie udostępniony wkrótce.
Płatni subskrybenci mogą z niego korzystać w ramach swoich tygodniowych limitów do 7 lipca, po czym ciągły dostęp przechodzi na system rozliczany na podstawie kredytów użyciowych.
Model został wyłączony 12 czerwca. Regulatorzy zabronili każdemu obcokrajowcowi korzystania z niego i dali firmie zaledwie około 90 minut na przestrzeganie zakazu, więc Anthropic wycofał model dla wszystkich użytkowników, zamiast próbować sprawdzać ich jednego po drugim w czasie rzeczywistym.
Dyrektywa była następstwem raportu, w którym badacze z Amazon znaleźli prompt, który skłonił model do oznaczenia grupy luk w oprogramowaniu w powszechnych systemach. W jednym przypadku poszedł dalej i wygenerował działający kod pokazujący, jak można wykorzystać pojedynczą lukę. To właśnie ta pojedyncza demonstracja, bardziej niż lista luk, wywołała alarm.
Przeczytaj także: CrowdStrike ostrzega, że Claude Mythos może przyspieszyć decyzje dotyczące luk zero-day
Własny przegląd Anthropic, przeprowadzony wspólnie z rządem i firmą, która złożyła raport, potwierdził, że znacznie słabsze modele mogły ujawnić te same luki, wśród nich Opus 4.8, GPT-5.5 i Kimi K2.7. Każdy inny model sprawdzony przez zespół nadal mógł odtworzyć pojedynczą demonstrację exploita, co podważyło tezę, że tylko Fable 5 posiada unikalną broń cybernetyczną. Firma nazwała ten zakaz nadużyciem.
Naprawa była wąska. Po powrocie model posiada jeden klasyfikator, który wyłapuje zgłoszony prompt i przekierowuje go do słabszego Opus 4.8, pozostawiając możliwości Fable 5 nienaruszone, ale wywołując fałszywe alarmy przy zwykłym kodowaniu i ostrzegając użytkownika za każdym razem, gdy interweniuje.
Mythos 5, ten sam model bazowy z mniejszą liczbą zabezpieczeń, pozostaje odizolowany dla około 100 sprawdzonych organizacji w USA w ramach programu o nazwie Project Glasswing.
Firma otworzyła również publiczny kanał do zgłaszania jailbreaków. Obiecała również regulatorom wcześniejszy dostęp do testowania przyszłych modeli granicznych przed ich premierą.
Fable 5 zadebiutował 9 czerwca jako pierwszy szeroko dostępny model klasy Mythos od Anthropic, chwalony w wielu branżowych benchmarkach, zanim zniknął w ciągu kilku dni od premiery. Awaria trwała zaledwie trzy tygodnie. Jego powrót odzyskuje teraz pozycję w benchmarkach, którą szybko rozwijające się chińskie laboratorium po cichu przejęło, gdy model był nieaktywny.
Przeczytaj dalej: XRP ponownie testuje 1,07 USD, gdy czerwcowe odrzucenia rzucają cień na byki

