Anthropic zaproponowało nowe ramy polityki AI w związku z rosnącymi możliwościami zaawansowanych systemów.
Firma chce, aby rządy ustanowiły zasady dla modeli granicznych i przygotowały pracowników na gospodarcze skutki AI. Plan obejmuje niebezpieczne wdrożenia, niezależne testowanie, cyberbezpieczeństwo i odporność społeczną.
Anthropic przedstawiło dwie propozycje w ramach planu „Policy on the AI Exponential". Zaawansowane Ramy AI koncentrują się na potężnych modelach, podczas gdy Ramy Polityki Gospodarczej dotyczą pracowników i wspólnych korzyści finansowych. Firma argumentowała, że AI rozwija się teraz szybciej niż obecne systemy tworzenia polityki. Stwierdziła również, że rządy potrzebują uprawnień do blokowania lub powstrzymywania niebezpiecznych wdrożeń modeli.
W ramach planu kary cywilne byłyby powiązane z globalnym rocznym przychodem. Kolejne naruszenia skutkowałyby wyższymi karami zgodnie z proponowanymi ramami. Ramy wzywają również twórców modeli granicznych do testowania ich przed udostępnieniem. Deweloperzy publikowaliby podsumowania, ramy bezpieczeństwa i karty systemów dla potężnych systemów AI.
Niezależni ewaluatorzy przeglądaliby testy modeli i raporty ryzyka. Anthropic chce również, aby deweloperzy utrzymywali silne programy bezpieczeństwa dla wag modeli i systemów szkoleniowych. Propozycja wspiera przepisy dotyczące przejrzystości w stanach takich jak Kalifornia i Nowy Jork. Jednak firma argumentowała, że samo publiczne ujawnianie informacji nie nadąża już za tempem rozwoju AI.
Proponowane zasady dotyczyłyby wyłącznie najbardziej zaawansowanych systemów AI. Anthropic ustaliło próg na poziomie modeli trenowanych powyżej 10²⁵ operacji zmiennoprzecinkowych. Ramy obejmowałyby również firmy osiągające przychody powyżej 500 milionów dolarów z działalności związanej z AI. Objęłyby one także firmy wydające ponad 1 miliard dolarów na badania i rozwój AI.
Anthropic wskazało cztery główne obszary ryzyka w propozycji. Obejmują one ryzyko biologiczne, ryzyko cybernetyczne, utratę kontroli i zautomatyzowane badania AI. W zakresie ryzyka biologicznego firma ostrzegła, że niebezpieczne systemy mogą pomagać atakującym w opracowywaniu szkodliwych wirusów. Odnotowała również, że podobne narzędzia AI mogą wspierać odkrywanie leków.
W zakresie ryzyka cybernetycznego modele graniczne mogą wykrywać poważne luki w oprogramowaniu na dużą skalę. Anthropic stwierdziło, że te możliwości budzą obawy dotyczące szpitali, sieci energetycznych i innych kluczowych systemów. Firma podkreśliła również ryzyko związane z systemami działającymi poza kontrolą deweloperów. Zautomatyzowane badania AI mogłyby zwiększyć ryzyko biologiczne, cybernetyczne i związane z kontrolą, gdyby zawiodły mechanizmy zabezpieczające.
Anthropic chce, aby twórcy modeli granicznych publikowali regularne raporty ryzyka. Raporty te opisywałyby ogólną postawę deweloperów wobec ryzyka i prace nad bezpieczeństwem modeli. Ramy wzywają również do powołania co najmniej jednego wykwalifikowanego niezależnego ewaluatora. Ewaluator ten przeglądałby oceny firmy i publikował wyniki dotyczące raportów ryzyka modeli.
Rządy i branża ustanowiłyby również standardy dla tych ewaluatorów. Propozycja stanowi, że ewaluatorzy potrzebują finansowania i dostępu do modeli granicznych. Zasady bezpieczeństwa stanowią kolejną ważną część ram. Deweloperzy chroniłyby całe swoje środowisko programistyczne przed zewnętrznymi atakującymi i zagrożeniami wewnętrznymi.
Firmy publicznie opisywałyby swoje programy bezpieczeństwa na wysokim poziomie ogólności. Na żądanie udostępniałyby również więcej szczegółów wyznaczonej agencji rządowej. Anthropic stwierdziło, że decydenci mogą zacząć od lżejszych przepisów i dostosowywać je z czasem. Ramy wskazują, że regulacja powinna podążać za możliwościami modeli i standardami oceny.
Druga część ram koncentruje się na odporności społecznej. Anthropic zaleciło silniejsze planowanie w zakresie biologicznych, cybernetycznych i związanych z kontrolą zagrożeń AI. W zakresie biologii propozycja obejmuje screening syntezy genów i wczesne ostrzeganie biobezpieczeństwa. Wspomina również o zapasach sprzętu ochronnego i narzędziach ograniczających transmisję drogą powietrzną.
W zakresie cyberbezpieczeństwa ramy wzywają do wzmocnienia oprogramowania internetowego i wsparcia dla operatorów infrastruktury krytycznej. Zalecają również zastępowanie przestarzałych systemów w kluczowej infrastrukturze. Rządy powinny również śledzić graniczne możliwości cybernetyczne za pośrednictwem dedykowanej funkcji. Anthropic zaproponowało wspólną pracę rządu i przemysłu nad zabezpieczeniami modeli.
Firma stwierdziła, że prace nad ryzykiem utraty kontroli i zautomatyzowanych badań są jeszcze mniej rozwinięte. Wezwała do opracowania lepszych narzędzi do wykrywania, powstrzymywania lub wyłączania niebezpiecznych systemów. Anthropic wezwało decydentów do działania w miarę dalszego rozwijania możliwości modeli. Firma stwierdziła, że zarządzanie AI musi nadążać za technologią.

