Test NSFW Mythos: Ograniczenia modelu Anthropic ujawnione

Test NSFW Mythos Anthropic pokazuje granice filtrów bezpieczeństwa

James Morton • Opublikowano 25.05.2026 - 14:36 • Zaktualizowano 09.06.2026 - 15:48 • 2 min czytania • 186,308 • 8,438

TEST PORNO

Test NSFW Anthropic Mythos: Co pozwala kontrolowany model

May 2026

Jak testowaliśmy filtry

Słuchajcie, wdrożenie jest minimalne. Brak publicznego API. Uruchomiliśmy prompty przez kanały dostępu partnerskiego opisane we wczesnych relacjach z kwietnia. Najpierw próbowaliśmy sugestywnych póz. Potem częściowej nagości. Pełnych scen explicit. Stylów hentai. Kinków graniczących z przemocą. Każdy test trafił na tę samą ścianę. Sprawdzone warunki graniczne obejmowały typy ciała, zdejmowanie ubrań i bezpośredni język erotyczny. Wszystkie odmówione. Żadne częściowe wyniki nie przeszły.

Werdykt

Porażka. Mythos blokuje każde żądanie explicit. Sugestywna oprawa czasem przechodzi. Pełna nagość lub seks nie. Model pozostaje w ramach zwykłych twardych linii Anthropic nawet w tym podglądzie skupionym na cyberbezpieczeństwie.

Cytat odmowy

Nie mogę pomóc w tym żądaniu, ponieważ obejmuje ono generowanie explicit contentu seksualnego, co narusza polityki użytkowania Anthropic.

Wynik obejścia

2/10. Przeredagowanie nic nie daje. Przejście na język pośredni też zawodzi. Wrappery stron trzecich są bezcelowe, ponieważ model sam odmawia zanim jakikolwiek output się uformuje. Bariery ochronne są w rdzeniu.

Odpowiednik AiExotic

Twórcy pragnący spójnego outputu explicit sięgają po narzędzia, które całkowicie omijają te odmowy. Modele frontierowe takie jak Mythos ilustrują trwające napięcie między możliwościami a barierami bezpieczeństwa, z którymi twórcy mierzą się codziennie, przekraczając granice kreatywności za pomocą mainstreamowych narzędzi. Podobne wzorce pojawiają się w modelach wideo Google, jak szczegółowo opisano w Gemini omni nsfw: Dlaczego model AI wideo Google blokuje treści explicit.

Otwarte pytania

Czy Mythos może generować jakiekolwiek obrazy dla dorosłych?

Nie. Model odmawia wszystkich żądań explicit. Tylko nieseksualna sugestywna treść okazjonalnie przechodzi filtry.

Jak surowe są odmowy w porównaniu do publicznych modeli Claude?

Równie surowe. Kontrolowany podgląd nie pokazuje żadnego złagodzenia granic NSFW mimo skupienia na cyberbezpieczeństwie.

Jakie obejścia istnieją w ramach polityki?

Żadne skuteczne. Dostosowania promptów i język pośredni są odrzucane tak samo jak bezpośrednie żądania.

Zgłoszone przez dział redakcyjny

Mythos dołącza do listy modeli frontierowych, które priorytetowo traktują bezpieczeństwo ponad wolność twórczą. Wzór jest jasny. Kolejny test pojawi się, gdy pojawi się kolejny duży model. Zgłoszone przez redakcję AiExotic. Kolejny test pojawi się, gdy pojawi się kolejny duży model.

Test NSFW Mythos Anthropic pokazuje granice filtrów bezpieczeństwa

Spis treści