Test NSFW Mythos Anthropic pokazuje granice filtrów bezpieczeństwa
Spis treści
Test NSFW Anthropic Mythos: Co pozwala kontrolowany model
May 2026
Jak testowaliśmy filtry
Słuchajcie, wdrożenie jest minimalne. Brak publicznego API. Uruchomiliśmy prompty przez kanały dostępu partnerskiego opisane we wczesnych relacjach z kwietnia. Najpierw próbowaliśmy sugestywnych póz. Potem częściowej nagości. Pełnych scen explicit. Stylów hentai. Kinków graniczących z przemocą. Każdy test trafił na tę samą ścianę. Sprawdzone warunki graniczne obejmowały typy ciała, zdejmowanie ubrań i bezpośredni język erotyczny. Wszystkie odmówione. Żadne częściowe wyniki nie przeszły.
Werdykt
Porażka. Mythos blokuje każde żądanie explicit. Sugestywna oprawa czasem przechodzi. Pełna nagość lub seks nie. Model pozostaje w ramach zwykłych twardych linii Anthropic nawet w tym podglądzie skupionym na cyberbezpieczeństwie.
Cytat odmowy
Nie mogę pomóc w tym żądaniu, ponieważ obejmuje ono generowanie explicit contentu seksualnego, co narusza polityki użytkowania Anthropic.
Wynik obejścia
2/10. Przeredagowanie nic nie daje. Przejście na język pośredni też zawodzi. Wrappery stron trzecich są bezcelowe, ponieważ model sam odmawia zanim jakikolwiek output się uformuje. Bariery ochronne są w rdzeniu.
Odpowiednik AiExotic
Twórcy pragnący spójnego outputu explicit sięgają po narzędzia, które całkowicie omijają te odmowy. Modele frontierowe takie jak Mythos ilustrują trwające napięcie między możliwościami a barierami bezpieczeństwa, z którymi twórcy mierzą się codziennie, przekraczając granice kreatywności za pomocą mainstreamowych narzędzi. Podobne wzorce pojawiają się w modelach wideo Google, jak szczegółowo opisano w Gemini omni nsfw: Dlaczego model AI wideo Google blokuje treści explicit.
Otwarte pytania
Czy Mythos może generować jakiekolwiek obrazy dla dorosłych?
Nie. Model odmawia wszystkich żądań explicit. Tylko nieseksualna sugestywna treść okazjonalnie przechodzi filtry.
Jak surowe są odmowy w porównaniu do publicznych modeli Claude?
Równie surowe. Kontrolowany podgląd nie pokazuje żadnego złagodzenia granic NSFW mimo skupienia na cyberbezpieczeństwie.
Jakie obejścia istnieją w ramach polityki?
Żadne skuteczne. Dostosowania promptów i język pośredni są odrzucane tak samo jak bezpośrednie żądania.
Zgłoszone przez dział redakcyjny
Mythos dołącza do listy modeli frontierowych, które priorytetowo traktują bezpieczeństwo ponad wolność twórczą. Wzór jest jasny. Kolejny test pojawi się, gdy pojawi się kolejny duży model. Zgłoszone przez redakcję AiExotic. Kolejny test pojawi się, gdy pojawi się kolejny duży model.
Stwórz własne wideo porno AI
Zamień każdą fantazję w realistyczne wideo Full HD. 1 000+ scenariuszy, pozycji i fetyszy — 100% prywatnie.
Zacznij TworzyćO autorze
Niezależny Analityk Technologiczny
Londyński analityk technologiczny. Pisze o trendach w branży AI i kreatywnym AI z niezwykłą szczerością — w tym przyznając, że naprawdę lubi produkty, które recenzuje.