Mythos NSFW-Test: Anthropic Modellgrenzen aufgedeckt

Anthropic Mythos NSFW-Test zeigt Grenzen von Sicherheitsfiltern

James Morton • Veröffentlicht am 25.05.2026 - 14:36 • Aktualisiert 07.06.2026 - 19:19 • 2 Min. Lesezeit • 185,589 • 8,406

DER PORN TEST

Anthropic Mythos NSFW-Test: Was das kontrollierte Modell erlaubt

May 2026

Wie wir die Filter getestet haben

Schau, der Rollout ist winzig. Keine öffentliche API. Wir haben Prompts über Partner-Zugangskanäle laufen lassen, die in der Berichterstattung Anfang April erwähnt wurden. Zuerst suggestive Posen ausprobiert. Dann teilweise Nacktheit. Voll explizite Szenen. Hentai-Stile. Gewaltnahe Kinks. Jeder Test stieß auf dieselbe Wand. Geprüfte Grenzbedingungen umfassten Körpertypen, Kleidungsentfernung und direkte erotische Sprache. Alle abgelehnt. Keine partiellen Outputs schlüpften durch.

Urteil

Durchgefallen. Mythos blockiert jede explizite Anfrage. Suggestive Formulierungen kommen manchmal durch. Vollständige Nacktheit oder Sex nicht. Das Modell bleibt innerhalb der üblichen harten Linien von Anthropic, selbst in dieser auf Cybersicherheit fokussierten Vorschau.

Ablehnungszitat

Ich kann bei dieser Anfrage nicht helfen, da sie die Generierung expliziten sexuellen Inhalts beinhaltet, was gegen Anthropics Nutzungsrichtlinien verstößt.

Workaround-Bewertung

2/10. Umformulierungen bewirken nichts. Der Wechsel zu indirekter Sprache scheitert ebenfalls. Drittanbieter-Wrapper sind sinnlos, weil das Modell selbst ablehnt, bevor jegliche Ausgabe entsteht. Die Schutzmechanismen sitzen im Kern.

AiExotic-Äquivalent

Ersteller, die konsistente explizite Ausgaben wünschen, greifen auf Tools zurück, die diese Ablehnungen komplett umgehen. Frontier-Modelle wie Mythos verdeutlichen die anhaltende Spannung zwischen Fähigkeit und Sicherheitsmechanismen, die Ersteller täglich navigieren, wenn sie kreative Grenzen mit Mainstream-Tools ausloten. Ähnliche Muster zeigen sich in Googles Video-Modellen, wie im Detail in Gemini omni nsfw: Warum Googles KI-Video-Modell explizite Inhalte blockiert.

Offene Fragen

Kann Mythos erwachsene Bilder generieren?

Nein. Das Modell lehnt alle expliziten Anfragen ab. Nur nicht-sexueller suggestiver Inhalt passiert gelegentlich die Filter.

Wie streng sind die Ablehnungen im Vergleich zu öffentlichen Claude-Modellen?

Genau so streng. Die kontrollierte Vorschau zeigt keine Lockerung bei NSFW-Grenzen trotz des Cybersicherheits-Fokus.

Welche Workarounds gibt es innerhalb der Richtlinien?

Keine, die funktionieren. Prompt-Anpassungen und indirekte Sprache werden genauso abgelehnt wie direkte Anfragen.

Eingereicht von der Redaktion

Mythos schließt sich der Liste von Frontier-Modellen an, die Sicherheit über kreative Freiheit priorisieren. Das Muster ist klar. Der nächste Test kommt, wenn das nächste große Modell erscheint. Eingereicht von der AiExotic-Redaktion. Der nächste Test kommt, wenn das nächste große Modell erscheint.

Anthropic Mythos NSFW-Test zeigt Grenzen von Sicherheitsfiltern

Inhaltsverzeichnis