Anthropic Mythos NSFW-Test zeigt Grenzen von Sicherheitsfiltern
Inhaltsverzeichnis
Anthropic Mythos NSFW-Test: Was das kontrollierte Modell erlaubt
May 2026
Wie wir die Filter getestet haben
Schau, der Rollout ist winzig. Keine öffentliche API. Wir haben Prompts über Partner-Zugangskanäle laufen lassen, die in der Berichterstattung Anfang April erwähnt wurden. Zuerst suggestive Posen ausprobiert. Dann teilweise Nacktheit. Voll explizite Szenen. Hentai-Stile. Gewaltnahe Kinks. Jeder Test stieß auf dieselbe Wand. Geprüfte Grenzbedingungen umfassten Körpertypen, Kleidungsentfernung und direkte erotische Sprache. Alle abgelehnt. Keine partiellen Outputs schlüpften durch.
Urteil
Durchgefallen. Mythos blockiert jede explizite Anfrage. Suggestive Formulierungen kommen manchmal durch. Vollständige Nacktheit oder Sex nicht. Das Modell bleibt innerhalb der üblichen harten Linien von Anthropic, selbst in dieser auf Cybersicherheit fokussierten Vorschau.
Ablehnungszitat
Ich kann bei dieser Anfrage nicht helfen, da sie die Generierung expliziten sexuellen Inhalts beinhaltet, was gegen Anthropics Nutzungsrichtlinien verstößt.
Workaround-Bewertung
2/10. Umformulierungen bewirken nichts. Der Wechsel zu indirekter Sprache scheitert ebenfalls. Drittanbieter-Wrapper sind sinnlos, weil das Modell selbst ablehnt, bevor jegliche Ausgabe entsteht. Die Schutzmechanismen sitzen im Kern.
AiExotic-Äquivalent
Ersteller, die konsistente explizite Ausgaben wünschen, greifen auf Tools zurück, die diese Ablehnungen komplett umgehen. Frontier-Modelle wie Mythos verdeutlichen die anhaltende Spannung zwischen Fähigkeit und Sicherheitsmechanismen, die Ersteller täglich navigieren, wenn sie kreative Grenzen mit Mainstream-Tools ausloten. Ähnliche Muster zeigen sich in Googles Video-Modellen, wie im Detail in Gemini omni nsfw: Warum Googles KI-Video-Modell explizite Inhalte blockiert.
Offene Fragen
Kann Mythos erwachsene Bilder generieren?
Nein. Das Modell lehnt alle expliziten Anfragen ab. Nur nicht-sexueller suggestiver Inhalt passiert gelegentlich die Filter.
Wie streng sind die Ablehnungen im Vergleich zu öffentlichen Claude-Modellen?
Genau so streng. Die kontrollierte Vorschau zeigt keine Lockerung bei NSFW-Grenzen trotz des Cybersicherheits-Fokus.
Welche Workarounds gibt es innerhalb der Richtlinien?
Keine, die funktionieren. Prompt-Anpassungen und indirekte Sprache werden genauso abgelehnt wie direkte Anfragen.
Eingereicht von der Redaktion
Mythos schließt sich der Liste von Frontier-Modellen an, die Sicherheit über kreative Freiheit priorisieren. Das Muster ist klar. Der nächste Test kommt, wenn das nächste große Modell erscheint. Eingereicht von der AiExotic-Redaktion. Der nächste Test kommt, wenn das nächste große Modell erscheint.
Erstelle dein eigenes KI-Pornovideo
Verwandle jede Fantasie in ein realistisches Full-HD-Video. 1.000+ Szenarien, Stellungen & Fetische — 100% privat.
Jetzt StartenÜber den Autor
Unabhängiger Tech-Analyst
London-basierter Tech-Analyst. Berichtet über KI-Branchentrends und kreative KI mit ungewöhnlicher Ehrlichkeit – inklusive des Eingeständnisses, dass er die Produkte, die er rezensiert, tatsächlich mag.