Anthropic Mythos NSFWテストが安全フィルターの限界を暴く
Anthropic Mythos NSFWテスト:制御されたモデルが許可する内容
May 2026
フィルターのテスト方法
ロールアウトはごくわずかで、パブリックAPIはありません。4月上旬の報道で報告されたパートナーアクセスチャネルを通じてプロンプトを実行しました。まず挑発的なポーズを試し、次に部分的なヌード、完全な露骨シーン、Hentaiスタイル、暴力寄りのキンクまで試しました。すべてのテストが同じ壁にぶつかりました。ボディタイプ、衣服の脱ぎ、直接的なエロティック表現などの境界条件をチェックしましたが、すべて拒否されました。部分的な出力すら通りませんでした。
判定
不合格。Mythosはすべての露骨リクエストをブロックします。挑発的な表現は時々通るものの、完全なヌードやセックスは通りません。このサイバーセキュリティ特化のプレビューでも、モデルはAnthropicの通常の厳格なラインを守っています。
拒否引用
I can't assist with that request because it involves generating explicit sexual content, which violates Anthropic's usage policies.
回避スコア
2/10。言い換えは効果なし。間接的な表現に切り替えても失敗します。サードパーティラッパーも無意味です。モデル自体が出力前に拒否するため、ガードレールはコアに組み込まれています。
AiExoticの代替
一貫した露骨出力が必要なクリエイターは、これらの拒否を完全に回避するツールに目を向けています。Mythosのような最先端モデルは、能力と安全ガードレールの間の継続的な緊張関係を示しており、主流ツールで創造的な限界を押し広げようとするクリエイターが日常的に直面する課題です。同様のパターンはGoogleのビデオモデルにも見られ、Gemini omni nsfw: Why Google's AI Video Model Blocks Explicit Contentで詳しく取り上げられています。
未解決の質問
Mythosはアダルト画像を生成できるか?
できません。モデルはすべての露骨リクエストを拒否します。性的でない挑発的なコンテンツのみ、時折フィルターを通過します。
拒否の厳しさは一般公開のClaudeモデルと比べてどうか?
同等に厳格です。制御されたプレビューでは、サイバーセキュリティ特化にもかかわらずNSFW境界に緩和は見られません。
ポリシー内で有効な回避策はあるか?
有効なものはありません。プロンプトの微調整や間接表現も直接リクエストと同じように拒否されます。
編集部より
Mythosは、安全性を創造的自由より優先する最先端モデルのリストに加わりました。このパターンは明確です。次のビッグモデルが登場したら、次のテストをお届けします。AiExotic編集部より。次のビッグモデルが登場したら、次のテストをお届けします。
自分だけのAIポルノ動画を作成
どんな妄想もリアルなフルHD動画に。1,000以上のシナリオ、体位、フェチ — 完全プライベート。
今すぐ作成開始著者について
独立系テックアナリスト
ロンドン在住のテックアナリスト。AI業界トレンドとクリエイティブAIを異例の正直さでカバー — レビューする製品を本当は楽しんでると白状するのもその一環。