Alex Rivera
AI技術ジャーナリスト
アレックス・リベラは2022年からAI生成技術を追いかけている——Stable Diffusionが最初に登場した頃で、みんな急にdiffusion modelsについて意見を言い出した時代だ。コンピュータサイエンスのバックグラウンドを持ち、5年間の現場取材経験を持つ彼は、プレスリリースをそのまま引用するんじゃなく、自分でベンチマークを走らせるタイプのジャーナリストだ。
ビデオ生成、深層学習アーキテクチャ、そしてスタートアップ間のAI競争に特化し、鋭い筆致で書く。最初の編集職をクビになったのは、過大評価されたモデルを「見事にマーケティングされた失望作」と記事で呼んだからだ。後悔なし。最新モデルをテストしていない時は、RedditでGPUアーキテクチャについて議論しているはず。
の記事 Alex Rivera
Topaz AI アップスケーリングモデル:次世代ビデオ革命
Topaz Labsが新AIアップスケーリングモデルをリリース。独立系クリエイターが標準PCでシネマ品質の画像・ビデオアップグレードを実現し、費用を削減して効率を向上。
Baidu Ernie-Image: オープンソース 8B DiT テキスト-to-イメージ生成 ライブ
Baidu が Ernie-Image をリリース。テキスト-to-イメージ生成のためのオープンソース 8B パラメータ DiT モデルです。クローズドモデルに匹敵する高忠実度の結果を提供し、世界中のクリエイターに完全カスタマイズを可能にします。
Luxxxe Studios、Dio Ferreroとスタジオ独占契約を締結
Luxxxe Studios が新星 Dio Ferrero を重要なスタジオ独占契約で確保。アダルト業界のプレミアムゲイコンテンツ支配に向けたタレント獲得の好例。
Google Omni Video AI リーク:Gemini にマルチモーダルモデルが登場
Google Omni ビデオ AI モデルがリークされ、Gemini の主要なマルチモーダル進歩を示唆。画像-ビデオツールの統合を約束し、Veo 3.1 を凌駕する可能性があり、クリエイターに優れた生成能力を提供します。
RedditでRunway Gen-4のNSFWフィルターと制限を議論
Runway Gen-4が画期的な物理とオーディオで登場するも、RedditユーザーがNSFW制限をテスト・議論。クリエイター向けの回避策と代替案を共有中。
Leonardo AI Happy Horse 1.0:トップビデオAI統合がライブ開始
Leonardo AIがHappy Horse 1.0を統合、先進テキスト-to-ビデオモデルでビデオ、対話、オーディオ作成を効率化。プラットフォームはSFWコンテンツに優れ、強固なNSFWセーフガードを搭載。
Novi AI Video Agent が5分ナラティブ動画を実現
Novi AIのロングビデオエージェントが最大5分ナラティブ動画のためのシームレスワークフローを提供。断片ツールなしでプロ級AIストーリーテリングをクリエイターに届けます。
Grok 4.3 ローンチ:クリエイターのための xAI のエージェント機能強化
xAI の Grok 4.3 ローンチが加速推論、拡張コンテキスト、低コスト、画像・動画コンテンツ作成のためのエージェント的生成パイプライン向け Imagine Agent を提供。
Pika MCP NSFW の制限:Claude AI ビデオパワーを徹底解説
Pika Labs が MCP を発表、ビデオ生成に Claude AI を直接搭載し26のスキルとエージェントを提供。Pika MCP NSFW 検索急増の中で、コンテンツ保護を回避できるかを検証。
Pika MCP 正式ローンチ:Claude がエキスパートビデオスキルを解禁
Pika Labs が MCP をローンチ。Claude をポッドキャスト、解説動画、UGC 広告スキル搭載のパーソナライズドビデオエージェントに統合。マルチモーダルツールは SFW クリエイターに最適だが、厳格な NSFW ポリシーが代替策を後押し。
AI for Main Street Act が助成金とトレーニングでクリエイターを強化
AI for Main Street Act は、AIクリエイター向けに助成金、トレーニング、簡素化されたガイドラインを提供し、規制対応とワークフローの自信を可能にしつつ、イノベーションを推進します。
NVIDIA NIM が Qwen-Image API を統合:20B テキスト-to-イメージのパワー
NVIDIA が Alibaba の Qwen-Image API を NIM プラットフォームに追加、開発者やクリエイター向けに企業級パフォーマンスの 20B テキスト-to-イメージ機能を提供、卓越したテキスト忠実度を実現。