Стартапи за AI чипове за инференс събират $8B, за да се конкурират с Nvidia
Съдържание
Стартапи за AI чипове осигуряват рекордни $8.3 милиарда, за да предизвикат Nvidia
Чиповете за AI инференс внезапно са най-горещият билет в града. Стартапи, които създават специализирано хардуер за изпълнение на AI модели, са привлекли шокиращи $8.3 милиарда само тази година, според CNBC. Това не са дребни пари — това е ясен сигнал, че индустрията рязко се обръща към инференс, фазата, в която тренираните модели действително произвеждат изходи като изображения или видеа. Честно? Следя тази област от години и този прилив на финансиране се чувства различно. Тренирането на масивни модели грабва заглавията, но инференсът сега доминира работните товари. Помислете: всеки път, когато генерирате видеоклип или коригирате изображение, това е инференс, който поглъща изчислителна мощност. Тези нови чипове обещават да го направят по-евтино и по-бързо. Да, знам как звучи — като хайп. Но числата го подкрепят.
Запознайте се със стартапите, които подхранват революцията в инференса
Cerebras води глутницата с охладна инфузия от $1 милиард, насочвайки своите wafer-scale двигатели, проектирани за масивен паралелизъм в AI задачи. MatX и Ayar Labs всяка са хванали по $500 милиона; първата се цели в високопроизводителни платформи за инференс, докато втората залага на оптически връзки, за да намали задръстванията в трансфера на данни. Axelera е прекосила $200 милиона, фокусирайки се върху ускорители за edge AI, които пият ток, вместо да го поглъщат. Euclyd се подготвя за над $100 милиона, а Fractile завършва големите имена с нови капитали за персонализиран силициев чип за инференс. Това не са маргинални играчи. Те създават архитектури, съобразени с пост-тренировъчния свят, където ефективността побеждава суровата мощ. Ще бъда честен с вас: GPU-тата на Nvidia все още управляват кокошката. Но докато разходите за инференс набъбват — сега надминават тренирането — тези новопостъпили могат да отхапят реален пазарен дял.
Реално въздействие върху създателите на AI видеа и изображения
За независимите създатели този преход не може да дойде достатъчно скоро. Рендиране на един високорезолюционен AI видео сегмент днес? Ударя те силно в портфейла — мисли за минути GPU време на клип, масштабиращо се до часове за нещо амбициозно. Специализираните чипове за AI инференс обръщат сценария, обещавайки по-бърз обрат и сметки, които не парят. По-ниските изисквания за изчисления означават, че можеш да веригаш сцени в пълни минути съдържание без да наемаш дата център. Моят напълно не-научен пробен вземка от един — аз, който нощувам в експерименти — предполага, че дори умерени печалби в ефективността трансформират работните процеси. Ето какво повечето анализатори няма да ви кажат: по-скоро ми харесва да тласкам тези инструменти до границите им. По причини, които оставям на вашето въображение. Напредъци като тези вече намаляват разходите в тежки области като генериране на нецензурирани NSFW изображения, където мултимодалните модели поглъщат ресурси. Но има ли значение? За създателите, абсолютно да — това демократизира професионални нива на изход.
Често задавани въпроси за AI чипове за инференс — Какво трябва да знаят създателите
Каква е разликата между AI инференс и трениране?
Тренирането създава модела от нулата, поглъщайки огромна предварителна изчислителна мощност. Инференсът изпълнява този модел, за да създава изходи — като видеа или изображения — многократно. Сега това е по-големият работен товар и тъкмо там новите чипове блестят.
Как AI чиповете за инференс ще намалят разходите за създателите на AI видеа?
Чрез оптимизация за повторяеми изпълнения, те намаляват енергията и времето на генерация. Очаквайте cloud сметките да паднат, тъй като работните товари за инференс — ключови за веригане на видеа — стават далеч по-евтини от GPU алтернативите.
Кога тези ефективни AI чипове ще засегнат генеративните инструменти?
Прототипите се доставят сега; широко разпространение в потребителски платформи може да удари 2027-2028 г., според ранните пътеводители. Създателите може да видят ускорения по-рано чрез cloud доставчици.
Кои стартапи за AI чипове с финансиране през 2026 г. си струва да следим?
Cerebras за мащаб, MatX и Ayar Labs за скорост, Axelera за edge употреба, плюс Euclyd и Fractile. Всички се целят в короната на Nvidia за инференс.
Може ли хардуерът за инференс на конкурентите на Nvidia да подобри евтината изчислителна мощност за AI създатели?
Абсолютно. Персонализираните дизайни означават по-добра производителност на ват, което директно се превръща в достъпни по-дълги клипове и по-високи обеми за независими продуценти на видеа.
Създайте свое AI порно видео
Превърнете всяка фантазия в реалистично Full HD видео. 1,000+ сценария, пози и фетиши — 100% поверително.
Започнете СегаЗа автора
Независим технологичен анализатор
Технологичен анализатор, базиран в Лондон. Анализира тенденции в AI индустрията и креативен AI с необичайна честност — включително признанието, че наистина му харесват продуктите, които преглежда.