

HiDream AI представи HiDream-O1-Image-Pro, роден унифициран мултимодален модел, изграден върху архитектурата Unified Transformer (UiT), заедно с обявяването на нов кръг на финансиране на ниво милиард на първото по рода си събитие на компанията Open Day на 19 май.
Моделът, който надхвърля 200 милиарда параметъра, е проектиран от самото начало, за да се справи с разбирането на изображенията, разбирането на видеото, генерирането на изображения, генерирането на видео и редактирането между модове в рамките на единна унифицирана система – отклонение от общия подход за свързване на отделни “разбиране” и “поколение” модули.
За разлика от традиционните мултимодални модели, които разделят разбирането и генерирането в отделни конвейери, HiDream-O1 интегрира всички възможности от началния етап на обучение. Този подход, казва компанията, позволява на модела едновременно да обработва задачи от текст към изображение, изображение към текст и изображение към видео в унифицирана рамка.
HiDream AI позиционира модела като част от по-широк “модел + интелигентност” стратегия с двоен водач, формираща a “1+1+3” бизнес архитектура, която обхваща три основни технологични направления.
Денят на отворените врати на компанията отбеляза първата й публична витрина от нейното основаване, сигнализирайки за амбиция да увеличи присъствието си в конкурентния генеративен AI пейзаж заедно с утвърдени играчи, включително Zhipu AI и ByteDance.
Допълнителни подробности за размера на финансирането и инвеститорите не бяха оповестени на събитието.
Source link
Like this:
Like Loading…
Нашия източник е Българо-Китайска Търговско-промишлена палaта