

Екипът на Seed в ByteDance пусна най-новия си изследователски пробив, GR-RL, насочен към разширяване на границите на моделите Vision-Language-Action (VLA) в дълготрайна, фина роботизирана манипулация. GR-RL въвежда рамка за обучение за подсилване, която обхваща офлайн филтриране на данни до онлайн фина настройка в реалния свят и е постигнала първо в индустрията: позволява на робот да завие цяла връзка за обувка през цяла обувка в една непрекъсната последователност.
В сравнение с предишния модел за контролирано обучение GR-3, GR-RL повишава степента на успеваемост на задачата за вдяване на връзки от 45,7% на 83,3%, намалявайки неуспехите с почти 70%.
Source link
Like this:
Like Loading…
Нашия източник е Българо-Китайска Търговско-промишлена палaта