Екипът на Seed в ByteDance пусна най-новия си изследователски пробив, GR-RL, насочен към разширяване на границите на моделите Vision-Language-Action (VLA) в дълготрайна, фина роботизирана манипулация. GR-RL въвежда рамка за обучение за подсилване, която обхваща офлайн филтриране на данни до онлайн фина настройка в реалния свят и е постигнала първо в индустрията: позволява на робот да завие цяла връзка за обувка през цяла обувка в една непрекъсната последователност.

В сравнение с предишния модел за контролирано обучение GR-3, GR-RL повишава степента на успеваемост на задачата за вдяване на връзки от 45,7% на 83,3%, намалявайки неуспехите с почти 70%.

Source link

Like this:

Like Loading…

Нашия източник е Българо-Китайска Търговско-промишлена палaта

By admin