Gyártósor Segítséget kérni tanulnak a robotok

Segítséget kérni tanulnak a robotok

autopro.hu/Sz.K. | 2023.12.10 12:17

Segítséget kérni tanulnak a robotok

Fotó: FANUC

A Princeton Egyetem és a Google mérnökei olyan innovatív módszert fejlesztettek ki, amely a robotokat egy kulcsfontosságú készségre tanítja: felismerik, mikor van szükségük segítségre, és hogyan kérjenek segítséget. Ez a fejlesztés jelentős előrelépést jelent a robotikában, áthidalva az autonóm működés és az ember-robot interakció közötti szakadékot.

Hirdetés

Az intelligensebb és önállóbb robotok felé vezető utat mindig is akadályozta egy jelentős kihívás: az emberi nyelv összetettsége és többértelműsége. A számítógépes kódok bináris egyértelműségével ellentétben az emberi nyelv tele van árnyalatokkal és finomságokkal, ami a robotok számára labirintussá teszi. Például egy olyan egyszerű parancs, mint a „vedd fel a tálat” összetett feladattá válhat, ha több tál van jelen. A környezetük érzékelésére és a nyelvre való reagálásra felszerelt robotok gyakran válaszút elé kerülnek, amikor ilyen nyelvi bizonytalanságokkal szembesülnek.

A bizonytalanság számszerűsítése

A Princeton és a Google csapata e kihívás megoldására egy olyan új megközelítést vezetett be, amely számszerűsíti az emberi nyelv „homályosságát”. Ez a technika lényegében a nyelvi parancsok határozatlansági szintjét méri, és ezt a mérőszámot használja fel a robotok cselekvéseinek irányítására.

Azokban a helyzetekben, amikor egy parancs többféle értelmezést is eredményezhet, a robot most már képes felmérni a pontatlanság szintjét, és eldönteni, hogy mikor kérjen további felvilágosítást. Például egy olyan környezetben, ahol több tál van, a nagyobb bizonytalansági fok arra késztetné a robotot, hogy megkérdezze, melyik tálat vegye fel, elkerülve ezzel a lehetséges hibákat vagy a nem hatékony munkavégzést.

Ez a megközelítés nemcsak a nyelv jobb megértését teszi lehetővé a robotok számára, hanem a feladatvégzés biztonságát és hatékonyságát is növeli. A ChatGPT mögött álló nagyméretű nyelvi modellek (LLM) integrálásával a kutatók jelentős lépést tettek a robotok tevékenységének az emberi elvárásokhoz és igényekhez való szorosabb igazítása felé.

A nagy nyelvi modellek szerepe

Az LLM-ek integrációja központi szerepet játszik ebben az új megközelítésben. Az LLM-ek meghatározóak az emberi nyelv feldolgozásában és értelmezésében. Ebben az összefüggésben a robotoknak adott nyelvi parancsokban rejlő bizonytalanság értékelésére és mérésére szolgálnak.

Az LLM-ekre való támaszkodás azonban nem mentes a kihívásoktól. Amint arra a kutatócsoport rámutatott, az LLM-ek kimenetei néha megbízhatatlanok lehetnek. Anirudha Majumdar, a Princeton adjunktusa hangsúlyozza ennek az egyensúlynak a fontosságát: „Az LLM által generált tervek vakon követése arra késztetheti a robotokat, hogy nem biztonságos vagy megbízhatatlan módon cselekedjenek, ezért az LLM-alapú robotjainknak tudniuk kell, hogy mikor nem tudják.”

Ez rávilágít az árnyalt megközelítés szükségességére, ahol az LLM-eket inkább útmutatóként, mintsem tévedhetetlen döntéshozóként használjuk.

Gyakorlati alkalmazás és tesztelés

A módszer gyakorlati alkalmazhatóságát különböző forgatókönyvekben tesztelték, ami sokoldalúságát és hatékonyságát mutatja. Az egyik ilyen teszt egy robotkarral történt, amelynek feladata a játékélelmiszerek különböző kategóriákba történő szétválogatása volt. Ez az egyszerű beállítás bizonyította, hogy a robot képes hatékonyan navigálni az egyértelmű választási lehetőségeket tartalmazó feladatokban.

A komplexitás jelentősen megnőtt egy másik kísérletben, amely egy irodai konyhában egy kerekes platformra szerelt robotkart mutatott be. Itt a robotnak olyan valós kihívásokkal kellett szembenéznie, mint például a mikrohullámú sütőbe helyezendő tárgyak azonosítása, amikor többféle lehetőség kínálkozott.

Ezeken a teszteken keresztül a robotok sikeresen bizonyították, hogy képesek a számszerűsített bizonytalanságot felhasználni a döntések meghozatalához vagy a tisztázás kereséséhez, ezzel igazolva a módszer gyakorlati hasznosságát.

Jövőbeli következmények és kutatások

A jövőre nézve e kutatás hatásai messze túlmutatnak a jelenlegi alkalmazásokon. A Majumdar és Allen Ren végzős hallgató által vezetett csapat azt vizsgálja, hogy ez a megközelítés hogyan alkalmazható a robotok érzékelésének és a mesterséges intelligenciának összetettebb problémáira. Ide tartoznak azok a forgatókönyvek, amelyekben a robotoknak kombinálniuk kell a látás és a nyelvi információkat a döntések meghozatalához, tovább csökkentve a robotok megértése és az emberi interakció közötti szakadékot.

A folyamatban lévő kutatás célja, hogy a robotok ne csak a feladatok nagyobb pontosságú elvégzésére legyenek képesek, hanem az emberi megismeréshez hasonló megértéssel navigáljanak a világban. Ez a kutatás kikövezheti az utat olyan robotok számára, amelyek nemcsak hatékonyabbak és biztonságosabbak, hanem jobban alkalmazkodnak az emberi körülményekhez is – írja a Unite.ai.

Érdekesnek találta ezt a hírt? Ne maradjon le a legfontosabb járműipari történésekről, iratkozzon fel hírlevelünkre ezen a linken!

Kiemelt Partnereink