Álláshirdetések
Events / Courses
Legfrissebb híreink
A Honda megduplázza e-mobilitási beruházásait
2024.05.17 15:20Megbízható Munkaadó címet kapott az Audi Hungaria
2024.05.17 13:23Világszínvonalú robotsebészet a Debreceni Egyetemen
2024.05.17 12:17A Peugeot nyolc év garanciát vezet be az elektromos autókra
2024.05.17 10:21Autopro Blog
Autopro a Facebookon
Galériáink
Segítséget kérni tanulnak a robotok
A Princeton Egyetem és a Google mérnökei olyan innovatív módszert fejlesztettek ki, amely a robotokat egy kulcsfontosságú készségre tanítja: felismerik, mikor van szükségük segítségre, és hogyan kérjenek segítséget. Ez a fejlesztés jelentős előrelépést jelent a robotikában, áthidalva az autonóm működés és az ember-robot interakció közötti szakadékot.
Az intelligensebb és önállóbb robotok felé vezető utat mindig is akadályozta egy jelentős kihívás: az emberi nyelv összetettsége és többértelműsége. A számítógépes kódok bináris egyértelműségével ellentétben az emberi nyelv tele van árnyalatokkal és finomságokkal, ami a robotok számára labirintussá teszi. Például egy olyan egyszerű parancs, mint a „vedd fel a tálat” összetett feladattá válhat, ha több tál van jelen. A környezetük érzékelésére és a nyelvre való reagálásra felszerelt robotok gyakran válaszút elé kerülnek, amikor ilyen nyelvi bizonytalanságokkal szembesülnek.
A bizonytalanság számszerűsítése
A Princeton és a Google csapata e kihívás megoldására egy olyan új megközelítést vezetett be, amely számszerűsíti az emberi nyelv „homályosságát”. Ez a technika lényegében a nyelvi parancsok határozatlansági szintjét méri, és ezt a mérőszámot használja fel a robotok cselekvéseinek irányítására.
Azokban a helyzetekben, amikor egy parancs többféle értelmezést is eredményezhet, a robot most már képes felmérni a pontatlanság szintjét, és eldönteni, hogy mikor kérjen további felvilágosítást. Például egy olyan környezetben, ahol több tál van, a nagyobb bizonytalansági fok arra késztetné a robotot, hogy megkérdezze, melyik tálat vegye fel, elkerülve ezzel a lehetséges hibákat vagy a nem hatékony munkavégzést.
Ez a megközelítés nemcsak a nyelv jobb megértését teszi lehetővé a robotok számára, hanem a feladatvégzés biztonságát és hatékonyságát is növeli. A ChatGPT mögött álló nagyméretű nyelvi modellek (LLM) integrálásával a kutatók jelentős lépést tettek a robotok tevékenységének az emberi elvárásokhoz és igényekhez való szorosabb igazítása felé.
A nagy nyelvi modellek szerepe
Az LLM-ek integrációja központi szerepet játszik ebben az új megközelítésben. Az LLM-ek meghatározóak az emberi nyelv feldolgozásában és értelmezésében. Ebben az összefüggésben a robotoknak adott nyelvi parancsokban rejlő bizonytalanság értékelésére és mérésére szolgálnak.
Az LLM-ekre való támaszkodás azonban nem mentes a kihívásoktól. Amint arra a kutatócsoport rámutatott, az LLM-ek kimenetei néha megbízhatatlanok lehetnek. Anirudha Majumdar, a Princeton adjunktusa hangsúlyozza ennek az egyensúlynak a fontosságát: „Az LLM által generált tervek vakon követése arra késztetheti a robotokat, hogy nem biztonságos vagy megbízhatatlan módon cselekedjenek, ezért az LLM-alapú robotjainknak tudniuk kell, hogy mikor nem tudják.”
Ez rávilágít az árnyalt megközelítés szükségességére, ahol az LLM-eket inkább útmutatóként, mintsem tévedhetetlen döntéshozóként használjuk.
Gyakorlati alkalmazás és tesztelés
A módszer gyakorlati alkalmazhatóságát különböző forgatókönyvekben tesztelték, ami sokoldalúságát és hatékonyságát mutatja. Az egyik ilyen teszt egy robotkarral történt, amelynek feladata a játékélelmiszerek különböző kategóriákba történő szétválogatása volt. Ez az egyszerű beállítás bizonyította, hogy a robot képes hatékonyan navigálni az egyértelmű választási lehetőségeket tartalmazó feladatokban.
A komplexitás jelentősen megnőtt egy másik kísérletben, amely egy irodai konyhában egy kerekes platformra szerelt robotkart mutatott be. Itt a robotnak olyan valós kihívásokkal kellett szembenéznie, mint például a mikrohullámú sütőbe helyezendő tárgyak azonosítása, amikor többféle lehetőség kínálkozott.
Ezeken a teszteken keresztül a robotok sikeresen bizonyították, hogy képesek a számszerűsített bizonytalanságot felhasználni a döntések meghozatalához vagy a tisztázás kereséséhez, ezzel igazolva a módszer gyakorlati hasznosságát.
Jövőbeli következmények és kutatások
A jövőre nézve e kutatás hatásai messze túlmutatnak a jelenlegi alkalmazásokon. A Majumdar és Allen Ren végzős hallgató által vezetett csapat azt vizsgálja, hogy ez a megközelítés hogyan alkalmazható a robotok érzékelésének és a mesterséges intelligenciának összetettebb problémáira. Ide tartoznak azok a forgatókönyvek, amelyekben a robotoknak kombinálniuk kell a látás és a nyelvi információkat a döntések meghozatalához, tovább csökkentve a robotok megértése és az emberi interakció közötti szakadékot.
A folyamatban lévő kutatás célja, hogy a robotok ne csak a feladatok nagyobb pontosságú elvégzésére legyenek képesek, hanem az emberi megismeréshez hasonló megértéssel navigáljanak a világban. Ez a kutatás kikövezheti az utat olyan robotok számára, amelyek nemcsak hatékonyabbak és biztonságosabbak, hanem jobban alkalmazkodnak az emberi körülményekhez is – írja a Unite.ai.
Érdekesnek találta ezt a hírt? Ne maradjon le a legfontosabb járműipari történésekről, iratkozzon fel hírlevelünkre ezen a linken!