Trend Magyar kutatók dolgoznak a balesetmentes közlekedés eléréséért

Magyar kutatók dolgoznak a balesetmentes közlekedés eléréséért

Kuthi Áron | 2019.04.26 12:49

Magyar kutatók dolgoznak a balesetmentes közlekedés eléréséért

Februárban kötött együttműködési megállapodást a BME és a Continental, a cél az önvezető technológia fejlesztése. Az egyetemi tudás és a gyakorlati megvalósítás a Professional Intelligence for Automotive nevű együttműködésben jó helyen van, a mélytanulási (deep learning) módszereket minden eddiginél behatóbban lehet vizsgálni ezentúl. Gyires-Tóth Bálint egyetemi adjunktust (balra) és Moni Róbert PhD-hallgatót (jobbra) kérdeztük a BME és a globális autóipari beszállító között megkezdett munkáról.

Hirdetés

– Milyen kutatásokban jelenik meg a Continental és a BME együttműködése?
GYTB: A Professional Intelligence for Automotive (PIA) névre keresztelt együttműködésben a BME Villamosmérnöki és Informatikai Kara vesz részt, ezen belül is a Távközlési és Médainformatikai (TMIT) és az Irányítástechnika és Informatika Tanszék (IIT). A TMIT-n belül működik a SmartLab, amely többek között a deep learning alap- és alkalmazott kutatásával foglalkozik. Az én elsődleges kutatási területem a szekvenciális adatok, idősorok modellezése.

– A SmartLab milyen kapcsolatban áll a mély tanuláshoz szükséges hardverek gyártójával, az Nvidia-val?
GYTB: Az NVidia Deep Learning Institute minősített oktatója és hazai egyetemi nagykövete vagyok. Ennek keretében kollégáim segítségével évente legalább két egésznapos workshopot tartunk mélytanulás témakörben. Ezen túl az NVidia szakmai oldalról is segíti munkánkat.

– Mikor jött létre a Continental és a BME közötti együttműködés?
GYTB: Idén februárban. Róbert már az együttműködésen belül kezdte meg PhD-tanulmányait. Az együttműködés kutatásról, hallgatói mentorálásról szól. Itt önvezetéssel kapcsolatos kutatásokba nyújtunk bepillantási lehetőséget a terület iránt érdeklődő diákoknak. Tehát itt Continál dolgozó, vagy még csak gyakornokként jelen lévő, de akár egyetemi hallgató is szóba jöhet.

– Róbert PhD-hallgatóként vesz rész a SmartLab munkájában. Mi a témája?
MR: A mély megerősítésen alapuló tanítás (deep reinforcement learning). Itt már nem adatbázisokon alapuló gépi tanulásról, hanem úgynevezett ágensek, valójában szimuláció algoritmusok segítségével működő tanulásról van szó. Azt, hogy hogyan teljesít egy önvezető szoftver, már az MIT egyetem által épített úgynevezett Duckietown önvezető minikörnyezetben is ki lehet próbálni. Ezt a robotika és mesterséges intelligencia kutatását és bemutatását segítő megoldást a PIA-projekt keretében szerezte be a Continental és a BME.

GYTB: Tehát azokat az algoritmusokat, amelyeket például Róbert leír, ezzel a terepasztallal, és a hozzá tartozó szimulációs környezettel a gyakorlatban is ki lehet próbálni, és nem kell hozzá drága autókat összetörni.

– Csomagolási hibák azonosításától kezdve áramkörök forrasztásának minőségellenőrzésén keresztül karbantartás-tervezésig, gyártásoptimalizálásig rengeteg mindenhez fel lehet használni a mélytanulás, a neurális hálók és a gépi látás tudását. Mit tud a neurális háló?
MR:
A neurális hálók sajátossága, hogy adatigényesek. Több ezer, sőt millió példára van szükség a tanítás során, hogy az algoritmus egy adott problémának minden lehetséges variációját megtanulja. Az így tanított háló nagy precizitással képes megválaszolni a rá bízott feladatot. A Continental világszerte számos műszergyárában bevezette a smart factory koncepciót, amely által mesterséges intelligencia alapú hibakeresést is alkalmaznak.

GYTB: Ugyanakkor nem könnyű elindulni az adatbázisépítéssel, ha a meglévő adatok nem konzisztensek. Előfordul, hogy a cégnél már van képi adatbázis, mondjuk archiválási célból, de ez korlátos, nem rendszerezett, ezért lényegében használhatatlan gépi tanuláshoz. Ezért két út áll előttünk. Vagy nulláról indulva építünk képi adatbázist, és ekkor jó esetben három-négy hónap alatt épül fel olyan mennyiségű adat, ami egy prototípushoz használható lehet. De ha nem akarunk négy hónapig várni, és van mélytanulási kompetencia az adott cégnél, irányítottan lehet mintákat adni a rendszernek, vagyis például direkt elrontott alkatrészt, csomagolást. Vagyis szimulálni kell a hibákat. Viszont első körben érdemes arra törekedni, hogy a korábban elért hatékonyságot tudja hozni a mélytanulási rendszer is – immár adatvezérelt módon. Innen lehet tovább lépni a tökéletesebb gyártás felé. Fontos tisztázni, hogy nem minden esetben kell bevetni a neurális háló tudását. Jellemzően kisebb adatbázisok esetében célszerű más módszerek kipróbálása.

– Sok tudományos publikáció jelenik meg a világon gépi látás témájában. Az ezekben foglalt újdonságokat nemcsak követnie kell, hanem esetleges alkalmazásra kell előkészítenie az önvezetést fejlesztő vállalatoknak. Mi zajlik ma a gépi látás kutatásában?
MR:
Az objektum azonosítás és objektum osztályozás ilyen területek, vagyis megtalálni és felismerni a tárgyakat. De ez valójában a fejlesztők versenye. A Karlsruhei Műszaki Egyetem KITTI adatbázisába például minden fejlesztő feltöltheti saját algoritmusát, és ezeket lehet futtatni képi adatbázisokon. Tehát olyan esetekben, amikor egy kutatócsoport publikál egy szuper megoldást, amelytől nagy precizitás várható, a Continental mesterséges intelligencia mérnökei is áttanulmányozzák azt és amennyiben a megoldás jobbnak bizonyul elődeinél, a gyakorlatban is elkezdődhet a használható megoldás fejlesztése. Végső soron az a cél, hogy az autóba kerülő chipen kell futnia annak az algoritmusnak, amely az objektum detektálását és osztályozását nagy megbízhatósággal végzi el. Mindig érkeznek új és új megoldások, ezeket mind ki kell értékelni, hogy vajon bevethetők a beágyazott vezetéstámogató rendszerben vagy nem. A fejlesztő mérnökök előtt álló kihívás az, hogy ezt a nagy tudást kis méretekbe sűrítve, gazdaságosan elő tudja állítani.

– De a hardverek ára is egyre csökken, tudásuk meg egyre nő.
MR: Viszont a piacon maradni hosszú távon úgy lehet, hogy jó minőséget olcsón kell tudni létrehozni.

GYTB: Általában ezeket a publikációkat 4-6 oldalban írják le. Hogy lépést tudjunk tartani a tudományos és ipari megoldássokkal, 3-4 hónap alatt kell működő megoldást fejleszteni, ami igen nagy erőfeszítést kívánó feladat. De ezt úgy kell elképzelni, hogy leírják a kóla receptjét úgy, hogy három összetevőt kihagytak belőle. Vagyis jellemzően vannak ismeretlen részei egy ilyen algoritmusnak. Következő kihívás, hogy ezeket az algoritmusokat előzetesen csak meglévő adatbázisokon futtatták le, más kérdés, hogy hogyan működik a fejlesztés a való világban. Többek között az ilyen projektek tesztelését is segíti a Duckietown terepasztalunk.

– Hogy épül fel a fejlesztési munka a budapesti Continentalnál?
MR: A Continentalnál a sense (érzékelés), plan (tervezés) és act (végrehajtás) pilléreire épül a munka, Budapesten a kamerás érzékelésen van a fókusz. Többek között az intencióbecslést fejlesztjük. A gyalogosok mozgása hosszabb távú gépi becslést igényel, mert ez nem egyszerű lineáris mozgás.

GYTB: Amit a neuronhálók a háttérben csinálhatnak, az valami olyan, mintha 3D-ben tanulnák meg az érzékelést. a kép a világról sok 2D-kép megtanulása alapján alakítható ki ezekben a rendszerekben.

– Lehet vállalkozni arra, hogy a valóságos közlekedés minden egyes szcenárióját leképezzük? Nem lehetetlen küldetés minden eshetőségre felkészíteni az elektronikát, a gépi érzékelést?
GYTB: A cél meghatározása és a társadalmi elfogadtatás a lényeg. Nyilván a 100%-os biztonságra kell törekedni, de mindig tudunk egy x+1-dik esetet mondani, amit az élet produkál, és amire a legjobb sofőr sem tudna felkészülni. Az biztos, hogy az algoritmusok már jobbak az emberi tudásnál. Az élet persze mindig felhívja a figyelmet, hogy még tovább kell fejleszteni a gépi tudást, és ez így is marad még sokáig. Inkább a társadalmi megítélés változtatásán kell dolgozni. Egy pacemaker beültetését is elfogadjuk, és bízunk benne, hogy az hiba nélkül működni fog.

Nyitókép: Gyires-Tóth Bálint és Moni Róbert

Fogalomtár
Mesterséges intelligencia (MI, AI): Mesterséges Intelligencia, angolul Artificial Intelligence. Az AI módszerek az adatokból explicit tudás betáplálása nélkül képesek komplex összefüggéseket megtanulni.

Mély tanulás: a gépi tanulás jelenleg talán legnagyobb figyelmet kapó ága. Nagy méretű mesterséges neurális hálózatok hatékony tanítását teszi lehetővé.

Mesterséges neurális háló: MI-eljárás. Rendkívül bonyolult matematikai modellek, melyek képesek az adatokból összefüggéseket megtanulni. Többek között ilyen eljárást használnak az önvezető autókban is.

Big data: nagy, strukturált adatmennyiség. Ilyen méretű adat lehet például 1000 darab autóra szerelt, autónként 6 kamerának egy éven át rögzített felvétele.

Beágyazott rendszerek: konkrét feladat ellátására tervezett, jellemzően kis helyet és mérsékelt erőforrást igénylő számítógép.

Hirdetés

Kiemelt Partnereink