Beszállítók Őrületes adatmennyiséget dolgoz fel a Continental

Őrületes adatmennyiséget dolgoz fel a Continental

Kuthi Áron | 2019.07.04 05:00

Őrületes adatmennyiséget dolgoz fel a Continental

Arról szinte mindenki értesült, hogy a Google kamerás autói keresztül-kasul járják a Földet, hogy feltérképezzék a külvilágot. Ám hajszálra pontosan ugyanezt teszi a Continental is. A felvételek az autonóm vezetési rendszerek kidolgozásához, fejlesztéséhez és működtetéséhez szükségesek. Az itt keletkező nyers adatokat többek között Budapesten rendszerezik. Dr. Lóránd Balázs erről az (egyelőre) véget nem érő feladatról beszélt.

Hirdetés

– Mi a pozíciója és a feladata a Continental budapesti Mesterséges Intelligencia Fejlesztő Központjában?
– A Continental budapesti Mesterséges Intelligencia Fejlesztő Központ Deep Learning Data & Infrastructure csoportjának vezetője vagyok. Ez egyrészt kiszolgáló-támogató tevékenységet jelent, másrészt pedig nagyon is központi jelentőségű terület. A mélytanulásban (deep learning) az adat a legfontosabb, ez a kiindulópontja minden vezetéstámogató funkció fejlesztésének. Az adatok mennyisége, minősége és eloszlása jelentősen befolyásolja az algoritmus eredményességét.

– Hogy keletkezik az adat?
– A Continental hatalmas autóflottájával a világ öt kontinensén szenzorok segítségével folyamatosan rögzíti a külső világot, vagyis útszakaszokat, városokat, épületeket. Ezeket a kamera-, lidar-, és radarfelvételeket észak-amerikai, indiai, európai adatközpontokban tároljuk le. Ez egy hatalmas, petabájtokban (a gigabájt egymilliószorosa – a szerk.) mérhető nyers adathalmaz. És itt következik a tudomány, hogy mindebből mit hasznosítunk a deep learning számára. Ezeket a felvételeket lényegében képekre bontjuk, és kiválasztjuk a funkciók szempontjából releváns jeleneteket, érdekes forgalmi szituációkat. Ezt követően a képeket metaadatokkal, azonosító felirattal, címkékkel látjuk el úgymint város, országút, köd, hóvihar, stb.

– Hogyan zajlik a feliratozás, a metaadatok hozzáadása?
– Egyrészt algoritmusok nézik át a képsorokat és azonosítják az objektumokat, másrészt manuálisan. Vannak annotáló csapatok, és az itt ülő munkatársak azzal foglalkoznak, hogy megjelölik a világ apróbb és nagyobb objektumait (közlekedési tábla, autó, ember, fa, út, stb.).

– Ennek az igen nagy munkának lesz valaha vége, vagy mivel mindig változik a világ, ezt mindig le kell követni?
– Igen, valós a felvetés, mert mi van, ha másfajta közúti jelzéseket kezdenek használni valahol, vagy újfajta járművek jelennek meg. Ezek a változások egyértelműen további tanító minták generálását jelentik számunkra. Vagyis a képkinyerés (image extraction) és adatgazdagítás (enrichment) folyamatosan fejlődő feladat. Az emberi mozgás, testtartás mintái különösen fontosak ebből a szempontból, mert nem mindegy, hogy az autó a gyalogosnak csak a mozgását vagy a fejtartását is észleli, értelmezi. Ez egy hangtalanul érkező elektromos gépkocsi esetében kulcsfontosságú, mert a gyalogos nem feltétlenül hallja a közelgő autót, nem fordítja felé a fejét.

– Az adatok hogy válnak értelmezhető módon elérhetővé, felhasználhatóvá?
– Budapesten egyrészt adatmérnökök dolgoznak, ők kódolják és integrálják a szöveges adatokat olyan formára, hogy a modellek ezek alapján tanulhassanak. Őket adatmenedzserek segítik, ők gyűjtik össze a fejlesztők igényeit és koordinálják az adatfolyamot. Nekik kell gondoskodniuk arról, hogy a szükséges adathalmazok a kellő időben megfelelő formában elérhetőek legyenek. Tehát igényeket egyeztetnek, és fordítanak le a fejlesztőknek, adminisztrálnak, és tartják a kapcsolatot a szervezeten belüli többi csapattal, például Indiával.

– Az indiai központon kívül még melyik Continental-egységgel tart napi kapcsolatot a budapesti központ?
– A németországi fejlesztőközpontokkal leginkább. De tudnunk kell arról is, hogy ha felbukkan egy új termék – például olyan formában, hogy a Continental felvásárol egy startup céget, – akkor annak a tudását mi ki tudjuk használni. Tehát tudnunk kell minden, a vállalaton belül a mi munkánkhoz közel álló területen zajló eseményről.

– Mekkora számítási kapacitást igényel ez a munka?
– Az irodában egyrészt a személyi munkaállomásokon, a szerverszobában működnek képfeldolgozásra, tanításra alkalmas grafikai vezérlőkártyás egységek (GPU), másrészt épül egy adatközpont Németországban, amely rengeteg CPU-t és GPU-t összekapcsoló klasztert tartalmaz. Hamarosan ennek az ADAS GPU-klaszternek a kapacitását is ki tudjuk majd használni. A budapesti központ előtt álló legnagyobb kihívás, hogy a deep learning számára szükséges infrastruktúra minél nagyobb kapacitással kiépülhessen, viszont ha kiépül, folyamatosan használatban is legyen, mert a működtetése amúgy nagyon drága mutatvány. Rengeteg paraméterre kell figyelni, mert nagyon nagy adatmennyiségek mozognak nagyon kis idő alatt. A Data&Infrastructure csapat feladata lényegében a tanítási folyamatnak az optimalizálása.

– Új és új algoritmusok születnek, amelyeket ezeken a nagy kép-adatbázisokon kell végigfuttatni, és az autonóm mobilitás piaci versenye arról szól, hogy ki tudja eredményesebben, hibamentesen működtetni ezeket a saját termékeiben. Ez a verseny tehát számítási kapacitásra is lefordítható?
– A piacon mindenki abba az irányba halad, hogy nagy számítási kapacitásokat épít magának. Ennek két útja van. A szereplő vagy saját klasztert épít, vagy felhőből bérel számítási kapacitást. A Continental a kettőt összekötve végzi a munkát. A cél, hogy év végére ezt a hibrid rendszert véglegesen összekössük. És azért kell megnövelni a számítási kapacitást, mert a rendszereink így nagyobb mintákból többet tudnak tanulni. Egyre több az adat, egyre komplexebbek a modellek, ezért egyre nagyobb számítási kapacitás szükséges.

– Az intelligens képfelismeréshez szükséges informatikai tudás, az ezt támogató infrastrukturális háttér építése mennyire speciális terület Magyarországon?
– A Mesterséges Intelligencia Fejlesztő Központban zajló munkák több területen is kapcsolódnak a nagy teljesítményű számításhoz (high performance computing), és ha valaki ezen a területen szerzett tapasztalatokat, az nálunk nagy előny. Szerencsére van már idehaza jó néhány nagy informatikai cég, ahol ez a tudás megjelent. Másrészt olyan típusú feladataink vannak, amelyekről nem szól még túl sok szakcikk, könyv, vagy blog. A budapesti központban dolgozó szakemberekben szerencsére nagyon nagy a nyitottság az újdonságok befogadására. Egy nagyon jó csapat jött össze nálunk, közösen formájuk a mobilitás jövőjét.

Kiemelt Partnereink