Beszállítók Őrületes adatmennyiséget dolgoz fel a Continental

Őrületes adatmennyiséget dolgoz fel a Continental

Kuthi Áron | 2019.07.04 05:00

Őrületes adatmennyiséget dolgoz fel a Continental

Arról szinte mindenki értesült, hogy a Google kamerás autói keresztül-kasul járják a Földet, hogy feltérképezzék a külvilágot. Ám hajszálra pontosan ugyanezt teszi a Continental is. A felvételek az autonóm vezetési rendszerek kidolgozásához, fejlesztéséhez és működtetéséhez szükségesek. Az itt keletkező nyers adatokat többek között Budapesten rendszerezik. Dr. Lóránd Balázs erről az (egyelőre) véget nem érő feladatról beszélt.

– Mi a pozíciója és a feladata a Continental budapesti Mesterséges Intelligencia Fejlesztő Központjában?
– A Continental budapesti Mesterséges Intelligencia Fejlesztő Központ Deep Learning Data & Infrastructure csoportjának vezetője vagyok. Ez egyrészt kiszolgáló-támogató tevékenységet jelent, másrészt pedig nagyon is központi jelentőségű terület. A mélytanulásban (deep learning) az adat a legfontosabb, ez a kiindulópontja minden vezetéstámogató funkció fejlesztésének. Az adatok mennyisége, minősége és eloszlása jelentősen befolyásolja az algoritmus eredményességét.

– Hogy keletkezik az adat?
– A Continental hatalmas autóflottájával a világ öt kontinensén szenzorok segítségével folyamatosan rögzíti a külső világot, vagyis útszakaszokat, városokat, épületeket. Ezeket a kamera-, lidar-, és radarfelvételeket észak-amerikai, indiai, európai adatközpontokban tároljuk le. Ez egy hatalmas, petabájtokban (a gigabájt egymilliószorosa – a szerk.) mérhető nyers adathalmaz. És itt következik a tudomány, hogy mindebből mit hasznosítunk a deep learning számára. Ezeket a felvételeket lényegében képekre bontjuk, és kiválasztjuk a funkciók szempontjából releváns jeleneteket, érdekes forgalmi szituációkat. Ezt követően a képeket metaadatokkal, azonosító felirattal, címkékkel látjuk el úgymint város, országút, köd, hóvihar, stb.

– Hogyan zajlik a feliratozás, a metaadatok hozzáadása?
– Egyrészt algoritmusok nézik át a képsorokat és azonosítják az objektumokat, másrészt manuálisan. Vannak annotáló csapatok, és az itt ülő munkatársak azzal foglalkoznak, hogy megjelölik a világ apróbb és nagyobb objektumait (közlekedési tábla, autó, ember, fa, út, stb.).

– Ennek az igen nagy munkának lesz valaha vége, vagy mivel mindig változik a világ, ezt mindig le kell követni?
– Igen, valós a felvetés, mert mi van, ha másfajta közúti jelzéseket kezdenek használni valahol, vagy újfajta járművek jelennek meg. Ezek a változások egyértelműen további tanító minták generálását jelentik számunkra. Vagyis a képkinyerés (image extraction) és adatgazdagítás (enrichment) folyamatosan fejlődő feladat. Az emberi mozgás, testtartás mintái különösen fontosak ebből a szempontból, mert nem mindegy, hogy az autó a gyalogosnak csak a mozgását vagy a fejtartását is észleli, értelmezi. Ez egy hangtalanul érkező elektromos gépkocsi esetében kulcsfontosságú, mert a gyalogos nem feltétlenül hallja a közelgő autót, nem fordítja felé a fejét.

– Az adatok hogy válnak értelmezhető módon elérhetővé, felhasználhatóvá?
– Budapesten egyrészt adatmérnökök dolgoznak, ők kódolják és integrálják a szöveges adatokat olyan formára, hogy a modellek ezek alapján tanulhassanak. Őket adatmenedzserek segítik, ők gyűjtik össze a fejlesztők igényeit és koordinálják az adatfolyamot. Nekik kell gondoskodniuk arról, hogy a szükséges adathalmazok a kellő időben megfelelő formában elérhetőek legyenek. Tehát igényeket egyeztetnek, és fordítanak le a fejlesztőknek, adminisztrálnak, és tartják a kapcsolatot a szervezeten belüli többi csapattal, például Indiával.

– Az indiai központon kívül még melyik Continental-egységgel tart napi kapcsolatot a budapesti központ?
– A németországi fejlesztőközpontokkal leginkább. De tudnunk kell arról is, hogy ha felbukkan egy új termék – például olyan formában, hogy a Continental felvásárol egy startup céget, – akkor annak a tudását mi ki tudjuk használni. Tehát tudnunk kell minden, a vállalaton belül a mi munkánkhoz közel álló területen zajló eseményről.

– Mekkora számítási kapacitást igényel ez a munka?
– Az irodában egyrészt a személyi munkaállomásokon, a szerverszobában működnek képfeldolgozásra, tanításra alkalmas grafikai vezérlőkártyás egységek (GPU), másrészt épül egy adatközpont Németországban, amely rengeteg CPU-t és GPU-t összekapcsoló klasztert tartalmaz. Hamarosan ennek az ADAS GPU-klaszternek a kapacitását is ki tudjuk majd használni. A budapesti központ előtt álló legnagyobb kihívás, hogy a deep learning számára szükséges infrastruktúra minél nagyobb kapacitással kiépülhessen, viszont ha kiépül, folyamatosan használatban is legyen, mert a működtetése amúgy nagyon drága mutatvány. Rengeteg paraméterre kell figyelni, mert nagyon nagy adatmennyiségek mozognak nagyon kis idő alatt. A Data&Infrastructure csapat feladata lényegében a tanítási folyamatnak az optimalizálása.

– Új és új algoritmusok születnek, amelyeket ezeken a nagy kép-adatbázisokon kell végigfuttatni, és az autonóm mobilitás piaci versenye arról szól, hogy ki tudja eredményesebben, hibamentesen működtetni ezeket a saját termékeiben. Ez a verseny tehát számítási kapacitásra is lefordítható?
– A piacon mindenki abba az irányba halad, hogy nagy számítási kapacitásokat épít magának. Ennek két útja van. A szereplő vagy saját klasztert épít, vagy felhőből bérel számítási kapacitást. A Continental a kettőt összekötve végzi a munkát. A cél, hogy év végére ezt a hibrid rendszert véglegesen összekössük. És azért kell megnövelni a számítási kapacitást, mert a rendszereink így nagyobb mintákból többet tudnak tanulni. Egyre több az adat, egyre komplexebbek a modellek, ezért egyre nagyobb számítási kapacitás szükséges.

– Az intelligens képfelismeréshez szükséges informatikai tudás, az ezt támogató infrastrukturális háttér építése mennyire speciális terület Magyarországon?
– A Mesterséges Intelligencia Fejlesztő Központban zajló munkák több területen is kapcsolódnak a nagy teljesítményű számításhoz (high performance computing), és ha valaki ezen a területen szerzett tapasztalatokat, az nálunk nagy előny. Szerencsére van már idehaza jó néhány nagy informatikai cég, ahol ez a tudás megjelent. Másrészt olyan típusú feladataink vannak, amelyekről nem szól még túl sok szakcikk, könyv, vagy blog. A budapesti központban dolgozó szakemberekben szerencsére nagyon nagy a nyitottság az újdonságok befogadására. Egy nagyon jó csapat jött össze nálunk, közösen formájuk a mobilitás jövőjét.

Kiemelt Partnereink