Elemzések A perifériás látást is javíthatja az MI

A perifériás látást is javíthatja az MI

autopro.hu/R.K.E. | 2024.03.17 04:17

A perifériás látást is javíthatja az MI

Fotó: MIT

A perifériás látás lehetővé teszi az ember számára, hogy olyan alakzatokat is lásson, amelyek nincsenek közvetlenül a látóterünkben, bár kevésbé részletesen. Ez a képesség kitágítja a látómezőnket, és számos helyzetben hasznos lehet, például ha egy oldalról közeledő járművet észlelünk.

Hirdetés

Az emberekkel ellentétben a mesterséges intelligencia nem rendelkezik perifériás látással. Ha a számítógépes látásmodelleket felvértezzük ezzel a képességgel, akkor hatékonyabban észlelhetik a közeledő veszélyeket, vagy megjósolhatják, hogy az emberi vezető észrevesz-e egy szembejövő tárgyat. Az MIT kutatói egy lépést tettek ebbe az irányba, és kifejlesztettek egy olyan képadatkészletet, amely lehetővé teszi számukra a perifériás látás szimulálását a gépi tanulási modellekben.

A modelleknek ezzel az adatkészlettel való betanítása javította a modellek képességét a látási periférián lévő tárgyak észlelésére, bár a modellek még mindig rosszabbul teljesítettek, mint az emberek. Eredményeik azt is kimutatták, hogy az emberekkel ellentétben sem a tárgyak mérete, sem a jelenetben lévő vizuális rendetlenség nem volt nagy hatással a mesterséges intelligencia teljesítményére. „Itt valami alapvető dolog történik. Nagyon sok különböző modellt teszteltünk, és még ha be is képeztük őket, egy kicsit jobbak lettek, de nem egészen olyanok, mint az emberek. A kérdés tehát az: mi hiányzik ezekből a modellekből?" – mondja a tanulmány társszerzője.

Ennek a kérdésnek a megválaszolása segíthet a kutatóknak olyan gépi tanulási modelleket építeni, amelyek jobban látják a világot, mint az emberek. Az ilyen modelleket a vezetés biztonságának javítása mellett olyan kijelzők kifejlesztésére is fel lehetne használni, amelyeket az emberek könnyebben tudnak nézni. Ráadásul a perifériás látás mélyebb megértése a mesterségesintelligencia-modellekben segíthet a kutatóknak jobban megjósolni az emberi viselkedést, teszi hozzá a vezető szerző.

Perifériás látás szimulálása

A perifériás látás modellezésére a mesterséges intelligencia számos létező megközelítése a képek széleinek elmosódásával ábrázolja ezt a csökkenő részletességet, de a látóidegben és a látókéregben bekövetkező információvesztés ennél sokkal összetettebb. A pontosabb megközelítés érdekében az MIT kutatói egy olyan technikából indultak ki, amelyet az emberek perifériás látásának modellezésére használnak. Ez a módszer úgy alakítja át a képeket, hogy az emberi vizuális információveszteséget reprezentálja.

Módosították ezt a modellt, hogy a képeket hasonlóan tudja átalakítani, de rugalmasabb módon, amelyhez nem kell előre tudni, hogy az ember vagy a mesterséges intelligencia hová fogja irányítani a szemét. A kutatók ezt a módosított technikát arra használták, hogy egy hatalmas adathalmazt hozzanak létre átalakított képekből, amelyek bizonyos területeken textúraszerűbbnek tűnnek, hogy reprezentálják a részletesség elvesztését, ami akkor következik be, amikor az ember a perifériára néz. Ezután az adathalmazt több számítógépes látásmodell betanításához használták, és összehasonlították teljesítményüket az emberekével egy tárgyfelismerési feladatban.

Különös teljesítmény

Az embereknek és a modelleknek olyan átalakított képpárokat mutattak, amelyek azonosak voltak, kivéve, hogy az egyik képen a periférián található céltárgy volt. Ezután minden résztvevőt arra kértek, hogy válassza ki azt a képet, amelyen a céltárgy volt.

A kutatók azt találták, hogy a modellek nulláról való betanítása az adathalmazukkal a legnagyobb teljesítménynövekedést eredményezte, javítva a tárgyak észlelésének és felismerésének képességét. A modell finomhangolása az adatkészlettel – ez egy olyan folyamat, amelynek során az előzetesen betanított modellt úgy módosítják, hogy az képes legyen egy új feladat elvégzésére – kisebb teljesítménynövekedést eredményezett.

A gépek azonban egyik esetben sem voltak olyan jók, mint az emberek, és különösen a távoli periférián lévő tárgyak felismerésében voltak rosszak. A teljesítményük sem követte ugyanazt a mintázatot, mint az embereké. A kutatók azt tervezik, hogy tovább vizsgálják ezeket a különbségeket, azzal a céllal, hogy olyan modellt találjanak, amely képes megjósolni az emberi teljesítményt a vizuális periférián. Ez lehetővé tenné, hogy a mesterségesintelligencia-rendszerek figyelmeztessék a járművezetőket például azokra a veszélyekre, amelyeket ők esetleg nem látnak – írja az AutoTech News.

Tetszett ez a hír? Értesüljön elsőként a járműipari történésekről, iratkozzon fel az autopro.hu hírlevelére az alábbi linken!

Hirdetés

Kiemelt Partnereink