Trend Az MI-fejhallgató, ami lehetővé teszi, hogy egyetlen embert halljon a tömegben

Az MI-fejhallgató, ami lehetővé teszi, hogy egyetlen embert halljon a tömegben

autopro.hu/R.K.E. | 2024.05.31 17:17

Az MI-fejhallgató, ami lehetővé teszi, hogy egyetlen embert halljon a tömegben

Fotó: University of Washington / részlet a videóból

A mérnökök olyan mesterségesintelligencia-rendszert fejlesztettek ki, amely lehetővé teszi, hogy a fejhallgatót viselő személy három-öt másodpercig nézze a beszélő személyt, hogy „befogadja" őt. A rendszer ezután csak a befogadott beszélő hangját játssza le valós időben, még akkor is, ha a pár zajos környezetben mozog.

Hirdetés

A zajszűrő fejhallgatók nagyon jól tudnak egy „csendes teret" létrehozni. De az, hogy a viselő környezetéből származó bizonyos hangokat átengedjenek a szűrőn, még mindig kihívás elé állítja a kutatókat. Az Apple AirPods Pro legújabb kiadása például automatikusan beállítja a hangszintet a viselője számára – érzékeli például, ha beszélgetés közben van –, de a felhasználónak kevéssé van befolyása arra, hogy kit hallgasson, vagy hogy ez mikor történik.

A Washingtoni Egyetem csapata egy olyan mesterségesintelligencia-rendszert fejlesztett ki, amely lehetővé teszi, hogy a fejhallgatót viselő felhasználó három-öt másodpercig nézze a beszélő személyt, hogy „befogadja" őt. A „Target Speech Hearing" nevű rendszer ezután minden más hangot kiiktat a környezetből, és csak a befogadott beszélő hangját játssza le valós időben, még akkor is, ha a hallgató zajos helyen mozog, és már nem néz a beszélőre.

A rendszer használatához a mikrofonnal ellátott fejhallgatót viselő személy egy gombot nyom meg, miközben a fejét a beszélőre irányítja. A beszélő hangjának hanghullámainak ekkor egyszerre kell elérniük a fejhallgató két oldalán lévő mikrofonokat; a hibahatár. A fejhallgató ezt a jelet egy fedélzeti beágyazott számítógépre küldi, ahol a csapat gépi tanulási szoftvere megtanulja a kívánt beszélő hangmintáit. A rendszer megragadja az adott hangszóró hangját, és azt folyamatosan visszajátssza a hallgatónak, még akkor is, ha a pár mozog. A rendszer képessége, hogy a bejegyzett hangra összpontosítson, javul, ahogy a partner tovább beszél, így a rendszer több gyakorló adatot kap.

Szemantikus hallásra épül

Ez a munka a csapat korábbi „szemantikus hallás" kutatására épül, amely lehetővé tette a felhasználók számára, hogy kiválasszanak bizonyos hangosztályokat – például madarakat vagy hangokat –, amelyeket hallani szeretnének, és töröljék a környezet egyéb hangjait.

Jelenleg a TSH rendszer egyszerre csak egy hangszórót tud befogadására képes, és csak akkor, ha a célhangszóró hangjával azonos irányból nem érkezik másik hangos zaj. Ha a felhasználó nem elégedett a hangminőséggel, a hangszórón újabb „befogadást" futtathat a tisztaság javítása érdekében. A csapat azon dolgozik, hogy a jövőben a rendszert fülhallgatókra és hallókészülékekre is kiterjesszék – írja a Science Daily.

Tetszett ez a hír? Ne maradjon le a legfontosabb járműipari hírekről, iratkozzon fel hírlevelünkre ezen a linken!

Hirdetés

Kiemelt Partnereink