Jelenlegi hely
Kutatószeminárium
Napjainkban a mély neurális hálózatok hatalmas sikereket értek el számos kutatási területen. Ez alól nem képez kivételt a számítógépes szövegfeldolgozás sem. Az egyik sikeresen alkalmazott technika az un. szóbeágyazások, mely célja a szavak alacsony dimenziós vektorokkal való ábrázolása úgy, hogy a szemantikailag hasonló szavak hasonló vektorokat kapnak. A módszer kiterjeszthető több nyelvre is, mely során az egyes nyelvek szavait ugyanabba a térbe ágyazzuk be, így a szavak és azok más nyelv béli párjai hasonló reprezentációt kapnak. Előadásomban bemutatom, hogy a kétnyelvű szóbeágyazások hogyan használhatóak nyelvközi gépitanuláshoz, azaz hogyan lehet az angol nyelvű szövegeken tanult modellt más nyelvű szövegek osztályozásához használni. Bemutatok továbbá két módszert szóbeágyazások domain adaptációjára a Twitter domainhez.