Seminarium ''Przetwarzanie języka naturalnego'' 2015–2016
Seminarium Zespołu Inżynierii Lingwistycznej w Instytucie Podstaw Informatyki Polskiej Akademii Nauk odbywa się nieregularnie w poniedziałki zwykle o godz. 10:15 w siedzibie IPI PAN (ul. Jana Kazimierza 5, Warszawa) i ma charakter otwarty. Poszczególne referaty ogłaszane są na Polskiej Liście Językoznawczej oraz na stronie Lingwistyka komputerowa na Facebooku. |
12 października 2015 |
Vincent Ng (Uniwersytet Teksasu w Dallas) |
Koreferencja w OntoNotes – i co dalej? |
Znaczący postęp w dziedzinie wykrywania koreferencji dokonał się w ostatnim czasie m.in. dzięki dostępności ręcznie anotowanych korpusów MUC, ACE i OntoNotes. Koreferencja jest jednak zjawiskiem trudniejszym niż uwzględniają to obecne modele anotacyjne. W trakcie wystąpienia przyjrzymy się jej stosunkowo mniej zbadanym aspektom, stanowiącymi wyzwanie nie mniej ambitne niż wykrywanie koreferencji obiektowej: zadaniu Winograd Schema Challenge, identyfikacji anafory zerowej i koreferencji zdarzeniowej. |
26 października 2015 |
Wojciech Jaworski (Uniwersytet Warszawski) |
Parser składniowo semantyczny dla języka polskiego |
Autor zaprezentuje powstający w ramach projektu CLARIN-PL parser składniowo-semantyczny, przedstawi, jak działa preprocesing realizowany w oparciu o analizator morfologiczny "Morfeusz", opisze zintegrowaną ze słownikiem walencyjnym "Walenty" gramatykę kategorialną języka polskiego, z której korzysta parser oraz przybliży formalizm grafów semantycznych służący do reprezentowania znaczenia tekstów. Wspomni też o algorytmie parsera i strategiach optymalizacyjnych zapewniających jego szybkie działanie i pozwalających w zwarty sposób reprezentować niejednoznaczne rozbiory składniowe i semantyczne. |
16 listopada 2015 |
Izabela Gatkowska (Uniwersytet Jagielloński) |
Empiryczna sieć powiązań leksykalnych |
Empiryczna sieć powiązań leksykalnych jest wynikiem eksperymentu wykorzystującego ludzki mechanizm skojarzeniowy – badany podaje pierwszy wyraz, jaki przychodzi na myśl po zrozumieniu wyrazu bodźca. Badanie przeprowadzono cyklicznie, tj. wyrazy odpowiedzi uzyskane w cyklu pierwszym zostały użyte jako bodźce w cyklu drugim, co umożliwiło powstanie sieci semantycznej, która różni się od sieci budowanych z korpusów tekstowych, np. WORTSCHATZ oraz sieci budowanych ręcznie, np. WordNet. |
30 listopada 2015 |
Dora Montagna (Universidad Autónoma de Madrid) |
Semantyczna reprezentacja hiszpańskiego czasownika polisemicznego |
Autorka zaprezentuje teoretyczny model reprezentacji semantycznej, oparty na teorii generatywnego leksykonu Pustejovskiego. Celem propozycji jest stworzenie bazy do automatycznego określania znaczeń i nowego modelu opisu leksykograficznego. Model ten zastosowano do analizy wysokowydajnego czasownika w języku hiszpańskim, zakładając hipotezę niedookreśloności słów, w celu ustalenia wzorców zastosowań semantycznych. |
11 stycznia 2016 |
Małgorzata Marciniak, Agnieszka Mykowiecka, Piotr Rychlik (Instytut Podstaw Informatyki PAN) |
O ekstrakcji terminologii (tytuł roboczy) |
Streszczenie będzie dostępne wkrótce. |