Size: 7601
Comment:
|
Size: 9842
Comment:
|
Deletions are marked like this. | Additions are marked like this. |
Line 9: | Line 9: |
||<style="border:0;padding-left:30px;padding-bottom:0px">'''Semantic analysis based on inference'''  {{attachment:seminarium-archiwum/icon-en.gif|Wystąpienie w języku angielskim.}}|| ||<style="border:0;padding-left:30px;padding-bottom:0px">I will present a semantic analyzer SemETAP, which is a module of a linguistic processor ETAP designed to perform analysis and generation of NL texts. We proceed from the assumption that the depth of understanding is determined by the number and quality of inferences we can draw from the text. Extensive use of background knowledge and inferences permits to extract implicit information. Salient features of SemETAP include: || ||<style="border:0;padding-left:30px;padding-bottom:0px">– knowledge base contains both linguistic and background knowledge;|| ||<style="border:0;padding-left:30px;padding-bottom:0px">– inference types include strict entailments and plausible expectations; || ||<style="border:0;padding-left:30px;padding-bottom:0px">– words and concepts of the ontology may be supplied with explicit decompositions for inference purposes; || ||<style="border:0;padding-left:30px;padding-bottom:0px">– two levels of semantic structure are distinguished. Basic semantic structure (BSemS) interprets the text in terms of ontological elements. Enhanced semantic structure (EnSemS) extends BSemS by means of a series of inferences; || ||<style="border:0;padding-left:30px;padding-bottom:15px">– a new logical formalism Etalog is developed in which all inference rules are written.|| |
||<style="border:0;padding-left:30px;padding-bottom:5px">'''[[attachment:seminarium-archiwum/2019-09-23.pdf|Semantic analysis based on inference]]'''  {{attachment:seminarium-archiwum/icon-en.gif|Wystąpienie w języku angielskim.}}|| ||<style="border:0;padding-left:30px;padding-bottom:5px">I will present a semantic analyzer SemETAP, which is a module of a linguistic processor ETAP designed to perform analysis and generation of NL texts. We proceed from the assumption that the depth of understanding is determined by the number and quality of inferences we can draw from the text. Extensive use of background knowledge and inferences permits to extract implicit information.|| ||<style="border:0;padding-left:30px;padding-bottom:0px">Salient features of SemETAP include: || ||<style="border:0;padding-left:30px;padding-bottom:0px">— knowledge base contains both linguistic and background knowledge;|| ||<style="border:0;padding-left:30px;padding-bottom:0px">— inference types include strict entailments and plausible expectations; || ||<style="border:0;padding-left:30px;padding-bottom:0px">— words and concepts of the ontology may be supplied with explicit decompositions for inference purposes; || ||<style="border:0;padding-left:30px;padding-bottom:0px">— two levels of semantic structure are distinguished. Basic semantic structure (BSemS) interprets the text in terms of ontological elements. Enhanced semantic structure (EnSemS) extends BSemS by means of a series of inferences; || ||<style="border:0;padding-left:30px;padding-bottom:15px">— a new logical formalism Etalog is developed in which all inference rules are written.|| |
Line 19: | Line 20: |
||<style="border:0;padding-left:30px;padding-bottom:5px">'''Co sieć złożona może powiedzieć o tekście?'''  {{attachment:seminarium-archiwum/icon-pl.gif|Wystąpienie w języku polskim.}}|| ||<style="border:0;padding-left:30px;padding-bottom:15px">Sieci złożone, które znalazły zastosowanie w ilościowym opisie wielu różnych zjawisk, okazały się atrakcyjne także w badaniach nad językiem naturalnym. Formalizm sieciowy pozwala badać język z różnych punktów widzenia – sieć złożona może reprezentować na przykład wzajemne położenie słów w tekście, pokrewieństwo znaczeń, czy relacje gramatyczne. Jednym z rodzajów sieci lingwistycznych są sieci sąsiedztwa słów, opisujące współwystępowanie słów w tekstach. Pomimo prostoty konstrukcji, sieci sąsiedztwa słów mają szereg właściwości pozwalających na ich praktyczne wykorzystanie. Struktura takich sieci, wyrażona odpowiednio zdefiniowanymi wielkościami, odzwierciedla pewne cechy języka; zastosowanie metod uczenia maszynowego do zbiorów tych wielkości może posłużyć między innymi do zidentyfikowania autora tekstu.|| ||<style="border:0;padding-top:5px;padding-bottom:5px">'''21 października 2019'''|| ||<style="border:0;padding-left:30px;padding-bottom:0px">'''Piotr Przybyła''', '''Jakub Gąsior''' (Instytut Podstaw Informatyki PAN)|| ||<style="border:0;padding-left:30px;padding-bottom:5px">'''Dwa zadania oceny wiarygodności na podstawie krótkich fragmentów tekstu: wykrywanie botów w mediach społecznościowych i odnajdywanie weryfikowalnych stwierdzeń w dyskusjach politycznych'''  {{attachment:seminarium-archiwum/icon-pl.gif|Wystąpienie w języku polskim.}}|| ||<style="border:0;padding-left:30px;padding-bottom:15px">Streszczenie wystąpienia zostanie podane wkrótce.|| ||<style="border:0;padding-top:5px;padding-bottom:5px">'''4 listopada 2019'''|| ||<style="border:0;padding-left:30px;padding-bottom:0px">'''Marcin Będkowski''' (Instytut Badań Edukacyjnych), '''Łukasz Kobyliński''' (Instytut Podstaw Informatyki PAN)|| |
|
Line 24: | Line 35: |
||<style="border:0;padding-left:30px;padding-bottom:5px">'''Tytuł wystąpienia zostanie podany wkrótce'''  {{attachment:seminarium-archiwum/icon-en.gif|Wystąpienie w języku angielskim.}}|| | ||<style="border:0;padding-left:30px;padding-bottom:5px">'''Wielojęzyczny korpus równoległy InterCorp: reprezentacja kategorii gramatycznych'''  {{attachment:seminarium-archiwum/icon-en.gif|Wystąpienie w języku angielskim.}}|| |
Line 29: | Line 40: |
||<style="border:0;padding-left:30px;padding-bottom:5px">'''Tytuł wystąpienia zostanie podany wkrótce'''  {{attachment:seminarium-archiwum/icon-en.gif|Wystąpienie w języku angielskim.}}|| | ||<style="border:0;padding-left:30px;padding-bottom:5px">'''Czeski korpus uczniowski'''  {{attachment:seminarium-archiwum/icon-en.gif|Wystąpienie w języku angielskim.}}|| |
Line 38: | Line 49: |
Line 40: | Line 52: |
- 21 października: ? | - 21 października: Piotr Przybyła i Jakub Gąsior |
Seminarium „Przetwarzanie języka naturalnego” 2019–20
Seminarium Zespołu Inżynierii Lingwistycznej w Instytucie Podstaw Informatyki Polskiej Akademii Nauk odbywa się nieregularnie w poniedziałki zwykle o godz. 10:15 w siedzibie IPI PAN (ul. Jana Kazimierza 5, Warszawa) i ma charakter otwarty. Poszczególne referaty ogłaszane są na Polskiej Liście Językoznawczej oraz na stronie Lingwistyka komputerowa na Facebooku. Wszystkie nagrania dostępne są na kanale YouTube. |
23 września 2019 |
Igor Boguslavsky (Institute for Information Transmission Problems, Russian Academy of Sciences / Universidad Politécnica de Madrid) |
I will present a semantic analyzer SemETAP, which is a module of a linguistic processor ETAP designed to perform analysis and generation of NL texts. We proceed from the assumption that the depth of understanding is determined by the number and quality of inferences we can draw from the text. Extensive use of background knowledge and inferences permits to extract implicit information. |
Salient features of SemETAP include: |
— knowledge base contains both linguistic and background knowledge; |
— inference types include strict entailments and plausible expectations; |
— words and concepts of the ontology may be supplied with explicit decompositions for inference purposes; |
— two levels of semantic structure are distinguished. Basic semantic structure (BSemS) interprets the text in terms of ontological elements. Enhanced semantic structure (EnSemS) extends BSemS by means of a series of inferences; |
— a new logical formalism Etalog is developed in which all inference rules are written. |
7 października 2019 (UWAGA: seminarium połączone z instytutowym; odbędzie się wyjątkowo o 13:00!) |
Tomasz Stanisz (Instytut Fizyki Jądrowej PAN) |
Co sieć złożona może powiedzieć o tekście? |
Sieci złożone, które znalazły zastosowanie w ilościowym opisie wielu różnych zjawisk, okazały się atrakcyjne także w badaniach nad językiem naturalnym. Formalizm sieciowy pozwala badać język z różnych punktów widzenia – sieć złożona może reprezentować na przykład wzajemne położenie słów w tekście, pokrewieństwo znaczeń, czy relacje gramatyczne. Jednym z rodzajów sieci lingwistycznych są sieci sąsiedztwa słów, opisujące współwystępowanie słów w tekstach. Pomimo prostoty konstrukcji, sieci sąsiedztwa słów mają szereg właściwości pozwalających na ich praktyczne wykorzystanie. Struktura takich sieci, wyrażona odpowiednio zdefiniowanymi wielkościami, odzwierciedla pewne cechy języka; zastosowanie metod uczenia maszynowego do zbiorów tych wielkości może posłużyć między innymi do zidentyfikowania autora tekstu. |
21 października 2019 |
Piotr Przybyła, Jakub Gąsior (Instytut Podstaw Informatyki PAN) |
Dwa zadania oceny wiarygodności na podstawie krótkich fragmentów tekstu: wykrywanie botów w mediach społecznościowych i odnajdywanie weryfikowalnych stwierdzeń w dyskusjach politycznych |
Streszczenie wystąpienia zostanie podane wkrótce. |
4 listopada 2019 |
Marcin Będkowski (Instytut Badań Edukacyjnych), Łukasz Kobyliński (Instytut Podstaw Informatyki PAN) |
Tytuł wystąpienia zostanie podany wkrótce |
Streszczenie wystąpienia zostanie podane wkrótce. |
18 listopada 2019 |
Alexander Rosen (Uniwersytet Karola w Pradze) |
Wielojęzyczny korpus równoległy InterCorp: reprezentacja kategorii gramatycznych |
Streszczenie wystąpienia zostanie podane wkrótce. |
21 listopada 2019 |
Alexander Rosen (Uniwersytet Karola w Pradze) |
Czeski korpus uczniowski |
Streszczenie wystąpienia zostanie podane wkrótce. |
Zapraszamy także do zapoznania się z archiwum seminariów z lat 2000–15 oraz listą wystąpień z lat 2015–19. |