Witold Kieraś

Contact information


Institute of Computer Science, Polish Academy of Sciences

Jana Kazimierza 5

01-248 Warszawa







+48 22 8363709


<wkieras AT SPAMFREE ipipan DOT waw DOT pl>

Selected publications

List of publications


Stanisław Bogdanowicz, Hanna Cwynar, Aleksandra Zwierzchowska, Cezary Klamra, Witold Kieraś, and Łukasz Kobyliński. TwitterEmo: Annotating emotions and sentiment in Polish twitter. In Jiří Mikyška, Clélia de Mulatier, Maciej Paszynski, Valeria V. Krzhizhanovskaya, Jack J. Dongarra, and Peter M.A. Sloot, editors, Computational Science – ICCS 2023. 23rd International Conference, Prague, Czech Republic, July 3–5, 2023, Proceedings, Part II, number 14074 in Lecture Notes in Computer Science, pages 212–220, Cham, 2023. Springer Nature Switzerland.

Karol Saputa, Aleksandra Tomaszewska, Natalia Zawadzka-Paluektau, Witold Kieraś, and Łukasz Kobyliński. Korpusomat.eu: A multilingual platform for building and analysing linguistic corpora. In Jiří Mikyška, Clélia de Mulatier, Maciej Paszynski, Valeria V. Krzhizhanovskaya, Jack J. Dongarra, and Peter M.A. Sloot, editors, Computational Science – ICCS 2023. 23rd International Conference, Prague, Czech Republic, July 3–5, 2023, Proceedings, Part II, number 14074 in Lecture Notes in Computer Science, pages 230–237, Cham, 2023. Springer Nature Switzerland.

Joanna Wołoszyn, Witold Kieraś, and Marcin Woliński. Sieć powiązań derywacyjnych na materiale Słownika gramatycznego języka polskiego: Propozycja klasyfikacji. LingVaria, 18(2):47–61, 2023.


Khuyagbaatar Batsuren, Omer Goldman, Salam Khalifa, Nizar Habash, Witold Kieraś, Gábor Bella, Brian Leonard, Garrett Nicolai, Kyle Gorman, Yustinus Ghanggo Ate, Maria Ryskina, Sabrina Mielke, Elena Budianskaya, Charbel El-Khaissi, Tiago Pimentel, Michael Gasser, William Abbott Lane, Mohit Raj, Matt Coler, Jaime Rafael Montoya Samame, Delio Siticonatzi Camaiteri, Esaú Zumaeta Rojas, Didier López Francis, Arturo Oncevay, Juan López Bautista, Gema Celeste Silva Villegas, Lucas Torroba Hennigen, Adam Ek, David Guriel, Peter Dirix, Jean-Philippe Bernardy, Andrey Scherbakov, Aziyana Bayyr-ool, Antonios Anastasopoulos, Roberto Zariquiey, Karina Sheifer, Sofya Ganieva, Hilaria Cruz, Ritván Karahóǧa, Stella Markantonatou, George Pavlidis, Matvey Plugaryov, Elena Klyachko, Ali Salehi, Candy Angulo, Jatayu Baxi, Andrew Krizhanovsky, Natalia Krizhanovskaya, Elizabeth Salesky, Clara Vania, Sardana Ivanova, Jennifer White, Rowan Hall Maudslay, Josef Valvoda, Ran Zmigrod, Paula Czarnowska, Irene Nikkarinen, Aelita Salchak, Brijesh Bhatt, Christopher Straughn, Zoey Liu, Jonathan North Washington, Yuval Pinter, Duygu Ataman, Marcin Woliński, Totok Suhardijanto, Anna Yablonskaya, Niklas Stoehr, Hossep Dolatian, Zahroh Nuriah, Shyam Ratan, Francis M. Tyers, Edoardo M. Ponti, Grant Aiton, Aryaman Arora, Richard J. Hatcher, Ritesh Kumar, Jeremiah Young, Daria Rodionova, Anastasia Yemelina, Taras Andrushko, Igor Marchenko, Polina Mashkovtseva, Alexandra Serova, Emily Prud'hommeaux, Maria Nepomniashchaya, Fausto Giunchiglia, Eleanor Chodroff, Mans Hulden, Miikka Silfverberg, Arya D. McCarthy, David Yarowsky, Ryan Cotterell, Reut Tsarfaty, and Ekaterina Vylomova. UniMorph 4.0: Universal Morphology. In Proceedings of the Language Resources and Evaluation Conference, pages 840–855, Marseille, France, 2022. European Language Resources Association.

Włodzimierz Gruszczyński, Dorota Adamiec, Renata Bronikowska, Witold Kieraś, Emanuel Modrzejewski, Aleksandra Wieczorek, and Marcin Woliński. The electronic corpus of 17th- and 18th-century Polish texts. Language Resources and Evaluation, 56(1):309–332, 2022.

Jakub Szymanik and Witold Kieraś. The semantically annotated corpus of Polish quantificational expressions. Language Resources and Evaluation, 2022. Forthcoming.

Marcin Woliński, Bartłomiej Nitoń, Witold Kieraś, and Jakub Szymanik. HerBERT based language model detects quantifiers and their semantic properties in Polish. In Proceedings of the Language Resources and Evaluation Conference, pages 7140–7146, Marseille, France, 2022. European Language Resources Association.


Witold Kieraś and Łukasz Kobyliński. Korpusomat – stan obecny i przyszłość projektu. Język Polski, CI(2):49–58, 2021.

Witold Kieraś, Marcin Woliński, and Bartłomiej Nitoń. Nowe wielowarstwowe znakowanie lingwistyczne zrównoważonego Narodowego Korpusu Języka Polskiego. Język Polski, CI(2):59–70, 2021.

Tiago Pimentel, Maria Ryskina, Sabrina J. Mielke, Shijie Wu, Eleanor Chodroff, Brian Leonard, Garrett Nicolai, Yustinus Ghanggo Ate, Salam Khalifa, Nizar Habash, Charbel El-Khaissi, Omer Goldman, Michael Gasser, William Lane, Matt Coler, Arturo Oncevay, Jaime Rafael Montoya Samame, Gema Celeste Silva Villegas, Adam Ek, Jean-Philippe Bernardy, Andrey Shcherbakov, Aziyana Bayyr-ool, Karina Sheifer, Sofya Ganieva, Matvey Plugaryov, Elena Klyachko, Ali Salehi, Andrew Krizhanovsky, Natalia Krizhanovsky, Clara Vania, Sardana Ivanova, Aelita Salchak, Christopher Straughn, Zoey Liu, Jonathan North Washington, Duygu Ataman, Witold Kieraś, Marcin Woliński, Totok Suhardijanto, Niklas Stoehr, Zahroh Nuriah, Shyam Ratan, Francis M. Tyers, Edoardo M. Ponti, Grant Aiton, Richard J. Hatcher, Emily Prud'hommeaux, Ritesh Kumar, Mans Hulden, Botond Barta, Dorina Lakatos, Gábor Szolnok, Judit Ács, Mohit Raj, David Yarowsky, Ryan Cotterell, Ben Ambridge, and Ekaterina Vylomova. SIGMORPHON 2021 shared task on morphological reinflection: Generalization across languages. In Proceedings of the 18th SIGMORPHON Workshop on Computational Research in Phonetics, Phonology, and Morphology, pages 229–259. Association for Computational Linguistics, 2021.


Marcin Woliński and Witold Kieraś. Analiza fleksyjna tekstów historycznych i zmienność fleksji polskiej z perspektywy danych korpusowych. Poradnik Językowy, 8:66–80, 2020.

Marcin Woliński, Witold Kieraś, Dorota Komosińska, and Włodzimierz Gruszczyński. Results of the PolEval 2020 shared task 2: Morphosyntactic tagging of Middle, New and Modern Polish. pages 39–46, Warsaw, 2020. Institute of Computer Science, Polish Academy of Sciences.


Magdalena Król, Włodzimierz Gruszczyński, Magdalena Derwojedowa, Rafał L. Górski, Krzysztof Opaliński, Patrycja Potoniec, Marcin Woliński, Witold Kieraś, and Maciej Eder. Narodowy Korpus Diachroniczny Polszczyzny. Projekt. Język Polski, XCIX(1):92–101, 2019.


Witold Kieraś, Łukasz Kobyliński, and Maciej Ogrodniczuk. Korpusomat — a tool for creating searchable morphosyntactically tagged corpora. Computational Methods in Science and Technology, 24(1):21–27, 2018.

Witold Kieraś and Marcin Woliński. Manually annotated corpus of Polish texts published between 1830 and 1918. In Nicoletta Calzolari, Khalid Choukri, Christopher Cieri, Thierry Declerck, Sara Goggi, Koiti Hasida, Hitoshi Isahara, Bente Maegaard, Joseph Mariani, Hélène Mazo, Asuncion Moreno, Jan Odijk, Stelios Piperidis, and Takenobu Tokunaga, editors, Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018), pages 3854–3859, Paris, France, 2018. European Language Resources Association (ELRA).

Maciej Ogrodniczuk, Joanna Bilińska, Zbigniew Bronk, and Witold Kieraś. Multisłownik: Linking plWordNet-based lexical data for lexicography and educational purposes. In Francis Bond, Takayuki Kuribayashi, Christiane Fellbaum, and Piek Vossen, editors, Proceedings of the 9th Global WordNet Conference (GWC 2018), pages 368–375, Singapore, 2018. University of Tartu.

Jakub Waszczuk, Witold Kieraś, and Marcin Woliński. Morphosyntactic disambiguation and segmentation for historical Polish with graph-based conditional random fields. In Petr Sojka, Aleš Horák, Ivan Kopeček, and Karel Pala, editors, Text, Speech, and Dialogue: 21st International Conference, TSD 2018, Brno, Czech Republic, September 11-14, 2018, Proceedings, number 11107 in Lecture Notes in Artificial Intelligence, pages 188–196. Springer-Verlag, 2018.


Witold Kieraś. Co jest zgodne z duchem kraftu? Próba korpusowego badania słownictwa związanego z piwem. Język Polski, XCVII(2):105–112, 2017.

Witold Kieraś, Dorota Komosińska, Emanuel Modrzejewski, and Marcin Woliński. Morphosyntactic annotation of historical texts. The making of the baroque corpus of Polish. In Kamil Ekštein and Václav Matoušek, editors, Text, Speech, and Dialogue 20th International Conference, TSD 2017, Prague, Czech Republic, August 27-31, 2017, Proceedings, number 10415 in Lecture Notes in Computer Science, pages 308–316. Springer International Publishing, 2017.

Witold Kieraś and Marcin Woliński. Morfeusz 2 – analizator i generator fleksyjny dla języka polskiego. Język Polski, XCVII(1):75–83, 2017.

Witold Kieraś and Marcin Woliński. Słownik gramatyczny języka polskiego – wersja internetowa. Język Polski, XCVII(1):84–93, 2017.

Marcin Woliński, Witold Kieraś, and Dorota Komosińska. Anotatornia 2 — an annotation tool geared towards historical corpora. In Zygmunt Vetulani and Patrick Paroubek, editors, Proceedings of the 8th Language & Technology Conference: Human Language Technologies as a Challenge for Computer Science and Linguistics, pages 158–162, Poznań, Poland, 2017. Fundacja Uniwersytetu im. Adama Mickiewicza w Poznaniu.


Joanna Bilińska, Magdalena Derwojedowa, Witold Kieraś, and Monika Kwiecień. Mikrokorpus polszczyzny 1830-1918. Komunikacja specjalistyczna, 11:149–161, 2016.

Magdalena Derwojedowa, Witold Kieraś, Joanna Bilińska, and Monika Kwiecień. Dynamika zmian fleksyjnych i ortograficznych między reformami 1830-1918. Język Polski, XCVI(1):24–35, 2016.

Łukasz Kobyliński and Witold Kieraś. Part of speech tagging for Polish: State of the art and future perspectives. In Proceedings of the 17th International Conference on Intelligent Text Processing and Computational Linguistics (CICLing 2016), Konya, Turkey, 2016.

Marcin Woliński and Witold Kieraś. The on-line version of Grammatical Dictionary of Polish. In Nicoletta Calzolari, Khalid Choukri, Thierry Declerck, Marko Grobelnik, Bente Maegaard, Joseph Mariani, Asuncion Moreno, Jan Odijk, and Stelios Piperidis, editors, Proceedings of the Tenth International Conference on Language Resources and Evaluation, LREC 2016, pages 2589–2594, Portorož, Slovenia, 2016. European Language Resources Association (ELRA).


Magdalena Derwojedowa, Witold Kieraś, Danuta Skowrońska, and Robert Wołosz. Korpus polszczyzny XIX wieku – od mikrokorpusu do korpusu średniej wielkości. Prace Filologiczne, LXV:251–256, 2014.

Magdalena Derwojedowa, Witold Kieraś, Danuta Skowrońska, and Robert Wołosz. Współczesne narzędzia leksykograficzne a analiza tekstów dawniejszych. Polonica, XXXIV:21–27, 2014.

Witold Kieraś. Na tysiąc żołnierza ledwie pięciu rosłych chłopa. O pewnej nietypowej konstrukcji z liczebnikiem. In Piotr Żmigrodzki and Sylwia Przęczka-Kisielak, editors, Bogactwo współczesnej polszczyzny. Towarzystwo Miłośników Języka Polskiego, Cracow, 2014.


Katarzyna Krasnowska and Witold Kieraś. Polish LFG treebank on a shoestring. In Sandra Kübler, Petya Osenova, and Martin Volk, editors, Proceedings of The Twelfth Workshop on Treebanks and Linguistic Theories (TLT12), pages 109–120, Sofia, Bulgaria, 2013. The Institute of Information and Communication Technologies, Bulgarian Academy of Sciences.


Witold Kieraś. Atrakcje wyjazdowe, czyli w obydwie strony bez wahadła. O słownictwie kibiców piłkarskich. Socjolingwistyka, 24–25:119–134, 2012.

Katarzyna Krasnowska, Witold Kieraś, Marcin Woliński, and Adam Przepiórkowski. Using tree transducers for detecting errors in a treebank of Polish. In Petr Sojka, Aleš Horák, Ivan Kopeček, and Karel Pala, editors, Text, Speech and Dialogue: 15th International Conference, TSD 2012, Brno, Czech Republic, number 7499 in Lecture Notes in Artificial Intelligence, pages 119–126. Springer-Verlag, Heidelberg, 2012.