Revision 7 as of 2015-04-13 20:46:38

Clear message
Locked History Actions

Kuźnia

Kuźnia leksemów (Lexeme Forge)

Kuźnię opracowano na podstawie Słownika gramatycznego języka polskiego Z. Saloniego, W. Gruszczyńskiego, M. Wolińskiego, R. Wołosza, Warszawa 2012 w ramach europejskiego projektu Cesar. W projekcie Clarin zmodyfikowano ją i przystosowano do wykorzystania przez dowolnego użytkownika, mającego podstawową wiedzę z leksykografii, jako narzędzie służące do (współ)tworzenia wielu fleksyjnych słowników dziedzinowych.

Kuźnia pozwala na eksport danych do formatów dwóch polskich analizatorów morfologicznych – Morfeusza i Morfologika. Oba analizatory udostępniane są z danymi ze słowników polszczyzny ogólnej. Pozwala to na poprawne zanalizowanie bardzo dużej liczby dokumentów tekstowych. Jednak żaden słownik nie będzie kompletny. Jest to szczególnie zauważalne przy analizie tekstów branżowych (specjalistycznych) lub środowiskowych. Kuźnia pozwala na uzupełnienie tej luki. Dzięki niej mamy możliwość uzupełnienia brakujących danych z każdej dziedziny i z każdego rejestru polszczyzny. Co więcej – pozwala na tworzenie jednej wielkiej bazy danych z możliwością podziału słownictwa na odrębne zbiory, mające zarówno część wspólną, jak i część odrębną. Słownictwo z części wspólnej wystarczy opracować tylko raz, a następnie podpiąć je do tylu słowników, do ilu uznamy za stosowne.

Kuźnia zatem dzięki możliwości tworzenia całościowego zasobu słownikowego pozwala nam z jednej strony na uzupełnienie danych z dowolnej dziedziny wiedzy oraz dowolnego rejestru języka, z drugiej natomiast – dzięki wewnętrznemu podziałowi na pod(słowniki) pozwala uzyskać precyzyjne wyniki, z uwagi na dobranie do analizowanego tekstu odpowiedniego podzbioru danych.

Rejestracja

Pierwszym krokiem do tworzenia własnego słownika od podstaw jest założenia konta w programie. W tym celu należy wypełnić formularz rejestracyjny na stronie http://kuznia.ipipan.clarin-pl.eu/accounts/register/. Na podany adres e-mail zostanie wysłany link aktywacyjny. Po aktywacji można się zalogować przez wpisanie nazwy użytkownika i hasła.

Wersja źródłowa programu

The most current version of Lexeme Forge may be found on Bitbucket repository.

This page offers the official BSD License release of Lexeme Forge, a tool for collaborative work on inflection dictionaries. By downloading the Lexeme Forge package you accept the conditions of that license.

Principal developer: Jan Szejko <Jan DOT Szejko AT SPAMFREE ipipan DOT waw DOT pl>
License: BSD 2-Clause License