Locked History Actions

Diff for "NKJP model for TnT Tagger"

Differences between revisions 3 and 4
Revision 3 as of 2013-01-29 17:34:38
Size: 599
Comment:
Revision 4 as of 2013-01-29 17:36:48
Size: 764
Comment:
Deletions are marked like this. Additions are marked like this.
Line 5: Line 5:
Tu można pobrać utworzony z ręcznie anotowanego podkorpusu milionowego NKJP model dla taggera [[http://www.coli.uni-saarland.de/~thorsten/tnt/ | TnT tagger]]. [[attachment:nkjp.zip Model]] udostępniony jest na licencji w stylu BSD. Tu można pobrać utworzony z ręcznie anotowanego podkorpusu milionowego NKJP model dla taggera [[http://www.coli.uni-saarland.de/~thorsten/tnt/ | TnT tagger]]. [[attachment:nkjp.zip|Model]] udostępniony jest na licencji w stylu BSD. Pobrany plik należy zdekompresować programem obsługującym format zip.
Line 11: Line 11:
Plik wejściowy musi być wcześniej podzielony na zdania (oddzielone dwoma końcami wiersza) i wyrazy zgodnie z regułami podziału stosowanymi w korpusie NKJP. Plik wejściowy musi być wcześniej podzielony na zdania (oddzielone dwoma końcami wiersza) i wyrazy zgodnie z regułami podziału stosowanymi w korpusie NKJP. Tagger uzyskuje średni wynik około 88% poprawnych znaczników; nie dokonuje lematyzacji.

TnT

Tu można pobrać utworzony z ręcznie anotowanego podkorpusu milionowego NKJP model dla taggera TnT tagger. Model udostępniony jest na licencji w stylu BSD. Pobrany plik należy zdekompresować programem obsługującym format zip.

Uwaga: aby skorzystać z taggera, należy uzyskać jego kopię od autora. Uruchomienie taggera:

tnt nkjp <nazwa_pliku>

Plik wejściowy musi być wcześniej podzielony na zdania (oddzielone dwoma końcami wiersza) i wyrazy zgodnie z regułami podziału stosowanymi w korpusie NKJP. Tagger uzyskuje średni wynik około 88% poprawnych znaczników; nie dokonuje lematyzacji.