Files
linguist/samples/CoNLL-U/ug-ud-test-abridged.conllu
bruno cuconato 1bbcfa5683 add CoNLL-U format (#4029)
* * add CoNLL-U format
- add to languages.yml
- add textmate grammar
  - add to vendor/README
  - add to grammars.yml
- add samples

* rm other extensions as I couldn't find properly licensed examples of them in the wild

* substitutesamples for something with appropriate license

* update grammar submodule so it finds the LICENSE

* add license to grammar

* * conllu
- readd other extensions
- abridge samples and a new one
- update grammar submodule: correct extension of grammar file

* rm .conllx extension
2018-02-21 15:27:32 +00:00

122 lines
7.0 KiB
Plaintext

# sent_id = s1
# text = ئاسماننى كۆپكۈك، دەريا، كۆل سۇلىرىنى سۈپسۈزۈك تۇرۇشقا، دەل - دەرەخلەرنى بۈك - باراقسان بولۇشقا، ھايۋانلارنى ئەركىن ئازادە ياشاشقا ئىگە قىلىش... بىزنىڭ ئورتاق ئارزۇيىمىز.
1 ئاسماننى _ NOUN N _ 30 csubj _ Translit=asmanni
2 كۆپكۈك _ VERB V _ 1 orphan _ SpaceAfter=No|Translit=köpkük
3 ، _ PUNCT Y _ 2 punct _ Translit=,
4 دەريا _ NOUN N _ 7 nmod:poss _ SpaceAfter=No|Translit=derya
5 ، _ PUNCT Y _ 4 punct _ Translit=,
6 كۆل _ NOUN N _ 4 conj _ Translit=köl
7 سۇلىرىنى _ NOUN N _ 9 obj _ Translit=sulirini
8 سۈپسۈزۈك _ ADJ A _ 9 advmod _ Translit=süpsüzük
9 تۇرۇشقا _ VERB V _ 1 conj _ SpaceAfter=No|Translit=turushqa
10 ، _ PUNCT Y _ 1 punct _ Translit=,
11 دەل _ ADV D _ 13 compound:redup _ Translit=del
12 - _ PUNCT Y _ 11 punct _ Translit=-
13 دەرەخلەرنى _ NOUN N _ 17 obj _ Translit=derexlerni
14 بۈك _ ADJ A _ 16 compound _ Translit=bük
15 - _ PUNCT Y _ 14 punct _ Translit=-
16 باراقسان _ ADJ A _ 17 advmod _ Translit=baraqsan
17 بولۇشقا _ VERB V _ 9 orphan _ SpaceAfter=No|Translit=bolushqa
18 ، _ PUNCT Y _ 17 punct _ Translit=,
19 ھايۋانلارنى _ NOUN N _ 24 obj _ Translit=haywanlarni
20 ئەركىن _ ADJ A _ 21 compound:redup _ Translit=erkin
21 ئازادە _ ADJ A _ 22 advmod _ Translit=azade
22 ياشاشقا _ NOUN N _ 24 advcl _ Translit=yashashqa
23 ئىگە _ NOUN N _ 24 compound _ Translit=ige
24 قىلىش _ VERB V _ 1 conj _ SpaceAfter=No|Translit=qilish
25 . _ PUNCT Y _ 1 punct _ SpaceAfter=No|Translit=.
26 . _ PUNCT Y _ 1 punct _ SpaceAfter=No|Translit=.
27 . _ PUNCT Y _ 1 punct _ Translit=.
28 بىزنىڭ _ PRON P _ 30 nmod:poss _ Translit=bizning
29 ئورتاق _ ADJ A _ 30 amod _ Translit=ortaq
30 ئارزۇيىمىز _ NOUN N _ 0 root _ SpaceAfter=No|Translit=arzuyimiz
31 . _ PUNCT Y _ 30 punct _ Translit=.
# sent_id = s2
# text = بۇ بۆلەكتىكى تېكىستلەرنى ئوقۇش ئارقىلىق، كىشىلەرنىڭ ھايۋانلار ۋە ئۆسۈملۈكلەرگە قانداق مۇئامىلە قىلغانلىقى، ئاقىۋىتىنىڭ قانداق بولغانلىقىنى كۆرۈپ باقايلى،
1 بۇ _ PRON P _ 2 det _ Translit=bu
2 بۆلەكتىكى _ NOUN N _ 3 nmod _ Translit=bölektiki
3 تېكىستلەرنى _ NOUN N _ 4 obj _ Translit=tëkistlerni
4 ئوقۇش _ VERB V _ 18 advcl _ Translit=oqush
5 ئارقىلىق _ ADP R _ 4 case _ SpaceAfter=No|Translit=arqiliq
6 ، _ PUNCT Y _ 5 punct _ Translit=,
7 كىشىلەرنىڭ _ NOUN N _ 13 nsubj _ Translit=kishilerning
8 ھايۋانلار _ NOUN N _ 13 obl _ Translit=haywanlar
9 ۋە _ CCONJ C _ 10 cc _ Translit=we
10 ئۆسۈملۈكلەرگە _ NOUN N _ 8 conj _ Translit=ösümlüklerge
11 قانداق _ PRON P _ 13 advmod _ Translit=qandaq
12 مۇئامىلە _ NOUN N _ 13 compound _ Translit=muamile
13 قىلغانلىقى _ VERB V _ 18 conj _ SpaceAfter=No|Translit=qilghanliqi
14 ، _ PUNCT Y _ 13 punct _ Translit=,
15 ئاقىۋىتىنىڭ _ NOUN N _ 17 nsubj _ Translit=aqiwitining
16 قانداق _ PRON P _ 17 advmod _ Translit=qandaq
17 بولغانلىقىنى _ VERB V _ 18 obj _ Translit=bolghanliqini
18 كۆرۈپ _ VERB V _ 0 root _ Translit=körüp
19 باقايلى _ VERB V _ 18 aux _ SpaceAfter=No|Translit=baqayli
20 ، _ PUNCT Y _ 19 punct _ Translit=,
# sent_id = s3
# text = يەنە ئەتراپىمىزدىكى مۇھىتنى ياخشى كۆزىتىپ، مۇھىتنى قوغداش ئۈچۈن نېمىلەرنى قىلالايدىغانلىقىمىز توغرۇلۇق ئويلىنىپ باقايلى.
1 يەنە _ ADV D _ 13 cc _ Translit=yene
2 ئەتراپىمىزدىكى _ NOUN N _ 3 amod _ Translit=etrapimizdiki
3 مۇھىتنى _ NOUN N _ 5 obj _ Translit=muhitni
4 ياخشى _ ADJ A _ 5 advmod _ Translit=yaxshi
5 كۆزىتىپ _ VERB V _ 13 advcl _ SpaceAfter=No|Translit=közitip
6 ، _ PUNCT Y _ 5 punct _ Translit=,
7 مۇھىتنى _ NOUN N _ 8 obj _ Translit=muhitni
8 قوغداش _ VERB V _ 11 advcl _ Translit=qoghdash
9 ئۈچۈن _ CCONJ C _ 8 case _ Translit=üchün
10 نېمىلەرنى _ PRON P _ 11 obj _ Translit=nëmilerni
11 قىلالايدىغانلىقىمىز _ VERB V _ 13 obj _ Translit=qilalaydighanliqimiz
12 توغرۇلۇق _ ADP R _ 11 case _ Translit=toghruluq
13 ئويلىنىپ _ VERB V _ 0 root _ Translit=oylinip
14 باقايلى _ VERB V _ 13 aux _ SpaceAfter=No|Translit=baqayli
15 . _ PUNCT Y _ 14 punct _ Translit=.
# sent_id = s4
# text = بىر يىلى باھار كۈنلىرىنىڭ بىرىدە، شىۋېتسارىيىنىڭ بىر ۋوگزالىدا ھاۋا تەڭشىگۈچ ئورنىتىلغان چىرايلىق، ئازادە بىر پويىز قوزغىلىش ئالدىدا تۇراتتى.
1 بىر _ NUM M _ 2 nummod _ Translit=bir
2 يىلى _ NOUN N _ 20 nmod:tmod _ Translit=yili
3 باھار _ NOUN N _ 4 nmod:poss _ Translit=bahar
4 كۈنلىرىنىڭ _ NOUN N _ 5 nmod:part _ Translit=künlirining
5 بىرىدە _ NUM M _ 20 nmod:tmod _ SpaceAfter=No|Translit=biride
6 ، _ PUNCT Y _ 5 punct _ Translit=,
7 شىۋېتسارىيىنىڭ _ NOUN N _ 9 nmod:poss _ Translit=shiwëtsariyining
8 بىر _ NUM M _ 9 det _ Translit=bir
9 ۋوگزالىدا _ NOUN N _ 20 obl _ Translit=wogzalida
10 ھاۋا _ NOUN N _ 11 compound _ Translit=hawa
11 تەڭشىگۈچ _ NOUN N _ 12 nsubj _ Translit=tengshigüch
12 ئورنىتىلغان _ NOUN N _ 17 amod _ Translit=ornitilghan
13 چىرايلىق _ ADJ A _ 17 amod _ SpaceAfter=No|Translit=chirayliq
14 ، _ PUNCT Y _ 13 punct _ Translit=,
15 ئازادە _ ADJ A _ 13 conj _ Translit=azade
16 بىر _ NUM M _ 17 det _ Translit=bir
17 پويىز _ NOUN N _ 20 nsubj _ Translit=poyiz
18 قوزغىلىش _ VERB V _ 19 nmod:poss _ Translit=qozghilish
19 ئالدىدا _ NOUN N _ 20 obl _ Translit=aldida
20 تۇراتتى _ VERB V _ 0 root _ SpaceAfter=No|Translit=turatti
21 . _ PUNCT Y _ 20 punct _ Translit=.
# sent_id = s5
# text = ۋوگزال سۇپىسى ئۇزاتقۇچىلار بىلەن تولۇپ كەتكەنىدى.
1 ۋوگزال _ NOUN N _ 2 nmod:poss _ Translit=wogzal
2 سۇپىسى _ NOUN N _ 5 nsubj _ Translit=supisi
3 ئۇزاتقۇچىلار _ NOUN N _ 5 obl _ Translit=uzatquchilar
4 بىلەن _ ADP R _ 3 case _ Translit=bilen
5 تولۇپ _ VERB V _ 0 root _ Translit=tolup
6 كەتكەنىدى _ VERB V _ 5 aux _ SpaceAfter=No|Translit=ketkenidi
7 . _ PUNCT Y _ 6 punct _ Translit=.
# sent_id = s6
# text = ئۇلارنىڭ ئۇزاتماقچى بولغىنى ئۆزگىچە مىھمان - قارلىغاچلار ئىدى.
1 ئۇلارنىڭ _ PRON P _ 2 nsubj _ Translit=ularning
2 ئۇزاتماقچى _ NOUN N _ 5 acl _ Translit=uzatmaqchi
3 بولغىنى _ AUX V _ 2 cop _ Translit=bolghini
4 ئۆزگىچە _ ADJ A _ 5 amod _ Translit=özgiche
5 مىھمان _ NOUN N _ 7 appos _ Translit=mihman
6 - _ PUNCT Y _ 5 punct _ Translit=-
7 قارلىغاچلار _ NOUN N _ 0 root _ Translit=qarlighachlar
8 ئىدى _ AUX V _ 7 cop _ SpaceAfter=No|Translit=idi
9 . _ PUNCT Y _ 8 punct _ Translit=.