mirror of
https://github.com/KevinMidboe/linguist.git
synced 2025-10-29 09:40:21 +00:00
* * add CoNLL-U format - add to languages.yml - add textmate grammar - add to vendor/README - add to grammars.yml - add samples * rm other extensions as I couldn't find properly licensed examples of them in the wild * substitutesamples for something with appropriate license * update grammar submodule so it finds the LICENSE * add license to grammar * * conllu - readd other extensions - abridge samples and a new one - update grammar submodule: correct extension of grammar file * rm .conllx extension
122 lines
7.0 KiB
Plaintext
122 lines
7.0 KiB
Plaintext
# sent_id = s1
|
|
# text = ئاسماننى كۆپكۈك، دەريا، كۆل سۇلىرىنى سۈپسۈزۈك تۇرۇشقا، دەل - دەرەخلەرنى بۈك - باراقسان بولۇشقا، ھايۋانلارنى ئەركىن ئازادە ياشاشقا ئىگە قىلىش... بىزنىڭ ئورتاق ئارزۇيىمىز.
|
|
1 ئاسماننى _ NOUN N _ 30 csubj _ Translit=asmanni
|
|
2 كۆپكۈك _ VERB V _ 1 orphan _ SpaceAfter=No|Translit=köpkük
|
|
3 ، _ PUNCT Y _ 2 punct _ Translit=,
|
|
4 دەريا _ NOUN N _ 7 nmod:poss _ SpaceAfter=No|Translit=derya
|
|
5 ، _ PUNCT Y _ 4 punct _ Translit=,
|
|
6 كۆل _ NOUN N _ 4 conj _ Translit=köl
|
|
7 سۇلىرىنى _ NOUN N _ 9 obj _ Translit=sulirini
|
|
8 سۈپسۈزۈك _ ADJ A _ 9 advmod _ Translit=süpsüzük
|
|
9 تۇرۇشقا _ VERB V _ 1 conj _ SpaceAfter=No|Translit=turushqa
|
|
10 ، _ PUNCT Y _ 1 punct _ Translit=,
|
|
11 دەل _ ADV D _ 13 compound:redup _ Translit=del
|
|
12 - _ PUNCT Y _ 11 punct _ Translit=-
|
|
13 دەرەخلەرنى _ NOUN N _ 17 obj _ Translit=derexlerni
|
|
14 بۈك _ ADJ A _ 16 compound _ Translit=bük
|
|
15 - _ PUNCT Y _ 14 punct _ Translit=-
|
|
16 باراقسان _ ADJ A _ 17 advmod _ Translit=baraqsan
|
|
17 بولۇشقا _ VERB V _ 9 orphan _ SpaceAfter=No|Translit=bolushqa
|
|
18 ، _ PUNCT Y _ 17 punct _ Translit=,
|
|
19 ھايۋانلارنى _ NOUN N _ 24 obj _ Translit=haywanlarni
|
|
20 ئەركىن _ ADJ A _ 21 compound:redup _ Translit=erkin
|
|
21 ئازادە _ ADJ A _ 22 advmod _ Translit=azade
|
|
22 ياشاشقا _ NOUN N _ 24 advcl _ Translit=yashashqa
|
|
23 ئىگە _ NOUN N _ 24 compound _ Translit=ige
|
|
24 قىلىش _ VERB V _ 1 conj _ SpaceAfter=No|Translit=qilish
|
|
25 . _ PUNCT Y _ 1 punct _ SpaceAfter=No|Translit=.
|
|
26 . _ PUNCT Y _ 1 punct _ SpaceAfter=No|Translit=.
|
|
27 . _ PUNCT Y _ 1 punct _ Translit=.
|
|
28 بىزنىڭ _ PRON P _ 30 nmod:poss _ Translit=bizning
|
|
29 ئورتاق _ ADJ A _ 30 amod _ Translit=ortaq
|
|
30 ئارزۇيىمىز _ NOUN N _ 0 root _ SpaceAfter=No|Translit=arzuyimiz
|
|
31 . _ PUNCT Y _ 30 punct _ Translit=.
|
|
|
|
# sent_id = s2
|
|
# text = بۇ بۆلەكتىكى تېكىستلەرنى ئوقۇش ئارقىلىق، كىشىلەرنىڭ ھايۋانلار ۋە ئۆسۈملۈكلەرگە قانداق مۇئامىلە قىلغانلىقى، ئاقىۋىتىنىڭ قانداق بولغانلىقىنى كۆرۈپ باقايلى،
|
|
1 بۇ _ PRON P _ 2 det _ Translit=bu
|
|
2 بۆلەكتىكى _ NOUN N _ 3 nmod _ Translit=bölektiki
|
|
3 تېكىستلەرنى _ NOUN N _ 4 obj _ Translit=tëkistlerni
|
|
4 ئوقۇش _ VERB V _ 18 advcl _ Translit=oqush
|
|
5 ئارقىلىق _ ADP R _ 4 case _ SpaceAfter=No|Translit=arqiliq
|
|
6 ، _ PUNCT Y _ 5 punct _ Translit=,
|
|
7 كىشىلەرنىڭ _ NOUN N _ 13 nsubj _ Translit=kishilerning
|
|
8 ھايۋانلار _ NOUN N _ 13 obl _ Translit=haywanlar
|
|
9 ۋە _ CCONJ C _ 10 cc _ Translit=we
|
|
10 ئۆسۈملۈكلەرگە _ NOUN N _ 8 conj _ Translit=ösümlüklerge
|
|
11 قانداق _ PRON P _ 13 advmod _ Translit=qandaq
|
|
12 مۇئامىلە _ NOUN N _ 13 compound _ Translit=muamile
|
|
13 قىلغانلىقى _ VERB V _ 18 conj _ SpaceAfter=No|Translit=qilghanliqi
|
|
14 ، _ PUNCT Y _ 13 punct _ Translit=,
|
|
15 ئاقىۋىتىنىڭ _ NOUN N _ 17 nsubj _ Translit=aqiwitining
|
|
16 قانداق _ PRON P _ 17 advmod _ Translit=qandaq
|
|
17 بولغانلىقىنى _ VERB V _ 18 obj _ Translit=bolghanliqini
|
|
18 كۆرۈپ _ VERB V _ 0 root _ Translit=körüp
|
|
19 باقايلى _ VERB V _ 18 aux _ SpaceAfter=No|Translit=baqayli
|
|
20 ، _ PUNCT Y _ 19 punct _ Translit=,
|
|
|
|
# sent_id = s3
|
|
# text = يەنە ئەتراپىمىزدىكى مۇھىتنى ياخشى كۆزىتىپ، مۇھىتنى قوغداش ئۈچۈن نېمىلەرنى قىلالايدىغانلىقىمىز توغرۇلۇق ئويلىنىپ باقايلى.
|
|
1 يەنە _ ADV D _ 13 cc _ Translit=yene
|
|
2 ئەتراپىمىزدىكى _ NOUN N _ 3 amod _ Translit=etrapimizdiki
|
|
3 مۇھىتنى _ NOUN N _ 5 obj _ Translit=muhitni
|
|
4 ياخشى _ ADJ A _ 5 advmod _ Translit=yaxshi
|
|
5 كۆزىتىپ _ VERB V _ 13 advcl _ SpaceAfter=No|Translit=közitip
|
|
6 ، _ PUNCT Y _ 5 punct _ Translit=,
|
|
7 مۇھىتنى _ NOUN N _ 8 obj _ Translit=muhitni
|
|
8 قوغداش _ VERB V _ 11 advcl _ Translit=qoghdash
|
|
9 ئۈچۈن _ CCONJ C _ 8 case _ Translit=üchün
|
|
10 نېمىلەرنى _ PRON P _ 11 obj _ Translit=nëmilerni
|
|
11 قىلالايدىغانلىقىمىز _ VERB V _ 13 obj _ Translit=qilalaydighanliqimiz
|
|
12 توغرۇلۇق _ ADP R _ 11 case _ Translit=toghruluq
|
|
13 ئويلىنىپ _ VERB V _ 0 root _ Translit=oylinip
|
|
14 باقايلى _ VERB V _ 13 aux _ SpaceAfter=No|Translit=baqayli
|
|
15 . _ PUNCT Y _ 14 punct _ Translit=.
|
|
|
|
# sent_id = s4
|
|
# text = بىر يىلى باھار كۈنلىرىنىڭ بىرىدە، شىۋېتسارىيىنىڭ بىر ۋوگزالىدا ھاۋا تەڭشىگۈچ ئورنىتىلغان چىرايلىق، ئازادە بىر پويىز قوزغىلىش ئالدىدا تۇراتتى.
|
|
1 بىر _ NUM M _ 2 nummod _ Translit=bir
|
|
2 يىلى _ NOUN N _ 20 nmod:tmod _ Translit=yili
|
|
3 باھار _ NOUN N _ 4 nmod:poss _ Translit=bahar
|
|
4 كۈنلىرىنىڭ _ NOUN N _ 5 nmod:part _ Translit=künlirining
|
|
5 بىرىدە _ NUM M _ 20 nmod:tmod _ SpaceAfter=No|Translit=biride
|
|
6 ، _ PUNCT Y _ 5 punct _ Translit=,
|
|
7 شىۋېتسارىيىنىڭ _ NOUN N _ 9 nmod:poss _ Translit=shiwëtsariyining
|
|
8 بىر _ NUM M _ 9 det _ Translit=bir
|
|
9 ۋوگزالىدا _ NOUN N _ 20 obl _ Translit=wogzalida
|
|
10 ھاۋا _ NOUN N _ 11 compound _ Translit=hawa
|
|
11 تەڭشىگۈچ _ NOUN N _ 12 nsubj _ Translit=tengshigüch
|
|
12 ئورنىتىلغان _ NOUN N _ 17 amod _ Translit=ornitilghan
|
|
13 چىرايلىق _ ADJ A _ 17 amod _ SpaceAfter=No|Translit=chirayliq
|
|
14 ، _ PUNCT Y _ 13 punct _ Translit=,
|
|
15 ئازادە _ ADJ A _ 13 conj _ Translit=azade
|
|
16 بىر _ NUM M _ 17 det _ Translit=bir
|
|
17 پويىز _ NOUN N _ 20 nsubj _ Translit=poyiz
|
|
18 قوزغىلىش _ VERB V _ 19 nmod:poss _ Translit=qozghilish
|
|
19 ئالدىدا _ NOUN N _ 20 obl _ Translit=aldida
|
|
20 تۇراتتى _ VERB V _ 0 root _ SpaceAfter=No|Translit=turatti
|
|
21 . _ PUNCT Y _ 20 punct _ Translit=.
|
|
|
|
# sent_id = s5
|
|
# text = ۋوگزال سۇپىسى ئۇزاتقۇچىلار بىلەن تولۇپ كەتكەنىدى.
|
|
1 ۋوگزال _ NOUN N _ 2 nmod:poss _ Translit=wogzal
|
|
2 سۇپىسى _ NOUN N _ 5 nsubj _ Translit=supisi
|
|
3 ئۇزاتقۇچىلار _ NOUN N _ 5 obl _ Translit=uzatquchilar
|
|
4 بىلەن _ ADP R _ 3 case _ Translit=bilen
|
|
5 تولۇپ _ VERB V _ 0 root _ Translit=tolup
|
|
6 كەتكەنىدى _ VERB V _ 5 aux _ SpaceAfter=No|Translit=ketkenidi
|
|
7 . _ PUNCT Y _ 6 punct _ Translit=.
|
|
|
|
# sent_id = s6
|
|
# text = ئۇلارنىڭ ئۇزاتماقچى بولغىنى ئۆزگىچە مىھمان - قارلىغاچلار ئىدى.
|
|
1 ئۇلارنىڭ _ PRON P _ 2 nsubj _ Translit=ularning
|
|
2 ئۇزاتماقچى _ NOUN N _ 5 acl _ Translit=uzatmaqchi
|
|
3 بولغىنى _ AUX V _ 2 cop _ Translit=bolghini
|
|
4 ئۆزگىچە _ ADJ A _ 5 amod _ Translit=özgiche
|
|
5 مىھمان _ NOUN N _ 7 appos _ Translit=mihman
|
|
6 - _ PUNCT Y _ 5 punct _ Translit=-
|
|
7 قارلىغاچلار _ NOUN N _ 0 root _ Translit=qarlighachlar
|
|
8 ئىدى _ AUX V _ 7 cop _ SpaceAfter=No|Translit=idi
|
|
9 . _ PUNCT Y _ 8 punct _ Translit=.
|
|
|