mirror of
				https://github.com/KevinMidboe/linguist.git
				synced 2025-10-29 17:50:22 +00:00 
			
		
		
		
	* * add CoNLL-U format - add to languages.yml - add textmate grammar - add to vendor/README - add to grammars.yml - add samples * rm other extensions as I couldn't find properly licensed examples of them in the wild * substitutesamples for something with appropriate license * update grammar submodule so it finds the LICENSE * add license to grammar * * conllu - readd other extensions - abridge samples and a new one - update grammar submodule: correct extension of grammar file * rm .conllx extension
		
			
				
	
	
		
			122 lines
		
	
	
		
			7.0 KiB
		
	
	
	
		
			Plaintext
		
	
	
	
	
	
			
		
		
	
	
			122 lines
		
	
	
		
			7.0 KiB
		
	
	
	
		
			Plaintext
		
	
	
	
	
	
| # sent_id = s1
 | |
| # text = ئاسماننى كۆپكۈك، دەريا، كۆل سۇلىرىنى سۈپسۈزۈك تۇرۇشقا، دەل - دەرەخلەرنى بۈك - باراقسان بولۇشقا، ھايۋانلارنى ئەركىن ئازادە ياشاشقا ئىگە قىلىش... بىزنىڭ ئورتاق ئارزۇيىمىز.
 | |
| 1	ئاسماننى	_	NOUN	N	_	30	csubj	_	Translit=asmanni
 | |
| 2	كۆپكۈك	_	VERB	V	_	1	orphan	_	SpaceAfter=No|Translit=köpkük
 | |
| 3	،	_	PUNCT	Y	_	2	punct	_	Translit=,
 | |
| 4	دەريا	_	NOUN	N	_	7	nmod:poss	_	SpaceAfter=No|Translit=derya
 | |
| 5	،	_	PUNCT	Y	_	4	punct	_	Translit=,
 | |
| 6	كۆل	_	NOUN	N	_	4	conj	_	Translit=köl
 | |
| 7	سۇلىرىنى	_	NOUN	N	_	9	obj	_	Translit=sulirini
 | |
| 8	سۈپسۈزۈك	_	ADJ	A	_	9	advmod	_	Translit=süpsüzük
 | |
| 9	تۇرۇشقا	_	VERB	V	_	1	conj	_	SpaceAfter=No|Translit=turushqa
 | |
| 10	،	_	PUNCT	Y	_	1	punct	_	Translit=,
 | |
| 11	دەل	_	ADV	D	_	13	compound:redup	_	Translit=del
 | |
| 12	-	_	PUNCT	Y	_	11	punct	_	Translit=-
 | |
| 13	دەرەخلەرنى	_	NOUN	N	_	17	obj	_	Translit=derexlerni
 | |
| 14	بۈك	_	ADJ	A	_	16	compound	_	Translit=bük
 | |
| 15	-	_	PUNCT	Y	_	14	punct	_	Translit=-
 | |
| 16	باراقسان	_	ADJ	A	_	17	advmod	_	Translit=baraqsan
 | |
| 17	بولۇشقا	_	VERB	V	_	9	orphan	_	SpaceAfter=No|Translit=bolushqa
 | |
| 18	،	_	PUNCT	Y	_	17	punct	_	Translit=,
 | |
| 19	ھايۋانلارنى	_	NOUN	N	_	24	obj	_	Translit=haywanlarni
 | |
| 20	ئەركىن	_	ADJ	A	_	21	compound:redup	_	Translit=erkin
 | |
| 21	ئازادە	_	ADJ	A	_	22	advmod	_	Translit=azade
 | |
| 22	ياشاشقا	_	NOUN	N	_	24	advcl	_	Translit=yashashqa
 | |
| 23	ئىگە	_	NOUN	N	_	24	compound	_	Translit=ige
 | |
| 24	قىلىش	_	VERB	V	_	1	conj	_	SpaceAfter=No|Translit=qilish
 | |
| 25	.	_	PUNCT	Y	_	1	punct	_	SpaceAfter=No|Translit=.
 | |
| 26	.	_	PUNCT	Y	_	1	punct	_	SpaceAfter=No|Translit=.
 | |
| 27	.	_	PUNCT	Y	_	1	punct	_	Translit=.
 | |
| 28	بىزنىڭ	_	PRON	P	_	30	nmod:poss	_	Translit=bizning
 | |
| 29	ئورتاق	_	ADJ	A	_	30	amod	_	Translit=ortaq
 | |
| 30	ئارزۇيىمىز	_	NOUN	N	_	0	root	_	SpaceAfter=No|Translit=arzuyimiz
 | |
| 31	.	_	PUNCT	Y	_	30	punct	_	Translit=.
 | |
| 
 | |
| # sent_id = s2
 | |
| # text = بۇ بۆلەكتىكى تېكىستلەرنى ئوقۇش ئارقىلىق، كىشىلەرنىڭ ھايۋانلار ۋە ئۆسۈملۈكلەرگە قانداق مۇئامىلە قىلغانلىقى، ئاقىۋىتىنىڭ قانداق بولغانلىقىنى كۆرۈپ باقايلى،
 | |
| 1	بۇ	_	PRON	P	_	2	det	_	Translit=bu
 | |
| 2	بۆلەكتىكى	_	NOUN	N	_	3	nmod	_	Translit=bölektiki
 | |
| 3	تېكىستلەرنى	_	NOUN	N	_	4	obj	_	Translit=tëkistlerni
 | |
| 4	ئوقۇش	_	VERB	V	_	18	advcl	_	Translit=oqush
 | |
| 5	ئارقىلىق	_	ADP	R	_	4	case	_	SpaceAfter=No|Translit=arqiliq
 | |
| 6	،	_	PUNCT	Y	_	5	punct	_	Translit=,
 | |
| 7	كىشىلەرنىڭ	_	NOUN	N	_	13	nsubj	_	Translit=kishilerning
 | |
| 8	ھايۋانلار	_	NOUN	N	_	13	obl	_	Translit=haywanlar
 | |
| 9	ۋە	_	CCONJ	C	_	10	cc	_	Translit=we
 | |
| 10	ئۆسۈملۈكلەرگە	_	NOUN	N	_	8	conj	_	Translit=ösümlüklerge
 | |
| 11	قانداق	_	PRON	P	_	13	advmod	_	Translit=qandaq
 | |
| 12	مۇئامىلە	_	NOUN	N	_	13	compound	_	Translit=muamile
 | |
| 13	قىلغانلىقى	_	VERB	V	_	18	conj	_	SpaceAfter=No|Translit=qilghanliqi
 | |
| 14	،	_	PUNCT	Y	_	13	punct	_	Translit=,
 | |
| 15	ئاقىۋىتىنىڭ	_	NOUN	N	_	17	nsubj	_	Translit=aqiwitining
 | |
| 16	قانداق	_	PRON	P	_	17	advmod	_	Translit=qandaq
 | |
| 17	بولغانلىقىنى	_	VERB	V	_	18	obj	_	Translit=bolghanliqini
 | |
| 18	كۆرۈپ	_	VERB	V	_	0	root	_	Translit=körüp
 | |
| 19	باقايلى	_	VERB	V	_	18	aux	_	SpaceAfter=No|Translit=baqayli
 | |
| 20	،	_	PUNCT	Y	_	19	punct	_	Translit=,
 | |
| 
 | |
| # sent_id = s3
 | |
| # text = يەنە ئەتراپىمىزدىكى مۇھىتنى ياخشى كۆزىتىپ، مۇھىتنى قوغداش ئۈچۈن نېمىلەرنى قىلالايدىغانلىقىمىز توغرۇلۇق ئويلىنىپ باقايلى.
 | |
| 1	يەنە	_	ADV	D	_	13	cc	_	Translit=yene
 | |
| 2	ئەتراپىمىزدىكى	_	NOUN	N	_	3	amod	_	Translit=etrapimizdiki
 | |
| 3	مۇھىتنى	_	NOUN	N	_	5	obj	_	Translit=muhitni
 | |
| 4	ياخشى	_	ADJ	A	_	5	advmod	_	Translit=yaxshi
 | |
| 5	كۆزىتىپ	_	VERB	V	_	13	advcl	_	SpaceAfter=No|Translit=közitip
 | |
| 6	،	_	PUNCT	Y	_	5	punct	_	Translit=,
 | |
| 7	مۇھىتنى	_	NOUN	N	_	8	obj	_	Translit=muhitni
 | |
| 8	قوغداش	_	VERB	V	_	11	advcl	_	Translit=qoghdash
 | |
| 9	ئۈچۈن	_	CCONJ	C	_	8	case	_	Translit=üchün
 | |
| 10	نېمىلەرنى	_	PRON	P	_	11	obj	_	Translit=nëmilerni
 | |
| 11	قىلالايدىغانلىقىمىز	_	VERB	V	_	13	obj	_	Translit=qilalaydighanliqimiz
 | |
| 12	توغرۇلۇق	_	ADP	R	_	11	case	_	Translit=toghruluq
 | |
| 13	ئويلىنىپ	_	VERB	V	_	0	root	_	Translit=oylinip
 | |
| 14	باقايلى	_	VERB	V	_	13	aux	_	SpaceAfter=No|Translit=baqayli
 | |
| 15	.	_	PUNCT	Y	_	14	punct	_	Translit=.
 | |
| 
 | |
| # sent_id = s4
 | |
| # text = بىر يىلى باھار كۈنلىرىنىڭ بىرىدە، شىۋېتسارىيىنىڭ بىر ۋوگزالىدا ھاۋا تەڭشىگۈچ ئورنىتىلغان چىرايلىق، ئازادە بىر پويىز قوزغىلىش ئالدىدا تۇراتتى.
 | |
| 1	بىر	_	NUM	M	_	2	nummod	_	Translit=bir
 | |
| 2	يىلى	_	NOUN	N	_	20	nmod:tmod	_	Translit=yili
 | |
| 3	باھار	_	NOUN	N	_	4	nmod:poss	_	Translit=bahar
 | |
| 4	كۈنلىرىنىڭ	_	NOUN	N	_	5	nmod:part	_	Translit=künlirining
 | |
| 5	بىرىدە	_	NUM	M	_	20	nmod:tmod	_	SpaceAfter=No|Translit=biride
 | |
| 6	،	_	PUNCT	Y	_	5	punct	_	Translit=,
 | |
| 7	شىۋېتسارىيىنىڭ	_	NOUN	N	_	9	nmod:poss	_	Translit=shiwëtsariyining
 | |
| 8	بىر	_	NUM	M	_	9	det	_	Translit=bir
 | |
| 9	ۋوگزالىدا	_	NOUN	N	_	20	obl	_	Translit=wogzalida
 | |
| 10	ھاۋا	_	NOUN	N	_	11	compound	_	Translit=hawa
 | |
| 11	تەڭشىگۈچ	_	NOUN	N	_	12	nsubj	_	Translit=tengshigüch
 | |
| 12	ئورنىتىلغان	_	NOUN	N	_	17	amod	_	Translit=ornitilghan
 | |
| 13	چىرايلىق	_	ADJ	A	_	17	amod	_	SpaceAfter=No|Translit=chirayliq
 | |
| 14	،	_	PUNCT	Y	_	13	punct	_	Translit=,
 | |
| 15	ئازادە	_	ADJ	A	_	13	conj	_	Translit=azade
 | |
| 16	بىر	_	NUM	M	_	17	det	_	Translit=bir
 | |
| 17	پويىز	_	NOUN	N	_	20	nsubj	_	Translit=poyiz
 | |
| 18	قوزغىلىش	_	VERB	V	_	19	nmod:poss	_	Translit=qozghilish
 | |
| 19	ئالدىدا	_	NOUN	N	_	20	obl	_	Translit=aldida
 | |
| 20	تۇراتتى	_	VERB	V	_	0	root	_	SpaceAfter=No|Translit=turatti
 | |
| 21	.	_	PUNCT	Y	_	20	punct	_	Translit=.
 | |
| 
 | |
| # sent_id = s5
 | |
| # text = ۋوگزال سۇپىسى ئۇزاتقۇچىلار بىلەن تولۇپ كەتكەنىدى.
 | |
| 1	ۋوگزال	_	NOUN	N	_	2	nmod:poss	_	Translit=wogzal
 | |
| 2	سۇپىسى	_	NOUN	N	_	5	nsubj	_	Translit=supisi
 | |
| 3	ئۇزاتقۇچىلار	_	NOUN	N	_	5	obl	_	Translit=uzatquchilar
 | |
| 4	بىلەن	_	ADP	R	_	3	case	_	Translit=bilen
 | |
| 5	تولۇپ	_	VERB	V	_	0	root	_	Translit=tolup
 | |
| 6	كەتكەنىدى	_	VERB	V	_	5	aux	_	SpaceAfter=No|Translit=ketkenidi
 | |
| 7	.	_	PUNCT	Y	_	6	punct	_	Translit=.
 | |
| 
 | |
| # sent_id = s6
 | |
| # text = ئۇلارنىڭ ئۇزاتماقچى بولغىنى ئۆزگىچە مىھمان - قارلىغاچلار ئىدى.
 | |
| 1	ئۇلارنىڭ	_	PRON	P	_	2	nsubj	_	Translit=ularning
 | |
| 2	ئۇزاتماقچى	_	NOUN	N	_	5	acl	_	Translit=uzatmaqchi
 | |
| 3	بولغىنى	_	AUX	V	_	2	cop	_	Translit=bolghini
 | |
| 4	ئۆزگىچە	_	ADJ	A	_	5	amod	_	Translit=özgiche
 | |
| 5	مىھمان	_	NOUN	N	_	7	appos	_	Translit=mihman
 | |
| 6	-	_	PUNCT	Y	_	5	punct	_	Translit=-
 | |
| 7	قارلىغاچلار	_	NOUN	N	_	0	root	_	Translit=qarlighachlar
 | |
| 8	ئىدى	_	AUX	V	_	7	cop	_	SpaceAfter=No|Translit=idi
 | |
| 9	.	_	PUNCT	Y	_	8	punct	_	Translit=.
 | |
| 
 |