«ԿԻՒԼՊԷՆԿԵԱՆ» ՀԻՄՆԱՐԿԻՆ ԿՈՂՄԷ ՆՈՐ ԾՐԱԳԻՐ

Լիզպոնի «Գալուստ Կիւլպէնկեան» հիմնարկի Հայկական համայնքներու բաժանմունքը ուրախ է յայտարարելու, որ Արեւմտահայերէնի Ծառադարանը (Treebank) թողարկուեցաւ 15 մայիս 2021-ին եւ այժմ առկայ է «Universal Dependencies Consortium»ին մէջ։

Ծառադարանները անհրաժեշտ գործիքներ են լեզուի մը կենսունակութիւնը ապահովելու համար. անոնք կ՚երաշխաւորեն, որ լեզուաբանական եւ թեքնաբանական գիտութիւններու ոլորտներուն մէջ լեզուն քայլ պահէ արդի զարգացումներուն հետ։ Ծառադարաններու շնորհիւ, համակարգչային ծրագիրներ կը «մարզուին», որպէսզի ճանչնան նախադասութեան մը քերականական եւ լեզուական տարբեր տարրերը. այսինքն՝ ծրագիրը կը ճանչնայ բայը, գոյականը, առոգանութեան եւ կէտադրութեան նշանները եւ աւելին։ Ծառադարանները քերականական մանրամասն ծանօթագրութիւններով օժտուած նախադասութիւններու շտեմարաններ են: Անոնց շնորհիւ յեղափոխութիւն մը տեղի ունեցաւ իննսունական թուականներուն միջազգային Բնական լեզուի մշակումի ոլորտին մէջ։

Ծառադարանները կենսական դեր կը խաղան լեզուաբանական ժամանակակից մշակումի համակարգերու մէջ. օրինակ՝ համակարգչային մեքենայական թարգմանութիւններ, իմաստաբանական վերլուծիչներ, լեզուին բաղադրիչ մասնիկներու ծանօթագրութիւններ եւ այլն: Բաժանմունքի տնօրէն Ռազմիկ Փանոսեան կը բացատրէ՝ «որպէսզի լեզու մը ուղղագրութիւն եւ քերականութիւն սրբագրելու գործիքներ ունենայ, կամ մեքենայական թարգմանութեան հնարաւորութիւնը իրականացնէ, այդ լեզուն պէտք է Ծառադարան մը ունենայ։ Ուրախ ենք, որ Հիմնարկը կենսական դեր խաղաց այս ժամանակակից գործիքը ի սպաս դնելու անոնց, որոնք կը փափաքին լեզուի եւ արհեստագիտութեան ոլորտին մէջ աշխատիլ»։

«Universal Dependencies» ծրագիր մըն է, որ տարբեր լեզուներու համար միջլեզուական հասարակաց Ծառադարաններ կը մշակէ, որուն այժմ մաս կը կազմեն թէ՛ արեւելահայերէնը եւ թէ՛ արեւմտահայերէնը։ Այս ծրագիրը այլազան լեզուներու հասարակաց շարահիւսութիւնները կը ճանչնայ եւ կը ծանօթագրէ, արտօնելով նաեւ լեզուական իւրայատկութիւններու ծանօթագրութիւնները։

Այս նոր Ծառադարանը մշակած է «ArmTDP» խումբը՝ համաղեկավարութեամբ Մարատ Եաւրումեանի (Երեւանի Պետական համալսարան) եւ Հրանդ Խաչատրեանի («ԵրեւանԷՆ YerevaNN» հետազօտական կեդրոն), եւ հիմնուած է «Հայերէնի շարահիւսական ծառերու UD դարան»ի արեւմտահայերէնի բաժինին վրայ։ Արեւմտահայերէնի Ծառադարանը կ՚աւելնայ 114 տարբեր լեզուներով 202 ծառադարաններուն շարքին։ Ծառադարանը ամբողջութեամբ նոր պատրաստուած է, ուրեմն Բնական լեզուի մշակումի ոլորտին մէջ արեւմտահայերէնի համար ստեղծուող որեւէ գործիքի հիմքը կրնայ հանդիսանալ։ 2021-ի աւարտին, պիտի թողարկուի Ծառադարանին թարմացուած եւ ընդլայնուած տարբերակը։

Արեւմտահայերէնի Ծառադարանը այժմ կը պարունակէ 1780 նախադասութիւն եւ 7.5 միլիոն բառ. հիմնուած է 50 հեղինակներու 110 գործերուն վրայ, գըր-ւած 1895-էն 2010-ի միջեւ: Զանազան գրական աշխատութիւններ ընդգրկուած են՝ վիպագրութիւն, նամակագրութիւն, ճամբորդական օրագրութիւն, քաղաքական եւ գրական դասախօսութիւններ ու ճառեր, յուշագրութիւն եւ աւելին։ Ան կ՚օգտուի Հայաստանի Ամերիկեան համալսարանի Հայ մատենագրութեան թուանշային գրադարանի շտեմարանէն։

Արեւմտահայերէնի Ծառադարանը եւ իր շնորհիւ մշակուած բոլոր Բնական լեզուի մշակումի գործիքները անհրաժեշտ են, որպէսզի լեզուն օժտուի նորարար միջոցներով եւ քայլ պահէ թեքնաբանական առաջընթացի արդի մակարդակին հետ։

Այս ծրագիրին եւ այլ նախաձեռնութիւններու մասին յաւելեալ տեղեկութիւններու համար այցելել այս կայքէջը https://gulbenkian.pt/armenian-communities եւ անդամագրուիլ մեր լրատուին։

Շաբաթ, Յուլիս 17, 2021