Թեզաուրուսը, գիրք, որտեղ թվարկված են ըստ իմաստային նմանության խմբավորված բառերի ցանկեր (կարող է պարունակել ինչպես հոմանիշներ այնպես էլ հականիշներ)՝ ի հակադրություն բառարանի, որը պարունակում է սահմանումներ և արտասանություններ։ Աշխարհում հայտնի ամենախոշոր թեզաուրուսը Օքսֆորդի անգլերեն բառարանի Պատմական թեզաուրուսն է (Historical Thesaurus of the Oxford English Dictionary), որը պարունակում է ավելի քան 920, 000 բառ։
Մեր ժամանակներում «թեզաուրուս» կոչվող տեղեկատուի նման առաջին աշխատության հեղինակը հին դարերում եղել է Ֆիլոն Բիբլոսցին (կամ Հերեննիուս Ֆիլոնը, 64-141 մ.թ.)։ Հայտնի է նաև թեզաուրուսի բնույթի 4-րդ դարում սանսկրիտով չափածո գրված Ամարակոշա (սանսկրիտ՝ अमरकोश) կամ «Ամարայի բառարանը» աշխատությունը, որը սանսկրիտով գրված առաջին և ամենակարևոր բառարանն է եղել՝ կազմված ջայնիստական կամ բուդդայական իմաստուն Ամարա Սինքհայի կողմից, և պարունակել է ավելի քան 10 հազար բառ։ Ժամանակակից ոճի թեզաուրուսի առաջին օրինակն է Roget's Thesaurus-ը, որը գրվել է 1805 թ. Պիտեր Մարկ Ռոժեի կողմից և հրատարակվել է 1852 թ.։
Թեև թեզաուրուսներում հիմնականում ընդգրկվում են հոմանիշներ, սակայն դրանք չպետք է դիտել որպես առանձին վերցված բառերի բոլոր հոմանիշները բովանդակող բառարաններ։ Թեզաուրուսի հոդվածներն այնպես են կազմված, որ դրանք հնարավորություն են տալիս ընթերցողին հոմանիշների շարքի մեջ ընտրել անհրաժեշտ ճիշտ բառը։ Ի տարբերություն բառարանի, թեզաուրուսի հոդվածները բառերի սահմանում կամ բացատրություն չեն տալիս։
Թեզաուրուս բառը ծագել է 16-րդ դարում նոր լատիներենից՝ իր հերթին ծագելով լատիներենից thesaurus, որը ծագել է հին հունարեն «θησαυρός» (thesauros) բառից, որը նշանակում է մեծ կարևորություն կամ արժեք ունեցող առարկաների հավաքածու։
Հայտնի են տեղեկատվական գիտությունների, գիտական գրադարանների և տեղեկատվական տեխնոլոգիաների մասնագիտացված թեզաուրուսներ, որոնք նախատեսված են որպես տեղեկատուներ։ Դրանք յուրօրինակ վերահսկվող բառադարաններ են, որոնք օգտագործվում են ինդեքսավորման (indexing) և թեգավորման (tagging) համար։ Նման թեզաուրուսները կարող են օգտագործվել որպես առցանց օգտագործվող նյութերի ինդեքսավորման հիմքեր։ Օրինակ Կանադայի թանգարանների ազգային տվյալների շտեմարանի ինդեքսավորման համար օգտագործվում է Արվեստի և ճարտարապետության թեզաուրուսը (Art and Architecture Thesaurus), որը պատկանում է Կանադական մշակութային ժառանգության տեղեկատվական ցանցին (Canadian Heritage Information Network)։
Որպես տեղեկատու ծառայող թեզաուրուսները պետք է այնպիսի կառուցվածք ունենան, որ հասկացությունների միջև եղած կապերը հստակ լինեն։ Արդյունքում դրանք ավելի բարդ են լինում, քան հասարակ վերահսկվող բառադարանների հասկացությունների միջև եղած կապերը, ինչպես օրինակ ստանդարտների կամ նորմատիվային բառարաններում և հոմանիշային շղթաներում (synonym rings) կամ սինսեթերում։ Եզրի յուրաքանչյուր իմաստային տարբերակ դրվում է իրեն բնորոշ ենթատեքստում՝ այդպիսով ընթերցողին թույլ տալով տեսնել տարբերակների միջև եղած իմաստային տարբերությունները, ասենք՝ «բյուրո» որպես գրասենյակ և «բյուրո» որպես կահույքի կտոր։ Ըստ միջազգային ստանդարտների նման թեզաուրուսները սովորաբար կազմակերպվում են ըստ թեմատիկ կամ իմաստային հիերարքիաների կամ աստիճանակարգերի։ Ի տարբերություն գրական թեզաուրուսների այս հատուկ մասնագիտացված թեզաուրուսները սովորաբար կենտրոնանում են միայն մեկ գիտական առարակայի կամ ոլորտի կամ ուսումնասիրության շուրջը։
Տեղեկատվական տեխնոլոգիաներում թեզաուրուսը ներկայացնում է սեմանտիկորեն օրթոգոնալ որոնման բանալիների տվյալների շտեմարան կամ ցանկ։ Արհեստական ինտելեկտի բնագավառում թեզաուրուսը երբեմն կարող է հղվել որպես օնթոլոգիա։
Տեղեկույթի վերականգնման կամ հետկանչի համար ծառայող թեզաուրուսները սովորաբար կառուցվում են տեղեկատվական մասնագետների կողմից և ունեն իրենց սեփական յուրօրինակ բառադարանը, որը սահմանում է տարբեր տեսակի եզրեր և իմաստային կապեր։
Տերմինները կամ եզրերը այն հիմնական իմաստաբանական միավորներն են, որոնք փոխանցում են հայեցակարգերի կամ գաղափարների իմաստը։ Դրանք սովորաբար մեկ բառից կազմված գոյականներն են, իսկ գոյականներն ամենահստակ խոսքի մասերն են։ Տարբեր լեզուներ ունեն քերականական և բառակազմության տարբեր կառուցվածքներ։ Մարդկային լեզուներն իրենց էությամբ կոնցեպտուալ են, ուստի բոլոր մարդկային լեզուներում բայերը կարելի է փոխակերպել գոյականների, օրինակ ինչպես հայերենում. «մաքրել»՝ «մաքրություն», «ջնջել»՝ «ջնջում», «վազել»՝ «վազք», և այլն։ Սակայն ածականներն ու մակբայները հազվադեպ են այնպիսի իմաստ պարունակում, որը կարելի լինել օգտագործել ինդեքսավորման մեջ։ Երբ որևէ եզր բազմիմաստ է, ավելացվում է «սահմանափակող ծանոթագրություն» (scope note)՝ եզրի օգտագործման համատեղելիությունը ապահովելու և եզրի մեկնաբանությանը ուղղություն տալու համար։ Ոչ բոլոր եզրերն ունեն սահմանափակող ծանոթագրության կարիք, բայց դրանց ներկայությունը շատ է օգնում թեզաուրուսը ճիշտ օգտագործելու և իմացության տվյալ ոլորտը ճիշտ ընկալելու համար։
«Եզրային փոխհարաբերությունները» եզրերի միջև եղած կապերն են։ Այդ փոխհարաբերությունները կարող են լինել երեք տեսակի՝ ստորակարգային (հիերարքիկ), համարժեք (էկվիվալենտ) կամ կապակցող (ասոցիատիվ)։
Ըստ 2005 թ.ANSI/NISO Z39.19 ստնդարտի սահմանվում են ուղեցույցներ և ընդունվում որոշակի միջազգային պայմանավորվածություններ բազմալեզու վերահսկվող բառադարանների, այդ թվում նաև ցանկերի, սինոնիմային շղթաների, տաքսոնոմիաների և թեզաուրուսների ձևավորման, կառուցման, փորձարկման, պահպանման և կառավարման համար
Բազնալեզու բառարանների համար կարող է կիրառվել ISO 5964 Guidelines for the establishment and development of multilingual thesauri/ «ISO 5964 Ուղեցույցներ բազմալեզու թեզաուրուսների ստեղծման և զարգացման համար» ստանդարտը։
Տես՝ թեզաուրուսների կառուցման և օգտագործման ձեռնարկ՝ Thesaurus Construction and Use։ a practical manual. Jean Aitchison, Allan Gilchrist and David Bawden. London and New York։ Europa Publications (2000).
|
Այս հոդվածն ընտրվել է Հայերեն Վիքիպեդիայի՝ {{{1}}} թվականի {{{2}}} շաբաթվա հոդված։ |