Kas ir atsauces izteiksme?

Atsauces izteiciens ir jebkurš vārds vai frāze, kuras mērķis ir identificēt konkrētu personu, vietu vai lietu. Parasti tas ir lietvārds, lietvārda frāze vai vietniekvārds. Lingvistikā atsauces izteicienu identificēšana un to saistība ar reālās pasaules objektiem, uz kuriem tie attiecas, ir daļa no pragmatikas pētījuma, kas apraksta attiecības starp valodu un reālajām situācijām, kuras apraksta valoda. Atsauces izteiksmju ģenerēšana ir dabiskās valodas ģenerēšanas apakšlauks, kas izmanto datorus, lai izveidotu tekstu, kas pēc iespējas precīzāk atdarina cilvēka valodu.

Gramatikas ziņā visi lietvārdi attiecas uz cilvēkiem, vietām, lietām vai idejām, bet ne visi no tiem ir atsauces izteicieni. Piemēram, teikumā “Bīgls ir suņu šķirne” ir trīs lietvārdi: “bīgls”, “šķirne” un “suns”. Tomēr katrs no tiem attiecas uz lietu klasi, nevis uz kādu konkrētu lietu, un tāpēc neviens no tiem neattiecas uz izteicieniem. Lai to formulētu citādi, teikuma mērķis ir sniegt informāciju par bīgli kopumā, nevis vērst lasītāja uzmanību uz konkrētu bīgli. No otras puses, teikumā “Tas suns ir bīgls” “tas suns” ir atsauces izteiciens, jo tas norāda uz konkrētu suni un sniedz informāciju par to.

Angļu valodā atsauces izteiciens bieži satur noteiktu artikulu “the” vai demonstrējošu vietniekvārdu, piemēram, “that” vai “thes”, lai šī frāze noteiktu objektu atšķir no visiem citiem līdzīgiem objektiem. Piemēram, frāze “šis mamuts” skaidri norādītu uz konkrētu mamutu un tādējādi būtu atsaucīgs izteiciens, savukārt “mamuts” to nedarītu. Tomēr dažkārt ar viena teikuma gramatisko struktūru nepietiek, lai noteiktu, vai frāze ir atsauces izteiciens. Teikumā “Mamuts ēda galvenokārt zāles” “mamuts” var attiekties uz konkrētu mamutu vai arī tas var būt mamutu apraksts kopumā, atkarībā no tā konteksta.

Viens praktisks pragmatikas pielietojums ir dabiskās valodas ģenerēšana. Lai izveidotu atsauces izteicienus, kas skaidri un nepārprotami norāda paredzēto referentu, dabiskās valodas programmētājiem ir jāņem vērā gan gramatiskās, gan kontekstuālās problēmas. Piemēram, datorizētā valodā, piemēram, cilvēku valodā, nevajadzētu ietvert vietniekvārdus, kas gramatiski vai loģiski varētu atsaukties uz vairāk nekā vienu lietvārdu vai reālās pasaules objektu. Tādā veidā atsauces izteiksmes ģenerēšana ir anaforas izšķirtspējas otrā puse, kas izmanto dažādus algoritmus, lai noteiktu vietniekvārdu atsauces datora vai cilvēka ģenerētā tekstā.