ΤΟ ΚΟΥΔΟΥΝΙ

Υπάρχουν εκείνοι που διαβάζουν αυτές τις ειδήσεις πριν από εσάς.
Εγγραφείτε για να λαμβάνετε τα πιο πρόσφατα άρθρα.
ΗΛΕΚΤΡΟΝΙΚΗ ΔΙΕΥΘΥΝΣΗ
Ονομα
Επώνυμο
Πώς θα θέλατε να διαβάσετε το The Bell
Χωρίς ανεπιθύμητο περιεχόμενο

Υπό θησαυρόςνοείται ως ένα σύνθετο στοιχείο του τύπου λεξικού, στο οποίο όλες οι έννοιες του λεξικού διασυνδέονται με σημασιολογικές σχέσεις που αντικατοπτρίζουν τις κύριες σχέσεις των εννοιών στην περιγραφόμενη θεματική περιοχή γνώσης. Στο παρελθόν, ο όρος θησαυρός δήλωνε κυρίως λεξικά που αντιπροσώπευαν το λεξιλόγιο της γλώσσας με τη μέγιστη πληρότητα με παραδείγματα χρήσης του σε κείμενα.

Ο θησαυρός περιλαμβάνει μάρκεςπου σχετίζονται με τα τέσσερα μέρη του λόγου: επίθετο, ουσιαστικό, ρήμα και επίρρημα. Οι περιγραφές που αντιστοιχούν σε κάθε μέρος του λόγου έχουν διαφορετική δομή.

Οι κύριες σχέσεις στον θησαυρό είναι:

  • συνωνυμία- μια σύνδεση μεταξύ λέξεων του ίδιου μέρους της ομιλίας, διαφορετικών ως προς τον ήχο και την ορθογραφία, αλλά με την ίδια ή πολύ στενή λεξική σημασία, για παράδειγμα: ιππικό - ιππικό, γενναίος - γενναίος.
  • αντωνυμία- η σύνδεση μεταξύ των λέξεων ενός μέρους της ομιλίας, διαφορετικών στον ήχο, που έχουν ακριβώς αντίθετες έννοιες: αλήθεια - ψέματα, καλό - κακό.
  • υποωνυμία / υπερνυμία. Υπερώνυμο- μια λέξη με περισσότερα ευρύ νόημα, που εκφράζει μια γενική, γενική έννοια, το όνομα μιας κλάσης (συνόλου) αντικειμένων (ιδιοτήτων, χαρακτηριστικών). Υπώνυμο- μια λέξη με στενότερη σημασία, που ονομάζει ένα αντικείμενο (ιδιότητα, χαρακτηριστικό) ως στοιχείο μιας κλάσης (συνόλου). Αυτές οι σχέσεις είναι μεταβατικές και ασύμμετρες. Το υποώνυμο κληρονομεί όλες τις ιδιότητες του υπερώνυμου. Είναι κεντρικές σχέσεις για την περιγραφή των ουσιαστικών.
  • μερωνυμία/παρτωνυμία- η σχέση «ΜΕΡΟΣ-Ολόκληρο». Μέσα σε αυτή τη σχέση ξεχωρίζουν οι σχέσεις «να είσαι στοιχείο» και «να γίνεις από». Η σχέση ορίζεται μόνο για ουσιαστικά.
  • συνέπεια (αυτή η σχέση συνδέει ρήματα).
  • λόγος (ορίζεται επίσης για ρήματα).

Παράδειγμα Θησαυρού:

Izba - ένα ξύλινο αγροτικό σπίτι [υπερώνυμο]: κτίριο κατοικιών [μερώνυμο]: αγροτικό τοποθεσία[συνώνυμο]: σπίτι

Όλες οι σχέσεις δημιουργούν ένα σύνθετο ιεραρχικό δίκτυο εννοιών και γνωρίζοντας πού βρίσκεται μια έννοια σε αυτό το δίκτυο βρίσκεται σημαντικό σημείογνώση για αυτή την έννοια. Οι ιδιότητες των σχέσεων είναι διαφορετικές όταν περιγράφονται διαφορετικά μέρη του λόγου.

Ένας θησαυρός μπορεί να εκτελέσει διαφορετικές λειτουργίες σε διαφορετικά συστήματα:

  • μια πηγή ειδικής γνώσης σε μια στενή ή ευρεία θεματική περιοχή, ένας τρόπος περιγραφής και οργάνωσης της ορολογίας της θεματικής περιοχής.
  • εργαλείο αναζήτησης σε συστήματα ανάκτησης πληροφοριών.
  • ένα εργαλείο για τη μη αυτόματη ευρετηρίαση εγγράφων σε συστήματα ανάκτησης πληροφοριών (το λεγόμενο λεξικό ελέγχου).
  • εργαλείο δημιουργίας ευρετηρίου κειμένου.

Οι θησαυροί ξεκίνησαν ως εννοιολογικά λεξικά από τον Roger (ή Roget, έναν Άγγλο φυσικό), ο οποίος συστηματοποίησε το λεξιλόγιο της αγγλικής γλώσσαςκατά ομάδες. Κάθε ομάδα αντιπροσωπεύεται από το όνομα μιας έννοιας («κατηγορίες», από τις οποίες αρχικά υπήρχαν χίλιες· αυτές είναι συνηθισμένες λέξεις που βρίσκονται στο αλφαβητική σειρά, για παράδειγμα AFFIRMATION ... AGENCY ...), ακολουθούμενα από τα συνώνυμά του από μέρη του λόγου (ουσιαστικά, ρήματα, επίθετα, επιρρήματα), αντώνυμα και στη συνέχεια λίστες σχετικών λέξεων (υπάρχουν πολλές και μερικές είναι αναφορές στα ονόματα άλλων κατηγοριών, σε καταχώρηση λεξικού των οποίων η λίστα με τους «μακρινούς συγγενείς» μπορεί να συνεχιστεί, για παράδειγμα, από το AGENCY ... βλέπε ΕΠΙΧΕΙΡΗΣΕΙΣ). Από τη δημοσίευση του θησαυρού του Roger το 1852. και εξακολουθεί να επανεκδίδεται μέχρι σήμερα. ΔΙΑΦΟΡΕΤΙΚΟΙ ΤΥΠΟΙκαι για διαφορετικούς χρήστες, ο θησαυρός ενημερώνεται συνεχώς με νέο λεξιλόγιο και συνδέσεις, αλλά το όνομα του δημιουργού της πρώτης έκδοσης παραμένει πίσω από όλες τις επιλογές. Η αξία αυτού του θησαυρού έγκειται στη φυσικότητα του, στο ότι είναι μια περιγραφή ολόκληρου του λεξιλογίου της γλώσσας, και όχι μόνο της ορολογίας, και επίσης στο γεγονός ότι μπορεί να χρησιμοποιηθεί σε συστήματα ανάκτησης πληροφοριών ως μέσο αύξησης της σημασιολογικής δύναμη του συστήματος.

Οι θησαυροί εξακολουθούν να είναι η πιο αποδεκτή μορφή περιγραφής της γνώσης της θεματικής περιοχής, κατάλληλη για την ανθρώπινη αντίληψη. Παραδείγματα σύγχρονων ξένων θησαυρών είναι το WordNet και το EuroWordNet.

Ο αγγλικός θησαυρός WordNet εμφανίστηκε το 1990. και άρχισε να ασχολείται ενεργά με διάφορους τομείς της αυτόματης επεξεργασίας κειμένου. Το WordNet καλύπτει περίπου 100 χιλιάδες διαφορετικές ενότητες (από τις οποίες σχεδόν οι μισές είναι φράσεις), οργανωμένες σε 70.000 έννοιες.

Αυτή τη στιγμή αναπτύσσεται ένας πολύγλωσσος θησαυρός EuroWordNet. Αρχικά, για τέσσερις γλώσσες (δανικά, ιταλικά, ισπανικά και αμερικανικά αγγλικά), αναπτύσσεται ένα δίκτυο σημασιών λέξεων που συνδέεται με σημασιολογικές σχέσεις και επιτρέπει την εύρεση παρόμοιων λέξεων σε διαφορετικές γλώσσες. Σε αντίθεση με τον θησαυρό Roger και το δίκτυο WordNet, που δημιουργήθηκαν για να περιγράψουν το λεξιλογικό και εννοιολογικό σύστημα της αγγλικής γλώσσας, το EuroWordNet δημιουργήθηκε κυρίως για την επίλυση πρακτικών προβλημάτων αυτόματης επεξεργασίας μεγάλων σειρών κειμένων. Οι πιο σημαντικές εργασίες που υποτίθεται ότι θα επιλυθούν με τη βοήθεια αυτού του θησαυρού είναι οι ακόλουθες:

  • παροχή πολυγλωσσικής ανάκτησης πληροφοριών·
  • αύξηση της πληρότητας της ανάκτησης πληροφοριών·
  • διατύπωση ερωτήματος σε φυσική γλώσσα.
  • σημασιολογική ευρετηρίαση εγγράφων κ.λπ.

Εκτός από αυτές τις σχέσεις, εισάγονται και θεματικές σχέσεις που συνδέουν τις έννοιες μιας θεματικής περιοχής. Προβλέπεται επίσης η εισαγωγή ειδικών σημάτων στις σχέσεις μεταξύ των εννοιών, που δηλώνουν διαχωρισμό ή συνδυασμό σχέσεων. Εάν μια έννοια στο δίκτυο έχει πολλές σχέσεις με το ίδιο όνομα, τότε αυτές μπορεί να είναι διαζευκτικές, δηλ. μία από αυτές τις σχέσεις υλοποιείται πραγματικά, ή συνδετικές, δηλ. όλες αυτές οι σχέσεις ισχύουν για την έννοια.

Πάνω από εκατό κλαδικοί θησαυροί έχουν δημιουργηθεί σε εγχώρια ιδρύματα που πληρούν ένα συγκεκριμένο κρατικό πρότυπογια λεξικά αυτού του τύπου. Ονομάζονται έτσι - IPT - θησαυροί ανάκτησης πληροφοριών. Από όλες τις πιθανές σημασιολογικές σχέσεις μεταξύ των εννοιών, τρεις είναι σταθερές σε αυτές: συνώνυμες, γενικές (που συνήθως περιλαμβάνουν τη σχέση «ΜΕΡΙΚΟΣ-Ολόκληρο») και «όλες οι άλλες», που ονομάζονται επίσης συνειρμικές.

Τα τυπικά IPT προορίζονται κυρίως για τη μη αυτόματη ευρετηρίαση εγγράφων, καθώς και για τη διαμόρφωση και την αλλαγή ερωτημάτων αναζήτησης. Υπάρχουν μη τυπικοί θησαυροί, οι οποίοι θέτουν το καθήκον της μάλλον επιλεκτικής συστηματοποίησης της ορολογίας σε ένα συγκεκριμένο πεδίο γνώσης - αυτό ισχύει ιδιαίτερα για νέες θεματικές περιοχές. Υπάρχει μια αυξανόμενη τάση εμπλουτισμού των θησαυρών με ορισμούς όρων, κάτι που είναι σημαντικό για τη διάκριση μεταξύ διφορούμενων όρων, ειδικά στην περίπτωση συναφών κλάδων και όταν υπερβαίνουν τα όρια στενών θεματικών περιοχών.

Τμήμα TAOY KemGUKI

Θησαυροί ανάκτησης πληροφοριών:

δομή, σκοπός και διαδικασία ανάπτυξης

1. Ο θησαυρός ως τρόπος συστηματοποιημένης αναπαράστασης της γνώσης και

είδος ιδεογραφικού λεξικού.

2. Θησαυροί ανάκτησης πληροφοριών: ουσία και σκοπός

3. Δομή του ΙΠΤ

4. Η διαδικασία ανάπτυξης, εξέτασης, καταχώρισης και διατήρησης του IPT.

Βιβλιογραφία

1. GOST 7.74 - 96. Γλώσσες ανάκτησης πληροφοριών. Όροι και ορισμοί [Κείμενο]. - Εισαγωγή. 1997-07-01. - Μινσκ: Διακρατικό Συμβούλιο Τυποποίησης, Μετρολογίας και, 1997. - 34 σ. (Σύστημα προτύπων για πληροφορίες, βιβλιοθηκονομία και εκδόσεις) TC 191.

2. GOST 7.25-2001. Μονόγλωσσος ανάκτηση πληροφοριών θησαυρού. Κανόνες ανάπτυξης, δομή και φόρμα παρουσίασης [Κείμενο]. – GOST 7,25-80; Εισαγωγή 2002-07-01. - M.: IPK Publishing house of standards, 2001. - 16 p. ΜΤΚ 191.

3. GOST 7.24-2007 Πολυγλωσσικός θησαυρός ανάκτησης πληροφοριών. Σύνθεση, δομή και βασικές απαιτήσεις για την κατασκευή. - Αντί για GOST 7.24-90. εισαγωγή. 01-07-2008. / Διακρατικό Συμβούλιο Τυποποίησης, Μετρολογίας και Πιστοποίησης. - Μ.: Standartinform, 2008. - 7 σελ. (Σύστημα προτύπων για την πληροφόρηση, τη βιβλιοθηκονομία και τη δημοσίευση)

4. Baranov, O. S. Ιδεογραφικό λεξικό της ρωσικής γλώσσας / O. S. Baranov. - M.: ETS Publishing House, 1995. - 820 s

5. Zhmailo, S. V. Σχετικά με τον ορισμό του θησαυρού [Κείμενο] / S. V. // NTI. Ser. 1 Οργάνωση και πληροφοριακή εργασία. - 2003. - Αρ. 12. – Σελ.20 – 25.

6. Zhmailo, S. V. Ανάπτυξη σύγχρονων θησαυρών ανάκτησης πληροφοριών [Κείμενο] / S. V. Zhmailo // NTI. Ser. 1 Οργάνωση και μεθοδολογία της πληροφοριακής εργασίας. -2004. - Νο. 1. – Σελ.23 – 31.

Έτσι, στο ιδεογραφικό λεξικό της ρωσικής γλώσσας του O. S. Baranov (4), διακρίνονται 12 ανώτερες ενότητες του ιδεογραφικού λεξικού, μεταξύ των οποίων είναι: "τάξη, φύση, δραστηριότητα, πολιτισμός" κ.λπ., καθένα από τα οποία χωρίζεται σε ομάδες, υποομάδες, τμήματα, τμήματα . Όλες οι λέξεις σε αυτό το λεξικό ομαδοποιούνται σε φωλιές ανάλογα με το νόημά τους και ομαδοποιούνται σύμφωνα με μια συγκεκριμένη έννοια με την οποία συνδέονται συχνότερα με τις σχέσεις των ειδών. Οι φωλιές ομαδοποιούνται σε υποενότητες και ούτω καθεξής. Αυτή τη στιγμή, υπάρχουν 5923 φωλιές στο λεξικό, 7 επίπεδα διαίρεσης (σύμφωνα με το www.rifmovnik.ru/thesaurus.htm από τις 16 Φεβρουαρίου 2010). Ακολουθεί ένα παράδειγμα καταχώρισης λεξικού από αυτό το λεξικό:

178.4.7 άρωμα ▲ - μια ευχάριστη μυρωδιά (για παράδειγμα, η μυρωδιά των λουλουδιών, του γρασιδιού, του σανού. απαλό #. μεθυστικό #). αρωματοποίηση . . . κεχριμπάρι. θυμίαμα.

Ο κωδικός της λέξης "άρωμα" αντικατοπτρίζει την ιδεογραφική ταξινόμηση που γίνεται αποδεκτή σε αυτή τη δεδομένη λέξη, ειδικότερα, τη συσχέτιση αυτής της λέξης με την κατηγορία "178-Αισθήσεις".

Έτσι, οι όροι «θησαυρός», «ιδεογραφικό λεξικό», «λεξικό τύπου θησαυρού» σημαίνουν κατά κύριο λόγο ότι το σύνολο των λέξεων της γλώσσας παρουσιάζεται σε αυτά με τέτοιο τρόπο ώστε μια ομάδα λέξεων περιλαμβάνει λέξεις που έχουν παρόμοια σημασία. . Ο κύριος σκοπός των ιδεογραφικών λεξικών είναι μια συλλογή λεξιλογικών ενοτήτων που ενώνονται με μια κοινή έννοια. Αυτό διευκολύνει τον αναγνώστη να βρει τα καταλληλότερα μέσα για την επαρκή έκφραση της σκέψης και προάγει την ενεργή γνώση της γλώσσας.

Από την ιστορία των θησαυρών

ΜΠΟΥΦΑΝ 2302

σε Κοστούμια

Προϊόντα παλτών

Προϊόντα ραπτικής

n Διπλό σακάκι

Μικτό σακάκι

Αθλητικό μπουφάν

στα μέτρα συσκευασίας

Υπολειπόμενο υλικό

Απόβλητα

Λεξική σημείωση;

Περιγραφείς ή περιγραφείς-συνώνυμα.

Ανώτεροι περιγραφείς.

Κατάντη περιγραφείς?

Συνειρμικοί περιγραφείς;

Περιγραφείς που συνδέονται με άλλα είδη σχέσεων.

Μέσα σε κάθε ομάδα LU που σχετίζεται με έναν περιγραφέα κεφαλής με ένα είδος παραδειγματικής σχέσης, πρέπει να υπάρχει μια αλφαβητική σειρά διάταξης. Για παράδειγμα:

ΑΛΓΟΡΙΘΜΙΚΕΣ ΓΛΩΣΣΕΣ

με αλγοριθμικές γλώσσες

Μηχανοκεντρικές γλώσσες

ειδικές γλώσσες τομέα

στο ΛΟΓΙΣΜΙΚΟ

ΕΠΙΣΗΜΕΣ ΓΛΩΣΣΕΣ

n ΑΥΤΟΚΩΔΙΚΟΙ

έναν ΑΛΓΟΡΙΘΜΟ

ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ πρβλ. τεχνητές γλώσσες

Μια καταχώρηση ascriptor αποτελείται από έναν ascriptor και περιγραφείς ή έναν συνδυασμό περιγραφέων που το αντικαθιστούν κατά την επεξεργασία και την αναζήτηση πληροφοριών. Ακολουθούν παραδείγματα άρθρων ascriptor:

Αλφαριθμητικοί χαρακτήρες

ΙΣΠΑΝΙΚΕΣ ΕΠΙΣΗΜΕΣ ΓΛΩΣΣΕΣ

ΦΥΣΙΚΕΣ ΓΛΩΣΣΕΣ

βλέπε ΑΛΓΟΡΙΘΜΙΚΕΣ ΓΛΩΣΣΕΣ

Μια καταχώρηση λεξικού μπορεί επίσης να περιλαμβάνει:

Πόσο συχνά χρησιμοποιείται ο περιγραφέας;

Κωδικός αριθμός περιγραφέα.

Κωδικός περιγραφής σύμφωνα με το συστηματικό ευρετήριο.

Δείκτες ταξινόμησης;

Πρόσθετα σημασιολογικά και λεξικογραφικά σημεία.

ξένα ισοδύναμα.

Η ποιότητα ενός λεξικοσημασιολογικού ευρετηρίου καθορίζεται από την πληρότητα των λεξικών ενοτήτων που περιλαμβάνονται σε αυτό. νοείται ως η πιθανότητα εισαγωγής στον θησαυρό οποιασδήποτε λέξης με πληροφοριακό νόημα για μια δεδομένη θεματική περιοχή. Η πληρότητα του λεξικοσημασιολογικού ευρετηρίου και, κατά συνέπεια, ολόκληρου του θησαυρού έχει σημαντική επίδραση στα αποτελέσματα της ευρετηρίασης εγγράφων και ερωτημάτων.

Πρόσθετα μέρη μπορεί να περιλαμβάνουν συστηματικά, μεταθετικά, ιεραρχικά και άλλα ευρετήρια και λίστες ειδικών κατηγοριών λεξιλογικών ενοτήτων.

Ένα συστηματικό ευρετήριο είναι ένας δείκτης στον οποίο οι περιγραφείς ομαδοποιούνται σύμφωνα με τις επικεφαλίδες που γίνονται αποδεκτές στο IPT. Ένα συστηματικό ευρετήριο ορίζει τη θεματική κατεύθυνση του θησαυρού, αποκαλύπτει το περιεχόμενό του και αντικατοπτρίζει εκείνους τους κλάδους της επιστήμης και της τεχνολογίας που μπορούν να αναζητηθούν με το ένα ή το άλλο βάθος λεπτομέρειας. Η ανάγκη για αυτό ως μέρος του IPT οφείλεται στο γεγονός ότι δίνει μια οπτική αναπαράσταση του γενική κατάστασηορολογία σε ένα συγκεκριμένο γνωστικό πεδίο, σας επιτρέπει να δημιουργήσετε ένα συνεκτικό ορολογικό μοντέλο και, ει δυνατόν, όλους τους όρους και τις έννοιες που θα πρέπει να βρουν μια θέση στον θησαυρό. Αποσκοπεί στη διευκόλυνση της αναζήτησης όρων κατά τη σύνταξη εικόνων αναζήτησης εγγράφων και ερωτημάτων παραγγέλνοντας ένα σύνολο περιγραφέων και περιγραφέων ανά θέμα.

Το συστηματικό ευρετήριο, στην ουσία, είναι ένα σχήμα ταξινόμησης για την πλήρωση του θησαυρού με ορολογία, καθώς κατασκευάζεται με την παραγγελία ενός συνόλου περιγραφικών σημείων ανάλογα με τις θεματικές περιοχές.

Οι συστηματικοί δείκτες IPT χωρίζονται σε τρεις τύπους:

Θεματικός,

Μικτός.

Αυτή η διαίρεση αντανακλά την αρχή της κατασκευής του σχήματος ταξινόμησης ενός συστηματικού ευρετηρίου.

Οι κύριες λειτουργίες που εκτελεί ο συστηματικός δείκτης του IPT:

Χρήση ως βοηθητικό εργαλείο στην ευρετηρίαση, παρέχοντας, συνολικά, την αναζήτηση περιγραφικών παραμέτρων για έννοιες ευρετηρίασης που δεν αναπαρίστανται ρητά στον θησαυρό (συνάρτηση αναζήτησης).

Χρήση στη διαδικασία διατήρησης ενός θησαυρού (συνάρτηση διατήρησης IPT).

Χρήση ως δομική βάση του IPT, ως διαχείριση της ανάπτυξής του (δομική λειτουργία).

Σύμφωνα με το GOST 7.25-2001 (2), κατά την κατασκευή ενός συστηματικού ευρετηρίου θεματικών και μικτών τύπων στο θεματικό του μέρος, θα πρέπει να χρησιμοποιούνται ρουμπρίκες του διακρατικού διακόπτη NTI ή ενός συγκεκριμένου μηχανισμού ASNTI συμβατού με τον Διακρατικό rubricator NTI. Κατά την κατασκευή ενός συστηματικού ευρετηρίου κατηγορικών και μικτών τύπων, ακολουθούν οι ακόλουθες γενικές κατηγορίες στο κατηγορηματικό μέρος του:

Ονόματα κλάδων και κλάδους δραστηριότητας.

Είδη, υλικά.

Μέθοδοι, διαδικασίες, λειτουργίες, φαινόμενα.

Ιδιότητες, τιμές, παράμετροι, χαρακτηριστικά.

Σχέσεις, δομές, μοντέλα, νόμοι, κανόνες, αφηρημένες έννοιες.

Ιεραρχικό ευρετήριο. Ένα ιεραρχικό ευρετήριο είναι ένα ευρετήριο που δίνει μια λίστα με λίστες περιγραφέων, κάθε λίστα που ξεκινά με έναν περιγραφέα που δεν έχει γονικό. Αντανακλά την πλήρη δομή των ιεραρχικών σχέσεων στο IPT. Μετά από κάθε περιγραφέα, οι περιγραφείς δίνονται απευθείας με ένδειξη του επιπέδου τους στην ιεραρχία χρησιμοποιώντας αρίθμηση ή γραφικό προσδιορισμό του επιπέδου:

Η ανάγκη ανάπτυξης ενός ιεραρχικού ευρετηρίου του IPT προκαλείται από το γεγονός ότι ολόκληρο το σύστημα υποταγής των εννοιών δεν είναι σταθερό στα λήμματα του λεξικού του IPT, επειδή Αυτό θα συνεπαγόταν σημαντική αύξηση του λεξικοσημασιολογικού δείκτη. υπάρχει ανάγκη ανάπτυξης ΑΝΕΞΑΡΤΗΤΟ ΤΜΗΜΑ IPT - ένας ιεραρχικός δείκτης που θα αντικατοπτρίζει ολόκληρη την ιεραρχική αλυσίδα υποταγής των περιγραφικών παραγόντων προς τα κάτω.

Ένα ευρετήριο μετάθεσης είναι ένα ευρετήριο που παραθέτει με αλφαβητική σειρά όλες τις μεμονωμένες λέξεις που αποτελούν μέρος των συνιστωσών φράσεων που δηλώνουν περιγραφείς και για καθεμία από αυτές υποδεικνύονται όλοι οι περιγραφείς που περιλαμβάνουν αυτές τις λέξεις. Επομένως, κάθε όρος εμφανίζεται στο ευρετήριο μετάθεσης όσες φορές περιέχει σημαντικές λέξεις. Ο σκοπός του ευρετηρίου μετάθεσης είναι να παρέχει μια αναζήτηση περιγραφών-φράσεων με οποιαδήποτε λέξη περιλαμβάνεται στη σύνθεσή τους, συμπεριλαμβανομένων εκείνων που δεν εμφανίζονται στην αρχή μιας λεξιλογικής ενότητας. Σας επιτρέπει να ομαδοποιήσετε λέξεις μιας ρίζας σε ένα μέρος.

Κατά κανόνα, ένα ευρετήριο μετάθεσης συντάσσεται με αυτοματοποιημένο τρόπο και συνήθως έχει τη μορφή ενός ευρετηρίου τύπου KWIC (Λέξη-κλειδί - In Context - «Λέξεις-κλειδιά στο πλαίσιο»), στο οποίο όλα τα λέξεις με νόημαΟι όροι είναι ταξινομημένοι με αλφαβητική σειρά. στον δείκτη μετάθεσης βρίσκεται στο κέντρο της στήλης, η οποία σχηματίζεται από τα μικροπλαίσια των στοιχείων του όρου και το τμήμα των όρων που δεν ταιριάζει μεταφέρεται στην αριστερή πλευρά της ίδιας γραμμής:

οπτικό κβαντικό

εξέγερση

ηλεκτρικός

με εξαρτημένη διέγερση

Γεννήτριες παρεμβολών

ΣΕΙΡΙΑΚΕΣ ΓΕΝΝΗΤΡΙΕΣ

ΓΕΝΝΗΤΡΙΕΣ DC

Οι ΓΕΝΝΗΤΡΙΕΣ DC αποδεικνύονται απαραίτητες.

4. Η διαδικασία ανάπτυξης, εξέτασης, καταχώρισης και διατήρησης του IPT

Επί του παρόντος, η διαδικασία για την ανάπτυξη, την εξέταση και την καταχώριση του IPT καθορίζεται από δύο πρότυπα: GOST 7.25-2001 «Μονογλωσσικός θησαυρός ανάκτησης πληροφοριών. Κανόνες ανάπτυξης, δομή, σύνθεση και έντυπο παρουσίασης» και GOST 7.24-2007 «Πολυγλωσσικός θησαυρός ανάκτησης πληροφοριών. Σύνθεση, δομή και βασικές απαιτήσεις για την κατασκευή. Σύμφωνα με αυτά τα πρότυπα, οι λειτουργίες εξέτασης και καταχώρισης του IPT εκτελούνται από εθνικά και διεθνή αποθετήρια ταμεία.

Το Εθνικό Αποθεματικό Ταμείο του IPT στα ρωσικά (συμπεριλαμβανομένου του IPT που περιέχει τα ισοδύναμα περιγραφικών παραγόντων στα ρωσικά) βρίσκεται στη διεύθυνση , στο VINITI.

Υπάρχουν επίσης δύο διεθνής θεματοφύλακες IPT:

1) το IPT International Depository Fund στα αγγλικά, συμπεριλαμβανομένου του IPT που περιέχει τα ισοδύναμα περιγραφικών παραγόντων στα αγγλικά. Βρίσκεται στο Τορόντο, στη βιβλιοθήκη της Σχολής Επιστημών της Πληροφορίας στο Πανεπιστήμιο του Τορόντο (Thesaurus Clearinghouse - «οικισμός», The Library, Faculty of Information Studies, University of Toronto, TORONTO, Καναδάς).

2) IPT International Depository Fund σε όλες τις γλώσσες εκτός από τα αγγλικά. Βρίσκεται στο , στη Βαρσοβία, στις επιστημονικές και τεχνικές και οικονομικές πληροφορίες (Instytut Informacji Naukowej, Technicznej i Ekonomicznej, Clearinghouse, WARSZAW A, Πολωνία.).

Οι πλήρεις διευθύνσεις αυτών των οργανισμών δίνονται στο GOST 7.25-2001.

Το GOST 7.25-2001 και το GOST 7.24-2007 ορίζουν τις ενέργειες των προγραμματιστών IPT ως εξής:

1. Πριν από την έναρξη των εργασιών για τη δημιουργία ενός IPT, ο προγραμματιστής πρέπει να υποβάλει αίτηση στο κατάλληλο εθνικό ή διεθνές αποθεματικό ταμείο προκειμένου να προσδιορίσει τη διαθεσιμότητα καταχωρισμένων θησαυρών για ένα δεδομένο θέμα. Με την παρουσία τέτοιων θησαυρών, γίνεται αξιολόγηση της δυνατότητας εισαγωγής τους σε ένα δεδομένο σύστημα. Εάν δεν βρεθούν τέτοιοι θησαυροί, μπορεί να είναι δυνατή η δημιουργία ενός IPT. Ταυτόχρονα, ολόκληρη η τεχνολογία για τη δημιουργία IPT πρέπει να συμμορφώνεται αυστηρά με τα GOST 7.25-2001 και GOST 7.24-2007

2. Το ολοκληρωμένο (αναπτυγμένο) IPT πρέπει να υποβληθεί σε εξέταση για συμμόρφωση με το GOST 7.25-2001. πληρούν το πρότυπο, τότε η Εθνική εκδίδει τον προγραμματιστή . αυτού του IPT κατατίθεται (κατατίθεται) στο σχετικό εθνικό ή σε ένα από τα διεθνή αποθετήρια ταμεία (στο Τορόντο ή τη Βαρσοβία).

Οι εθνικοί θεματοφύλακες διαδίδουν πληροφορίες σχετικά με τη σύνθεση του κατατεθέντος κεφαλαίου IPT και τις παρέχουν στους προγραμματιστές νέων IPT προκειμένου να δανειστούν στοιχεία και να διασφαλίσουν τη συμβατότητα της γλωσσικής υποστήριξης διαφόρων πληροφοριακά συστήματα. Έτσι, εκτελούν τις λειτουργίες εξέτασης, καταχώρισης, αποθήκευσης IPT και πληροφοριών σχετικά με τα διαθέσιμα IPT.

πολλές λειτουργίες για τη διαχείριση του IPT)·

Η μετάβαση του AIS από ανεξάρτητη λειτουργία σε λειτουργία σε λειτουργία δικτύου (όταν χρησιμοποιείται IPT στο πλαίσιο του κοινές αρχέςοι όροι εντολής τους πρέπει να είναι συντονισμένοι).

Η διαδικασία διατήρησης του IPT σε λειτουργία και λειτουργία ονομάζεται διατήρηση ή προσαρμογή του θησαυρού. Συνήθως περιλαμβάνει τα ακόλουθα:

Αλλαγή της λεξιλογικής σύνθεσης του IPT: εισαγωγή νέων λεξικών ενοτήτων, αλλαγή της κατάστασης των λεξιλογικών ενοτήτων (μεταφράζοντας μια λέξη-κλειδί σε περιγραφείς και αντίστροφα).

Αλλαγή παραδειγματικών σχέσεων στο IPT (ενίσχυση, αποδυνάμωση).

Η διατήρηση του IPT περιλαμβάνει την υποχρεωτική χρήση εργαλείων αυτοματισμού που σας επιτρέπουν να εκτελείτε γρήγορα τέτοιες επίπονες λειτουργίες όπως η αλφαβητική ταξινόμηση του λεξικού, το λεξιλόγιο, ο έλεγχος της αμοιβαιότητας και της συνέπειας των αναφορών, με τη βοήθεια των οποίων οι παραδειγματικές σχέσεις καθορίζονται στο ITP κ.λπ. .

3.1. Έννοια του θησαυρού

Θησαυρός (από το ελληνικό θήσαϋροξ - θησαυρός, αποθεματικό) ή ιδεογραφικό λεξικό (από το ελληνικό ιδέα - έννοια, παράσταση, ιδέα και γράφω - γράφω, περιγράφω) - στη σύγχρονη γλωσσολογία: 1) ειδικό είδος λεξικών γενικού ή ειδικού λεξιλογίου, το οποίο υποδεικνύουν σημασιολογικές σχέσεις μεταξύ λεξικών ενοτήτων. 2) ένα λεξικό για την αναζήτηση μιας λέξης από τη σημασιολογική της σύνδεση με άλλες λέξεις. 3) ένας συγκεκριμένος τρόπος οργάνωσης (τακτοποίησης) λέξεων σε ένα λεξικό. 4) ένας τρόπος οργάνωσης της λεξιλογικής σύνθεσης, ο οποίος σας επιτρέπει να "μοντελοποιήσετε τον κόσμο" οικονομικά.

Στην πρώτη, αρχέγονη, έννοια - αποθήκη, θησαυρός, ο όρος θησαυρός χρησιμοποιήθηκε από τον L.V. Shcherba στο άρθρο «Η εμπειρία της γενικής λεξικογραφίας» (η τρίτη αντίθεση: ο θησαυρός είναι ένα κοινό (επεξηγητικό ή μεταφραστικό) λεξικό). Ο επιστήμονας γράφει: «Όταν λένε θησαυρό, τώρα εννοούμε πιο συχνά το «Thesaurus linguae latinae», μια επιχείρηση πέντε γερμανικών ακαδημιών, που ξεκίνησε το 1900 και μέχρι τώρα έφερε παραλείψεις μόνο στο γράμμα M. χαρακτηριστικόαυτού του τύπου λεξικών έγκειται στο γεγονός ότι περιέχουν όλες τις καθοριστικές λέξεις που βρίσκονται σε δεδομένης γλώσσαςτουλάχιστον μία φορά, και ότι κάτω από κάθε λέξη δίνονται απολύτως όλα τα αποσπάσματα από τα διαθέσιμα κείμενα στη συγκεκριμένη γλώσσα. Η βάση της παραπάνω αντίθεσης - θησαυρός - ένα συνηθισμένο (επεξηγηματικό ή μεταφραστικό) λεξικό - είναι η αντίθεση "γλωσσικού υλικού" και "γλωσσικού συστήματος" - εννοιών που προσπάθησα να τεκμηριώσω στο άρθρο μου "On the Triple Aspect of Linguistic Phenomena and σχετικά με το Πείραμα στη Γλωσσολογία».

Η δεύτερη έννοια αυτού του όρου συνδέεται με το ευρέως γνωστό λεξικό θησαυρού «Θησαυρός αγγλικές λέξειςκαι εκφράσεις» Π.Μ. Roger (Roget's Thesaurus of English Words and Phrases, 1852) και η συνέχειά του, το λεξικό του O. V. Baranov.

Σε αυτή την ερμηνεία, ο όρος θησαυρός υποδηλώνει έναν ορισμένο τρόπο οργάνωσης, τακτοποίησης της λεξιλογικής σύνθεσης σε ένα λεξικό (βλ. την τρίτη έννοια του όρου).

Η τέταρτη έννοια του όρου θησαυρός συνδέεται με την καθολική αναγνώριση ενός τέτοιου τρόπου οργάνωσης της λεξιλογικής σύνθεσης, που σας επιτρέπει να "μοντελοποιήσετε τον κόσμο" οικονομικά. Από αυτή την άποψη, ο θησαυρός-λεξικό είναι «μια συστηματική ταξινόμηση του λεξιλογίου οποιουδήποτε επιστημονικού ή τεχνικού πεδίου, και στα περισσότερα γενική εικόνα- το γενικό λογοτεχνικό λεξιλόγιο, και επιπλέον, ολόκληρο το λεξιλόγιο μιας δεδομένης γλώσσας.

Σύμφωνα με τον Yu.N. Ο Karaulov, ένας γενικός γλωσσικός θησαυρός, που καθορίζει στη δομή και τις σχέσεις των επικεφαλίδων, τμημάτων, ζωνών, περιοχών του, ευρείες δυνατότητες για μη λεκτική σύνδεση ιδεών, προβλέπει τη λήψη υπόψη ανθρώπινες αξίες.

ΕΝΑ. Baranov και D.O. Ο Dobrovolsky στον πρόλογο "From the Editors" στο "Dictionary-Thesaurus of Modern Russian Idiomatics" δίνει στον θησαυρό τον ακόλουθο ορισμό - έναν ειδικό τύπο λεξικού που διαφέρει από τα άλλα (ιδίως, επεξηγηματικό, δίγλωσσο κ.λπ.) στον τρόπο οργανώνεται το γλωσσικό υλικό. Στον θησαυρό, οι γλωσσικές ενότητες δεν παρουσιάζονται με αλφαβητική σειρά, όπως σε ένα κανονικό λεξικό, αλλά ομαδοποιούνται με βάση τη σημασία τους.

L.P. Ο Κρύσιν αποκαλεί τον θησαυρό (ιδεογραφικό λεξικό) επεξηγηματικό λεξικό ειδικού είδους, λεξικό «αντίθετα». «Αν σε ένα επεξηγηματικό λεξικό, γράφει ο επιστήμονας, η «είσοδος» στο λήμμα του λεξικού είναι η λέξη και το περιεχόμενο του λήμματος του λεξικού είναι η ερμηνεία της σημασίας αυτής της λέξης, τότε στο ιδεογραφικό λεξικό, η «είσοδος» είναι το νόημα, η ιδέα (εξ ου και η ονομασία αυτού του τύπου λεξικών - ιδεογραφικά), και το περιεχόμενο του λήμματος του λεξικού είναι ένας κατάλογος λέξεων που εκφράζουν τη δεδομένη σημασία. Και αν το επεξηγηματικό λεξικό είναι ένα απαραίτητο εργαλείο για την κατανόηση του κειμένου, τότε το ιδεογραφικό μπορεί να χρησιμοποιηθεί για τη δημιουργία του κειμένου: πολύ συχνά ένα άτομο θέλει να εκφράσει μια συγκεκριμένη σκέψη, αλλά δεν μπορεί να βρει κατάλληλες λέξεις για αυτό. ένα ιδεογραφικό λεξικό διευκολύνει αυτές τις αναζητήσεις. Υπάρχουν δύο κύριοι τύποι θησαυρών:

γλωσσικός θησαυρός - λεξικό που περιέχει μια λίστα λέξεων φυσικής γλώσσας που επιλέγονται ως αποτέλεσμα ουσιαστικής ανάλυσης κειμένων και συστηματοποιούνται σύμφωνα με το αποδεκτό σύστημα ταξινόμησης.

στατιστικός θησαυρός - ένα λεξικό ανάκτησης πληροφοριών που περιέχει μια λίστα λέξεων που επιλέγονται ως αποτέλεσμα στατιστικής ανάλυσης κειμένων για ένα συγκεκριμένο θέμα και ομαδοποιούνται σε λήμματα λεξικού με βάση τη συχνότητα κοινής εμφάνισης αυτών των λέξεων στα ίδια κείμενα.

Οι θησαυροί ανάκτησης πληροφοριών (IPT) διευκολύνουν την αναζήτηση πληροφοριών κατά την αυτόματη επεξεργασία τους. Το IPT αποκαλύπτει στο μέγιστο τις σημασιολογικές σχέσεις μεταξύ των λεξιλογικών ενοτήτων. Όπως αναφέρεται στο GOST για το IPT, «ο μονόγλωσσος θησαυρός ανάκτησης πληροφοριών είναι ένα ελεγχόμενο και μεταβαλλόμενο λεξικό λεξιλογικών μονάδων που βασίζεται στο λεξιλόγιο μιας φυσικής γλώσσας, εμφανίζει σημασιολογικές σχέσεις μεταξύ λεξιλογικών μονάδων και προορίζεται για επεξεργασία και ανάκτηση πληροφοριών».

Η βασική μονάδα του IPT είναι όροι περιγραφής. Το αλφαβητικό, λεξιλογικό-σημασιολογικό μέρος του IPT είναι ένα σύνολο άρθρων περιγραφής.

Τα περιγραφικά λεξικά έχουν σχεδιαστεί για να περιγράφουν πλήρως το λεξιλόγιο μιας συγκεκριμένης περιοχής και να καταγράφουν όλες τις χρήσεις εκεί. καταγράφουν όλες τις διαθέσιμες σχετικές περιπτώσεις. Χαρακτηριστικό παράδειγμαΤο περιγραφικό λεξικό είναι το "Επεξηγητικό Λεξικό της Ζωντανής Μεγάλης Ρωσικής Γλώσσας" του V.I. Dahl (η πρώτη έκδοση σε τέσσερις τόμους δημοσιεύτηκε το 1863-1866). Ο στόχος του δημιουργού του δεν ήταν να τυποποιήσει τη γλώσσα, αλλά να περιγράψει πλήρως ολόκληρη την ποικιλία του μεγάλου ρωσικού λόγου - συμπεριλαμβανομένων των διαλεκτικών μορφών της δημοτικής γλώσσας.

Κάθε καταχώρηση λεξικού περιγραφέα ξεκινά με έναν περιγραφέα, στον οποίο παρακάτω, στο άρθρο GOST, δίνονται συνώνυμα αυτού του περιγραφέα, καθώς και άλλες λεξιλογικές μονάδες που σχετίζονται με τον κύριο περιγραφέα κατά γένος-είδος ή συνειρμικές σχέσεις.

Έτσι, οι θησαυροί, ειδικά σε ηλεκτρονική μορφή, είναι ένα από τα πιο αποτελεσματικά εργαλεία για την περιγραφή επιμέρους θεματικών περιοχών.

Στην καθαρή του μορφή, ο θησαυρός είναι σπάνιος. Στους πραγματικούς θησαυρούς, η αρχική ιδέα είναι απλοποιημένη ή ξένη, αλλά οι δυνητικά απαραίτητες πληροφορίες προστίθενται στον χρήστη. Τα πιο διάσημα σήμερα είναι το «Ρωσικό Σημασιολογικό Λεξικό» του Yu.N. Karaulova, "Λεξικό πανομοιότυπου ονόματος" N.Yu. Shvedova, "Θεματικό λεξικό της ρωσικής γλώσσας" L.G. Smekhova και άλλοι.

Περίληψη. Όρος θησαυρού L.V. Ο Shcherba χρησιμοποίησε σε σχέση με το λεξικό, το οποίο κατέγραφε, ει δυνατόν, όλα τα συμφραζόμενα στα οποία εμφανίζεται η δεδομένη λέξη. Ένα χαρακτηριστικό γνώρισμα των θησαυρών είναι ότι περιέχουν όλες τις λέξεις που συναντώνται στη δεδομένη γλώσσα τουλάχιστον μία φορά και κάτω από κάθε λέξη δίνονται όλες οι παραθέσεις από τα κείμενα που είναι διαθέσιμα στη συγκεκριμένη γλώσσα. Το περιεχόμενο του λεξικού θησαυρού είναι το γλωσσικό υλικό και το περιεχόμενο του συνηθισμένου λεξικού είναι το γλωσσικό υλικό και το γλωσσικό σύστημα (όροι του L.V. Shcherba).

Αυτό το χαρακτηριστικόσυμπληρώνεται από διασταυρώσεις διαφόρων ειδών - πιο συχνά παραδειγματικές (συνώνυμο ή ανώνυμο), που υποδηλώνουν κοινότητα ή αντίθεση νοημάτων. Επιπλέον, διάφορα είδη αναπλ. συνδέσεις (δηλ. σύνταγμα. συνδέσεις).

Έτσι, το καθήκον του θησαυρού (ιδεογραφικό λεξικό) είναι να δώσει μια ιδέα για τη σημασιολογική οργάνωση ενός συγκεκριμένου τμήματος γλωσσικού υλικού, δείχνοντας τα κύρια σημασιολογικά πεδία, την εσωτερική τους δομή και τις εξωτερικές σχέσεις. Ο θησαυρός είναι μια σαφής επίδειξη της συστημικής φύσης της γλώσσας, επιτρέποντάς σας να δείτε πολλούς τύπους σχέσεων που συνδέουν μεμονωμένες γλωσσικές μονάδες και ομάδες ενοτήτων.

3.2. Η ιστορία της αναπαράστασης της εννοιολογικής γνώσης για τον κόσμο με τη μορφή θησαυρού

Η ανάγκη να ταξινομηθούν οι λέξεις σύμφωνα με την ομοιότητα, τη γειτνίαση, την αναλογία των εννοιών τους ήταν αισθητή παντού ορατή ιστορίαανθρώπινη σκέψη.

Για να εντοπίσουμε την προέλευση της ιδέας της παρουσίασης της εννοιολογικής γνώσης για τον κόσμο με τη μορφή θησαυρού, μπορούμε να αναφερθούμε στην ιστορία της σύνταξης θησαυρών (ιδεογραφικά λεξικά).

Έτσι, στην αυγή του πολιτισμού, όταν οι άνθρωποι μπορούσαν να εκφράσουν τις σκέψεις τους γραπτώς μόνο με τη βοήθεια ιδεογραμμάτων και συμβόλων, το μόνο δυνατό λεξικό ήταν πιθανώς ένα στο οποίο οι λέξεις ήταν ταξινομημένες σε θεματικές ομάδες. Απλώς ήταν δύσκολο για έναν λεξικογράφο εκείνη την εποχή να βρει άλλο κριτήριο για την ταξινόμηση των λέξεων, εκτός από τις σχέσεις που υπάρχουν στην ίδια την πραγματικότητα.

Δυστυχώς, δεν έχουμε στοιχεία για το αν οι λαοί που χρησιμοποιούσαν ιδεογραφική γραφή είχαν πράγματι τέτοια λεξικά. Από τις παλαιότερες απόπειρες ιδεογραφικής ταξινόμησης που μας γνωρίζουμε είναι οι Αττικά Λέξεις του Έλληνα γραμματικού, διευθυντή της βιβλιοθήκης της Αλεξάνδρειας, Αριστοφάνη του Βυζαντίου (πέθανε το 180 π.Χ.).

Τον II αιώνα. n. μι. εμφανίζεται το κεφαλαιουχικό έργο «Onomasticon», συντεταγμένο επί της ύλης Ελληνικάλεξικογράφος και σοφιστής Julius Pollux (πραγματικό όνομα Polydeuces), με καταγωγή από την αιγυπτιακή πόλη Naucratis. Ο Y. Pollux έγραψε αρκετά έργα, αλλά μόνο το Onomasticon έχει φτάσει σε εμάς (Pollux Y. Onomasticon. M., 1956).


Το Onomasticon αποτελείται από 10 βιβλία. Τα βιβλία είναι ουσιαστικά ξεχωριστές πραγματείες και περιέχουν τα περισσότερα σημαντικές λέξειςπου σχετίζονται με ένα συγκεκριμένο θέμα. Έτσι, το πρώτο βιβλίο μιλάει για θεούς και βασιλιάδες. στο δεύτερο - για τους ανθρώπους, τη ζωή και τη φυσιολογική τους δομή. στο τρίτο - περί συγγένειας και αστικών σχέσεων κλπ. Οι λέξεις που τοποθετούνται στο λεξικό συνοδεύονται από σύντομες ερμηνείες. Στη σύγχρονη εποχή, το λεξικό εκδόθηκε για πρώτη φορά το 1502 στη Βενετία.

Μεταξύ II και III αιώνα. n. μι. εκδίδεται το υπέροχο σανσκριτικό λεξικό «Amarakosha» (Amarakosha, Παρίσι, 1839). Συγγραφέας του είναι ο αρχαίος Ινδός ποιητής, γραμματικός και λεξικογράφος Amara Sina, ο οποίος αποκαλούνταν «ένα από τα εννέα μαργαριτάρια που κοσμούν τον θρόνο της Vikramaditya». Amarakosha μεταφρασμένο στα ρωσικά σημαίνει το θησαυροφυλάκιο της Amara. Το λεξικό περιέχει 10 χιλιάδες λέξεις. Για την καλύτερη απομνημόνευση της ερμηνείας των σημασιών των λέξεων, τα λήμματα του λεξικού κατασκευάζονται με τη μορφή ποιημάτων. Όλη η ύλη του λεξικού χωρίζεται σε 3 βιβλία. Κάθε βιβλίο περιλαμβάνει πολλά κεφάλαια και το κεφάλαιο με τη σειρά του, εάν χρειάζεται, χωρίζεται σε έναν αριθμό ενοτήτων. Το πρώτο βιβλίο είναι αφιερωμένο στον ουρανό, τους θεούς και ό,τι σχετίζεται άμεσα με αυτούς. Το δεύτερο βιβλίο περιέχει λέξεις που σχετίζονται με τη γη, τους οικισμούς, τα φυτά, τα ζώα και τους ανθρώπους (αρχικά, ένα άτομο θεωρείται ως ζωντανό ον, και στη συνέχεια ως κοινωνικό ον· ολόκληρη η δομή της κάστας της κοινωνίας σύγχρονης του συγγραφέα εμφανίζεται πριν τα μάτια μας· οι ιερείς, ως δικηγόροι του θεού, βρίσκονται στην κορυφή, και από κάτω οι στρατιώτες και οι βασιλιάδες, ακόμη πιο χαμηλά οι γαιοκτήμονες, και στο κάτω μέρος οι τεχνίτες, οι ζογκλέρ, οι υπηρέτες κ.λπ.). Το τρίτο βιβλίο είναι στην πραγματικότητα γλωσσικό, κάτι που φαίνεται ξεκάθαρα από τους τίτλους των έξι κεφαλαίων του.

Το λεξικό έγινε γνωστό στους Ευρωπαίους επιστήμονες μόλις το τέλη XVIIIαιώνα, όταν το 1798 εκδόθηκε το πρώτο του μέρος στη Ρώμη. Εκδόθηκε πλήρως με μετάφραση στα αγγλικά το 1808 από τον Άγγλο σανσκριτικό μελετητή G.T. Colebrook (N.T. Colebrooke). Το 1839, του γαλλική μετάφραση, κατασκευασμένο από τον A.L. Ντελονσάν (A.L. Deslongchamps). Η περαιτέρω ανάπτυξη της ιδέας της σημασιολογικής ταξινόμησης του λεξιλογίου συνδέεται με το πρόβλημα της λεγόμενης παγκόσμιας γλώσσας.

Περίληψη. Αυτό είναι, με τους πιο γενικούς όρους, το πρώτο στάδιο στην ανάπτυξη της παράδοσης της ιδεογραφικής ταξινόμησης του λεξιλογίου. Αυτό το στάδιο μπορεί να ονομαστεί προϊστορία των ιδεογραφικών λεξικών. Τώρα είναι σκόπιμο να στραφούμε σε σύγχρονη ταξινόμησηλεξικά θησαυρών.

Είναι εύκολο να δει κανείς πόσο διαφορετικά είναι τα περιγραφόμενα έργα από τα αλφαβητικά λεξικά. Αν στα αλφαβητικά λεξικά η προσφορά των λέξεων ρυθμίζεται από μια τέτοια υπό όρους και σε υψηλός βαθμόςουδέτερο εργαλείο, όπως το αλφάβητο, τότε κατά την κατασκευή ενός ιδεογραφικού λεξικού, η κοσμοθεωρία του ίδιου του λεξικογράφου γίνεται καθοριστική.

3.3. Αρχές ταξινόμησης λεξικών θησαυρών

Όπως φάνηκε παραπάνω, το πρόβλημα της κατάρτισης της ταξινόμησης των θησαυρών δεν είναι νέο και για αρκετές δεκαετίες έχει προσελκύσει την προσοχή ορισμένων εγχώριων και ξένων γλωσσολόγων (K. Marello, V.V. Morkovkin, L.P. Stupin, V.V. Dubichinskiy και άλλοι. ) . Αποτέλεσμα της έρευνας στον τομέα αυτό ήταν η δημιουργία εναλλακτικών ταξινομήσεων αυτών των λεξικογραφικών έργων. Μία από τις πιο πρόσφατες ταξινομήσεις βασίζεται στα ακόλουθα κριτήρια: α) τον τύπο των σημασιολογικών δεσμών μεταξύ των λεξιλογικών μονάδων. 2) τον τόμο του λεξικού. 3) γενίκευση του λεξιλογίου. 4) ανάπτυξη της σημασίας των λεξημάτων. 5) γραμματικός και υφολογικός προσδιορισμός λεξικών. 6) επίδειξη της λειτουργίας των λεξημάτων. 7) τον αριθμό των γλωσσών που αντιπροσωπεύονται· 8) το είδος των σημειωτικών μέσων που χρησιμοποιούνται για τη σημασιοποίηση των λεξημάτων. Η ονομαζόμενη ταξινόμηση βασίζεται στις ταξινομήσεις που δημιουργήθηκαν προηγουμένως από την O.M. Karpova and I. Burkhanov (Burchanov I. On the Ideographic Description of Stylistically and Pragmatically Relevant Aspects of Lexical Meanings. London, 1996); Η ορολογία που χρησιμοποιείται στην ταξινόμηση εισάγεται στη λεξικογραφική συσκευή


V.V. Morkovkin, Yu.N. Karaulov, K. Marello. Τα κριτήρια ταξινόμησης διατυπώθηκαν από την Ο.Μ. Κάρποβα. Ταυτόχρονα, ο K. Marello διακρίνει τρεις τύπους θησαυρών:

αθροιστικές, οι οποίες είναι ομαδοποιήσεις λέξεων χωρίς να καθορίζεται η σημασία τους.

οριστική, ερμηνεία κάθε λεξιλογικής μονάδας μιας ομαδοποίησης λέξεων.

δίγλωσσοι και πολύγλωσσοι θησαυροί για ταξιδιώτες (Marello C. TheThesaurus//W.D.D. 1990. V. 2. P. 1083).

Οι αθροιστικοί θησαυροί όχι μόνο παρέχουν την ευκαιρία να βρούμε μια πιο κατανοητή, ακριβή, υφολογικά σωστή λέξη σε μια κατάσταση που βρίσκεται σε ένα συγκεκριμένο σημασιολογικό πεδίο, αλλά αποτελούν επίσης τη βάση για το σχηματισμό θεματικών τραπεζών δεδομένων υπολογιστή.

Οι οριστικοί θησαυροί μπορεί να περιλαμβάνουν, μαζί με τον ορισμό του νοήματος, ετυμολογικές πληροφορίες και αποσπάσματα από λογοτεχνικά έργα, που δείχνουν τον άμεσο εγκυκλοπαιδικό προσανατολισμό αυτού του τύπου θησαυρών. Επιπλέον, λεξικά αυτού του τύπου εισάγουν τον χρήστη στο απαραίτητο σύστημα εννοιών, εξηγούν την ουσία, τις ομοιότητες και τις διαφορές των εννοιών, τις παραδειγματικές και συνταγματικές τους συνδέσεις, μερικές φορές παρέχουν πληροφορίες σχετικά με την προφορά, τις γραμματικές, τις παραγόμενες και άλλες δυνατότητες λεξιλογικών ενοτήτων που δηλώνουν αυτές έννοιες.

Οι δίγλωσσοι και πολύγλωσσοι θησαυροί για ταξιδιώτες δημιουργούνται συνήθως σύμφωνα με θεματικές ενότητες: αριθμοί, φαγητό, μεταφορές, ξενοδοχείο κ.λπ. με μεταφραστικά ισοδύναμα δύο ή περισσότερων γλωσσών.

Για την πληρέστερη απεικόνιση των τύπων των υπαρχόντων λεξικών θησαυρών, δημιουργείται μια πολυεπίπεδη ταξινόμηση. Πρώτον, ανάλογα με τον τύπο των σημασιολογικών δεσμών μεταξύ των λεξιλογικών μονάδων, οι θησαυροί χωρίζονται σε τρεις μεγάλες κατηγορίες:

1. Συνειρμικός θησαυρός (ορολογία Yu.N. Karaulov

2. Ανάλογος θησαυρός (ορολογία του V.V. Morkovkin

3. Ιδεολογικός (ιδεολογικός) θησαυρός (ορολογία των L.V. Shcherba, V.V. Morkovkin. Οι τρεις τύποι θησαυρών που αναφέρονται παραπάνω αντικατοπτρίζουν τους ακόλουθους τύπους σημασιολογικών συνδέσεων λεξικών, αντίστοιχα:

1. Σημασιολογικές-συντακτικές σχέσεις, βάσει των οποίων
Οι λέξεις συνδυάζονται σε ομάδες ή ζεύγη, προκαθορισμένες ως προς την προέλευση και την ύπαρξή τους με διπλούς δεσμούς: σημασιολογικό και συντακτικό. Οι σημασιολογικές συνδέσεις των λέξεων δημιουργούνται κυρίως μεταξύ ρημάτων και επιθέτων που εκτελούν κατηγορηματική λειτουργία σε μια πρόταση, και ουσιαστικών, για παράδειγμα:

α) μεταξύ της δράσης και του οργάνου (όργανο) με το οποίο εκτελείται: να αρπάξει - ένα χέρι, να δει - ένα μάτι, να κολυμπήσει - μια βάρκα κ.λπ.

β) μεταξύ των ρημάτων δράσης που απαιτούν ένα υποκείμενο και του υποκειμένου: γαβγίζω - σκύλος, γειτονεύω - άλογο κ.λπ. γ) μεταξύ ρημάτων και ορισμένης γραμματικής προσθήκης, που απαιτούν οι πρώτοι: να κόψεις - ένα δέντρο, να φας - φαγητό κ.λπ.

Ως εκ τούτου, ένας συνειρμικός θησαυρός είναι ένα λεξικό θησαυρού που οργανώνει λεξικές ενότητες με βάση τους σημασιολογικούς και συντακτικούς δεσμούς που υπάρχουν μεταξύ τους και τακτοποιεί ομάδες σύμφωνα με τη γραφική μορφή των κέντρων λέξεων.

2. Λεξικοσημασιολογικές συνδέσεις. Ο συνδυασμός σε ομάδες με αυτόν τον τύπο σύνδεσης συμβαίνει σύμφωνα με το κύριο χαρακτηριστικό για τις λέξεις - λεξικό νόημα. Παράλληλα, λαμβάνονται υπόψη και οι λεξικογραμματικές συνδέσεις, με τη μορφή των οποίων πραγματοποιούνται επιμέρους σημασίες λέξεων.

Έτσι, ένας ανάλογος θησαυρός είναι ένα λεξικογραφικό βιβλίο αναφοράς, η κύρια μονάδα της μακροδομής του οποίου είναι η λεξικο-σημασιολογική ομάδα. οι ομάδες συστηματοποιούνται με αλφαβητική σειρά σημασιολογικών κυρίαρχων.

3. Θεματικές ή θεματικές συνδέσεις, όπου ο συνδυασμός λέξεων σε μια ομάδα συμβαίνει λόγω της ομοιότητας ή της κοινότητας των λειτουργιών αντικειμένων και διαδικασιών που δηλώνονται με λέξεις: αντικείμενα
είδη οικιακής χρήσης, μέρη σώματος, είδη ρούχων, κτίρια κ.λπ.

Έτσι, ένας ιδεογραφικός θησαυρός είναι ένα λεξικογραφικό έργο που αναπαριστά λεξικές ενότητες ως μέρος θεματικών (θεματικών) ομάδων και τις οργανώνει σε μια ιεραρχική δομή που έχει σχεδιαστεί για να αναπαριστά εννοιολογική γνώση για τον κόσμο.

Στα πλαίσια του ίδιου κριτηρίου πραγματοποιούμε περαιτέρω υποδιαίρεση τύπων. Έτσι, ο ιδεογραφικός θησαυρός αντιπροσωπεύεται από τους ακόλουθους 4 τύπους:


Στην πραγματικότητα ιδεογραφικός θησαυρός.

Θεματικό λεξικό.

Συστηματικό Λεξικό.

Θεματικό και συστηματικό λεξικό


Ένας ιδεογραφικός θησαυρός είναι ένας ειδικός τύπος ιδεογραφικού λεξιλογίου, η μακροδομή του οποίου οργανώνεται σύμφωνα με έναν a priori συνοπτικό χάρτη που επιτίθεται στη λεξιλογική σύνθεση της γλώσσας. Σε αντίθεση με άλλους τύπους ιδεογραφικού λεξιλογίου, ο ίδιος ο ιδεογραφικός θησαυρός χαρακτηρίζεται από μια λογική και αυστηρά διατεταγμένη δομή ταξινόμησης που βασίζεται στην επιστημονική ταξινόμηση, ακόμη κι αν το γενικό λεξιλόγιο υπόκειται σε λεξικογραφική περιγραφή (New Webster "Thesaurus. Landolll, 1991).

Ένα θεματικό λεξικό είναι ένας ειδικός τύπος ιδεογραφικού θησαυρού, η κύρια ενότητα της μακροδομής του οποίου είναι μια θεματική ομάδα, η οποία περιλαμβάνει λεξικά που συνδυάζονται με βάση την ταξινόμηση των υποδηλώσεών τους (αναφορές) και εξετάζονται από την άποψη της συνάφειάς τους σε ένα συγκεκριμένο θέμα.

Ένα συστηματικό λεξικό είναι ένας ειδικός τύπος ιδεογραφικού θησαυρού του οποίου η δομή ταξινόμησης έχει σχεδιαστεί για να αντιπροσωπεύει τις πραγματικές σημασιολογικές σχέσεις που υπάρχουν μεταξύ των λεξικών ενοτήτων μιας γλώσσας. Στον πυρήνα της, η δομή ταξινόμησης αντιπροσωπεύει τη λεξικογραμματική ταξινόμηση του λεξιλογίου, με άλλα λόγια, την παραδειγματική δομή του, που περιγράφεται από την άποψη της υποταγής και της σύνθεσης.

Το θεματικό-συστηματικό λεξικό είναι ένας ειδικός τύπος ιδεογραφικού λεξικού που είναι ένας συνδυασμός θεματικού και συστηματικού λεξικού.

Περίληψη. Η εξεταζόμενη ταξινόμηση των γλωσσικών θησαυρών περιλαμβάνει τους ακόλουθους τύπους λεξικών: ανάλογος θησαυρός (ορολογία του VV Morkovkin). ιδεολογικός (ιδεολογικός) θησαυρός (ορολογία των L.V. Shcherba και V.V. Morkovkin). αναπλ. θησαυρός (ορολογία Yu.N. Karaulov). Το επόμενο θα είναι το ποπ. θησαυροί και τα χαρακτηριστικά τους αποκαλύπτονται.

3.4. Δημοφιλείς θησαυροί και τα χαρακτηριστικά τους

Το πιο διάσημο από τα υπάρχοντα λεξικά θησαυρού, στα οποία ο ίδιος ο όρος οφείλει την ύπαρξή του, δημιουργήθηκε στο υλικό της αγγλικής γλώσσας. αυτός είναι ένας συνεχώς ανατυπωμένος θησαυρός από τον P.M. Θησαυρός αγγλικών λέξεων και φράσεων του Roger Roget (1852).

Είναι σημαντικό να σημειωθεί ότι ο συγγραφέας του Θησαυρού των Αγγλικών Λέξεων και Εκφράσεων έκανε πλήρη χρήση της εμπειρίας που ήταν διαθέσιμη εκείνη την εποχή. «Η αρχή που με καθοδήγησε κατά την ταξινόμηση των λέξεων», γράφει ο P.M. Roger, - είναι το ίδιο που χρησιμοποιείται στην ταξινόμηση ατόμων σε διάφορους τομείς της φυσικής ιστορίας. Επομένως, οι ενότητες που επισημαίνω αντιστοιχούν στις φυσικές οικογένειες της βοτανικής και της ζωολογίας και οι σειρές λέξεων εδραιώνονται από τις ίδιες σχέσεις που ενώνουν τις φυσικές σειρές φυτών και ζώων.

ΜΕΤΑ ΜΕΣΗΜΒΡΙΑΣ. Ο Ρότζερ πίστευε ότι μια πειστική ταξινόμηση των λέξεων σύμφωνα με τη σημασία τους είναι αδύνατη έως ότου μελετηθούν και οργανωθούν κατάλληλα τα αντικείμενα της πραγματικότητας που ονομάζονται αυτές οι λέξεις. Ως εκ τούτου, ξεκινά τη δουλειά του με τη διαίρεση του εννοιολογικού πεδίου της αγγλικής γλώσσας σε τέσσερις μεγάλες τάξεις: αφηρημένες σχέσεις, χώρος, ύλη και πνεύμα (νους, θέληση, συναισθήματα). Αυτές οι κατηγορίες χωρίζονται περαιτέρω σε διάφορα γένη, τα οποία με τη σειρά τους χωρίζονται σε έναν ορισμένο αριθμό ειδών.

Μεταξύ των ελλείψεων του ιδεογραφικού λεξικού του Π.Μ. Οι επιστήμονες του Roger αποδίδουν τα εξής: 1) όχι απόλυτα πειστική ονοματολογία των κύριων εννοιολογικών τάξεων. 2) η αφηρημένη λογική υπερισχύει των φυσικών συνδέσεων των λέξεων. 3) σχετική ταλαιπωρία χρήσης (σε μεγάλο βαθμό, αυτό το μειονέκτημα έχει διορθωθεί σε επόμενες εκδόσεις).

Στη σύγχρονη ρωσική λεξικογραφία, υπάρχουν πολλά λεξικά που πρέπει να ταξινομηθούν ως λεξικά θησαυρών (ιδεογραφικά λεξικά). Αυτό, για παράδειγμα, δημιουργήθηκε υπό την ηγεσία του Yu.N. Karaulov "Russian Semantic Dictionary", "Russian Semantic Dictionary" που επιμελήθηκε ο N.Yu. Shvedova, "Θεματικό λεξικό της ρωσικής γλώσσας" L.G. Sayakhova, D.M. Khasanova και V.V. Morkovkina, "Λεξικό λεξιλογικών-σημασιολογικών ομάδων ρωσικών ρημάτων", εκδ. E.V. Kuznetsova, "Ιδεογραφικό λεξικό της ρωσικής γλώσσας" O.S. Baranova, «Εννοιολογική σφαίρα εσωτερικός κόσμοςάτομο στη ρωσική γλώσσα» V.I. Ubiyko, ένα ολοκληρωμένο εκπαιδευτικό λεξικό "Η Λεξική Βάση της Ρωσικής Γλώσσας" υπό την καθοδήγηση του V.V. Morkovkin.

Ας γνωρίσουμε μερικά από αυτά.

Λεξικό-θησαυρός σύγχρονων ρωσικών ιδιωμάτων, επιμέλεια A.N. Baranova και Δ.Ο. Ο Dobrovolsky περιλαμβάνει τέσσερα κύρια μέρη: 1) σύνοψη. 2) θρύλος? 3) το κύριο σώμα του Λεξικού-θησαυρού. 4) δείκτες. Ο σκοπός της Σύνοψης είναι να δώσει μια γενική ιδέα για τη δομή του Κύριου Σώματος του Θησαυρού. Απαριθμεί όλα τα taxa με υποταξόνια και αντίστοιχες παραδειγματικές αναφορές. Το κύριο σώμα του Λεξικού-Θησαυρού είναι μια συλλογή από λήμματα λεξικού που ομαδοποιούνται σε ομάδες (taxa) και υποομάδες (subtaxa) σύμφωνα με τη σημασία των ιδιωμάτων που περιγράφονται σε αυτά. Κάθε άρθρο περιέχει ένα ιδίωμα και παραδείγματα χρήσης του στα σύγχρονα ρωσικά. Synopsis, Legend, Pointers είναι τα τμήματα εξυπηρέτησης του προαναφερθέντος Λεξικού-Θησαυρού, τα οποία παρέχουν στον χρήστη τη δυνατότητα να εργάζεται γρήγορα και αποτελεσματικά. Ο θρύλος χρησιμοποιείται σε περιπτώσεις που δεν χρειάζονται παραδείγματα χρήσης ιδιωμάτων, γιατί αναπαράγει όλες τις πληροφορίες εκτός από παραδείγματα. Στην πραγματικότητα, αυτό είναι το λεξιλόγιο του Λεξικού. Οι λεξιλογικές μονάδες είναι λήμματα. Το λήμμα σε αυτή την περίπτωση είναι ιδίωμα στην αρχική του μορφή (λεξικό) και περιλαμβάνει, ει δυνατόν, όλες τις ουσιώδεις παραλλαγές του. Για παράδειγμα, το ιδίωμα να στέκεσαι ακίνητος είναι μέρος του λήμματος να μένει στάσιμος, να στέκεται ακίνητος, να γλιστράει στη θέση του.

Το λεξικό περιέχει δύο δείκτες. Στο τέλος του βιβλίου υπάρχει ένα άρθρο «Theoretical Concept of the Dictionary-Thesaurus of Modern Russian Ideomatics», το οποίο αναλύει διεξοδικά τα επιστημονικά χαρακτηριστικά αυτού του εγχειρήματος.

"Ρωσικό Σημασιολογικό Λεξικό", που δημιουργήθηκε υπό τη διεύθυνση του Yu.N. Ο Karaulov περιλαμβάνει 10 χιλιάδες ρωσικές λέξεις, οι οποίες χωρίζονται σε 1600 εννοιολογικές ομάδες. Η επιλογή των ομάδων βασίζεται σε επαναλαμβανόμενα στοιχεία ερμηνείας λέξεων σε επεξηγηματικά λεξικά: για παράδειγμα, «δράση», «ιδιότητα», «εργαλείο» κ.λπ.

"Ρωσικό Σημασιολογικό Λεξικό", που δημιουργήθηκε υπό την καθοδήγηση του Ακαδημαϊκού N.Yu. Shvedova, βασίζεται σε ελαφρώς διαφορετικές αρχές που είναι χαρακτηριστικές για τη σύνταξη τόσο ιδεογραφικών όσο και επεξηγηματικών λεξικών. Πρώτον, όλες οι λέξεις της γλώσσας χωρίζονται εδώ σε τέσσερις τάξεις: 1) υποδεικνύοντας μονάδες (αντωνυμίες), 2) ονοματοδοσία (σημαντικές λέξεις), 3) ουσιαστικά συνδετικές (συνεισμοί, προθέσεις, συνδετικά ρήματα), 4) ταξινόμηση (τροπικές λέξεις). , σωματίδια, παρεμβολές). Δεύτερον, μέσα σε κάθε τάξη, όλες οι λέξεις χωρίζονται σε μέρη του λόγου. Τρίτον, σε κάθε μέρος του λόγου, τα σύνολα και τα υποσύνολα διακρίνονται με βάση τη θεματική εγγύτητα ή, αντίθετα, την αντίθεση των σημασιών των λέξεων.

Το DUDEN είναι ένα βιβλίο με εικόνες (σχέδια) στην αριστερή πλευρά (σύμφωνα με διαφορετικό λογισμικό) με αριθμημένες λεπτομέρειες (μέχρι τη μικρότερη). Στη δεξιά πλευρά, αυτή η αριθμημένη λίστα συνοδεύεται από τίτλους (ακόμη και σε δύο γλώσσες). Για παράδειγμα, ο σιδηροδρομικός εξοπλισμός, οι σταθμοί, οι γραμμές σχεδιάζονται σε ολόκληρη τη σελίδα. Στα δεξιά - τα ονόματα των βελών, σηματοφόρων, πατερίτσες κ.λπ.

"Θεματικό Λεξικό της Ρωσικής Γλώσσας" L.G. Sayakhova, D.M. Khasanova και V.V. Ο Morkovkin περιέχει 25 χιλιάδες λεξιλογικές μονάδες ομαδοποιημένες σε τρεις μεγάλες κατηγορίες: "Άνθρωπος", "Κοινωνία", "Φύση", οι οποίες διακλαδίζονται σταδιακά σε μικρότερες υποκατηγορίες. Για παράδειγμα, στην τάξη "Άνθρωπος" υποκατηγορίες "Το σώμα και το ανθρώπινο σώμα", "Ανθρώπινη ζωή", " Εμφάνιση, εμφάνιση ενός ατόμου", "Συναισθηματική εμφάνιση ενός ατόμου" κ.λπ. Κάθε μία από τις υποκατηγορίες, με τη σειρά της, χωρίζεται σε ακόμη πιο ιδιωτικές: "Συναισθηματικός κόσμος ενός ατόμου" - "Ψυχικές ιδιότητες ενός ατόμου" - " Ταμπεραμέντο», «Χαρακτήρας» - «Κοινά χαρακτηριστικά χαρακτήρα» κ.λπ. Η σημασία και η χρήση των λέξεων που ανήκουν σε κάθε τάξη απεικονίζονται από τις πιο συνηθισμένες φράσεις. Για παράδειγμα, η λέξη "γέλιο", η οποία βρίσκεται στην υποομάδα "έκφραση συναισθημάτων, συναισθημάτων" της τάξης "Πρόσωπο", συνοδεύεται από ένδειξη τέτοιων συνδυασμών με αυτή τη λέξη όπως χαρούμενο γέλιο, χαρούμενο γέλιο, παιδικό γέλιο, έκρηξη στο γέλιο κ.λπ.

Περίληψη. Ένα από τα αποτελεσματικά εργαλεία για την περιγραφή επιμέρους θεματικών περιοχών, ειδικά σε ηλεκτρονική μορφή, είναι οι θησαυροί.

Ο όρος θησαυρός χρησιμοποιείται από καιρό ευρέως στη γλωσσολογία για να προσδιορίσει έναν ειδικό τύπο λεξικών, που σε κάποιο βαθμό αντικατοπτρίζει την «εικόνα του κόσμου», «το γλωσσικό μοντέλο του κόσμου» (σύμφωνα με τον Yu.N. Karaulov). Ο θησαυρός ως «θησαυροφυλάκιο» έχει μεγαλώσει στη σημασιολογική του εμβέλεια, έχει αποκτήσει νέο νόημα. Άρχισαν να τα αποκαλούν λεξικό, που όχι μόνο απορροφά όλο τον λεξιλογικό πλούτο της γλώσσας, αλλά τα τακτοποιεί με έναν συγκεκριμένο λογικό και συστημικό τρόπο. Σε ένα λεξικό θησαυρού, οι λέξεις ομαδοποιούνται και αυτός ο συσχετισμός προκύπτει με βάση την ικανότητα μιας συγκεκριμένης λέξης να μεταφέρει μια συγκεκριμένη έννοια.

Το λεξικό-θησαυρός θεωρούνταν πάντα στη γλωσσολογία ως ένα είδος καθολικού συστήματος που παρέχει αποθήκευση συλλογικής (για μια συγκεκριμένη κοινωνία) γνώσης για τον κόσμο σε λεκτική μορφή. Σε αντίθεση με άλλα λεξικά, στο λεξικό-θησαυρό αυτή η γνώση αποθηκεύεται σε μια δομημένη μορφή που αντανακλά τις ιδέες μας για τη «δομή του κόσμου».

Οι πιο διάσημοι και δημοφιλείς θησαυροί αυτή τη στιγμή είναι ο Αγγλικός Θησαυρός Roger, το Ιδεογραφικό Λεξικό της Ρωσικής Γλώσσας του O.V. Baranova, Ρωσικό Σημασιολογικό Λεξικό Yu.N. Karaulova, Ρωσικό Σημασιολογικό Λεξικό του Ακαδημαϊκού N.Yu. Shvedova, DUDEN, Θεματικό Λεξικό της Ρωσικής Γλώσσας L.G. Sayakhova, D.M. Khasanova και V.V. Morkovkin.

, αντώνυμα, παρώνυμα, υποώνυμα, υπερώνυμα κ.λπ.) μεταξύ λεξικών ενοτήτων. Οι θησαυροί είναι ένα από τα πιο αποτελεσματικά εργαλεία για την περιγραφή μεμονωμένων θεματικών περιοχών.

Στο παρελθόν ο όρος θησαυρόςορίστηκαν κυρίως λεξικά που αντιπροσώπευαν το λεξιλόγιο της γλώσσας με παραδείγματα χρήσης της σε κείμενα με μέγιστη πληρότητα.

Επίσης όρος θησαυρόςχρησιμοποιείται στη θεωρία της πληροφορίας για να αναφέρεται στο σύνολο όλων των πληροφοριών που κατέχει το υποκείμενο.

Στην ψυχολογία, ο θησαυρός ενός ατόμου χαρακτηρίζει την αντίληψη και την κατανόηση της πληροφορίας. Η θεωρία της επικοινωνίας εξετάζει επίσης έναν γενικό θησαυρό πολύπλοκο σύστημαμέσω των οποίων αλληλεπιδρούν τα στοιχεία του.

Ιστορία

Ένας από τους πρώτους θησαυρούς ονομάζεται Λεξικό Συνωνύμων του Φίλωνα της Biblus. Μια πιο ακριβής αντιστοιχία με τον όρο είναι η Amara-kosha, γραμμένη στα σανσκριτικά in ποιητική μορφήτον VI αιώνα. Ο πρώτος σύγχρονος αγγλικός θησαυρός δημιουργήθηκε από τον Peter Mark Roger το 1805. Εκδόθηκε το 1852 και χρησιμοποιείται από τότε.

Στη δεκαετία του 1970, οι θησαυροί άρχισαν να χρησιμοποιούνται ενεργά για εργασίες ανάκτησης πληροφοριών. Σε τέτοιους θησαυρούς, οι λέξεις συγκρίνονται με περιγραφείς μέσω των οποίων καθιερώνονται σημασιολογικοί δεσμοί.

Θησαυροί

δείτε επίσης

Γράψτε μια κριτική για το άρθρο "Θησαυρός"

Σημειώσεις

Ένα απόσπασμα που χαρακτηρίζει τον Θησαυρό

-Τι δανδής είσαι σήμερα! - κοιτάζοντας τριγύρω το καινούργιο του πανί μεντί και σέλας, είπε ο Νεσβίτσκι.
Ο Ντενίσοφ χαμογέλασε, πήρε ένα μαντήλι από την τάσκα, που διάχυσε τη μυρωδιά του αρώματος, και το έβαλε στη μύτη του Νεσβίτσκι.
- Δεν μπορώ, πάω στη δουλειά! βγήκε έξω, καθάρισε τα δόντια του και μυρίστηκε.
Η επιβλητική φιγούρα του Νεσβίτσκι, συνοδευόμενη από έναν Κοζάκο, και η αποφασιστικότητα του Ντενίσοφ, που κουνούσε τη σπαθιά του και φώναζε απελπισμένα, ενήργησαν έτσι ώστε να στριμώξουν στην άλλη πλευρά της γέφυρας και να σταματήσουν το πεζικό. Ο Νεσβίτσκι βρήκε έναν συνταγματάρχη στην έξοδο, στον οποίο έπρεπε να μεταφέρει την εντολή και, αφού εκπλήρωσε τη διαταγή του, πήγε πίσω.
Έχοντας καθαρίσει το δρόμο, ο Ντενίσοφ σταμάτησε στην είσοδο της γέφυρας. Κρατώντας απρόσεκτα τον επιβήτορα, που ορμούσε προς τους δικούς του και κλωτσούσε, κοίταξε τη μοίρα που κινούνταν προς το μέρος του.
Στις σανίδες της γέφυρας ακούστηκαν διάφανοι ήχοι από οπλές, σαν να κάλπαζαν πολλά άλογα και η μοίρα, με αξιωματικούς μπροστά, τέσσερα άτομα στη σειρά, απλώθηκε κατά μήκος της γέφυρας και άρχισε να βγαίνει στην άλλη πλευρά.
Οι σταματημένοι στρατιώτες πεζικού, συνωστιζόμενοι στη λάσπη που ποδοπατούσε η γέφυρα, κοίταξαν τους καθαρούς, βαρετούς ουσάρους, που περνούσαν αρμονικά δίπλα τους, με αυτό το ιδιαίτερο εχθρικό αίσθημα αποξένωσης και κοροϊδίας που συνήθως συναντούν διάφορα τμήματα του στρατού.
- Καλα ΠΑΙΔΙΑ! Αν και μόνο στο Podnovinskoye!
- Τι καλά είναι αυτά! Μόνο για επίδειξη και οδήγηση! είπε ένας άλλος.
– Πεζικό, όχι σκόνη! - αστειεύτηκε ο ουσάρ, κάτω από τον οποίο το άλογο, παίζοντας, πιτσίλισε λάσπη στον πεζικό.
«Θα σε είχα διώξει με ένα σακίδιο για δύο μεταβάσεις, τα κορδόνια θα είχαν φθαρεί», είπε ο πεζός, σκουπίζοντας τη βρωμιά από το πρόσωπό του με το μανίκι του. - διαφορετικά δεν είναι άτομο, αλλά ένα πουλί κάθεται!
«Θα ήταν καλύτερα να σε βάλω σε άλογο, Ζικίν, αν ήσουν επιδέξιος», αστειεύτηκε ο δεκανέας στον αδύνατο στρατιώτη, στριμωγμένος από το βάρος του σακιδίου.
«Πάρε μια σκυτάλη ανάμεσα στα πόδια σου, εδώ είναι ένα άλογο για σένα», απάντησε ο ουσάρ.

Το υπόλοιπο πεζικό διέσχισε βιαστικά τη γέφυρα, κάνοντας δίνη στην είσοδο. Τελικά τα βαγόνια πέρασαν όλα, η συντριβή μειώθηκε και το τελευταίο τάγμα μπήκε στη γέφυρα. Κάποιοι ουσάροι της μοίρας του Ντενίσοφ παρέμειναν στην άλλη πλευρά της γέφυρας κατά του εχθρού. Ο εχθρός, ορατός σε απόσταση από το απέναντι βουνό, από κάτω, από τη γέφυρα, δεν ήταν ακόμη ορατός, αφού από το κοίλωμα κατά μήκος του οποίου κυλούσε το ποτάμι, ο ορίζοντας τελείωνε με το αντίθετο υψόμετρο όχι περισσότερο από μισή βέρστ. Μπροστά ήταν μια έρημος, κατά μήκος της οποίας σε ορισμένα σημεία κινούνταν ομάδες ταξιδιωτών Κοζάκων μας. Ξαφνικά, στο απέναντι ύψωμα του δρόμου, εμφανίστηκαν στρατιώτες με μπλε κουκούλες και πυροβολικό. Αυτοί ήταν οι Γάλλοι. Το στράτευμα των Κοζάκων κινήθηκε προς την κατηφόρα με τροχόσπιτο. Όλοι οι αξιωματικοί και οι άνθρωποι της μοίρας του Ντενίσοφ, αν και προσπάθησαν να μιλήσουν για αγνώστους και να κοιτάξουν τριγύρω, δεν σταμάτησαν να σκέφτονται μόνο τι ήταν εκεί, στο βουνό, και αδιάκοπα κοιτούσαν τα σημεία που εμφανίζονταν στον ορίζοντα, τα οποία αναγνώρισαν ως εχθρικά στρατεύματα. Ο καιρός άνοιξε ξανά το απόγευμα, ο ήλιος έδυε λαμπερά πάνω από τον Δούναβη και τα σκοτεινά βουνά που τον περιβάλλουν. Είχε ησυχία και από εκείνο το βουνό έβγαιναν κατά καιρούς οι ήχοι των κόρνων και οι κραυγές του εχθρού. Δεν υπήρχε κανείς μεταξύ της μοίρας και του εχθρού, εκτός από μικρές πλευρές. Ένας κενός χώρος, τριακόσιες φάσεις, τους χώριζε από αυτόν. Ο εχθρός σταμάτησε να πυροβολεί και αυτό το αυστηρό, τρομερό, απόρθητο και άπιαστο χαρακτηριστικό που χωρίζει τα δύο εχθρικά στρατεύματα έγινε αισθητό ακόμη πιο καθαρά.
«Ένα βήμα πέρα ​​από αυτή τη γραμμή, που θυμίζει τη γραμμή που χωρίζει τους ζωντανούς από τους νεκρούς και - το άγνωστο του πόνου και του θανάτου. Και τι υπάρχει; Ποιος είναι εκεί? εκεί, πίσω από αυτό το χωράφι, και ένα δέντρο, και μια στέγη φωτισμένη από τον ήλιο; Κανείς δεν ξέρει, και κάποιος θέλει να μάθει. και είναι τρομακτικό να περνάς αυτή τη γραμμή και θέλω να τη περάσω. και ξέρεις ότι αργά ή γρήγορα θα πρέπει να το διασχίσεις και να μάθεις τι είναι εκεί, στην άλλη πλευρά της γραμμής, όπως είναι αναπόφευκτο να μάθεις τι υπάρχει, στην άλλη πλευρά του θανάτου. Και ο ίδιος είναι δυνατός, υγιής, χαρούμενος και οξύθυμος, και περιβάλλεται από τόσο υγιείς και ευερέθιστα ζωηρούς ανθρώπους. Αν λοιπόν δεν σκέφτεται, τότε κάθε άτομο που βρίσκεται στη θέα του εχθρού αισθάνεται και αυτό το συναίσθημα δίνει μια ιδιαίτερη λάμψη και χαρούμενη οξύτητα εντυπώσεων σε όλα όσα συμβαίνουν αυτές τις στιγμές.
Ο καπνός ενός πυροβολισμού εμφανίστηκε σε ένα λόφο κοντά στον εχθρό και η μπάλα, σφυρίζοντας, πέταξε πάνω από τα κεφάλια της μοίρας των Hussar. Οι αξιωματικοί που στέκονταν μαζί σκορπίστηκαν στις θέσεις τους. Οι ουσάροι άρχισαν επιμελώς να ισιώνουν τα άλογα. Όλα στη μοίρα σώπασαν. Όλοι κοιτούσαν μπροστά στον εχθρό και στον διοικητή της μοίρας, περιμένοντας την εντολή. Ένας άλλος, τρίτος πυρήνας πέρασε. Είναι προφανές ότι πυροβόλησαν κατά των ουσάρων. αλλά η οβίδα, σφυρίζοντας ομοιόμορφα γρήγορα, πέταξε πάνω από τα κεφάλια των ουσάρων και χτύπησε κάπου πίσω. Οι ουσάροι δεν κοίταξαν πίσω, αλλά σε κάθε ήχο ενός ιπτάμενου βολίδας, σαν να είχε εντολή, ολόκληρη η μοίρα, με τα ομοιόμορφα ποικίλα πρόσωπά της, κρατώντας την ανάσα της ενώ η οβίδα πετούσε, σηκώθηκε στους αναβολείς και έπεσε ξανά. Οι στρατιώτες, χωρίς να γυρίσουν το κεφάλι τους, κοίταξαν ο ένας τον άλλο, αναζητώντας με περιέργεια την εντύπωση ενός συντρόφου. Σε κάθε πρόσωπο, από τον Ντενίσοφ μέχρι τον μπούκλερ, ένα κοινό χαρακτηριστικόαγώνα, θυμό και ενθουσιασμό. Ο λοχίας συνοφρυώθηκε, κοιτάζοντας τους στρατιώτες, σαν να απειλούσε με τιμωρία. Ο Γιούνκερ Μιρόνοφ έσκυβε σε κάθε πέρασμα του πυρήνα. Ο Ροστόφ, που στεκόταν στο αριστερό πλευρό στο συγκινητικό αλλά ορατό Γκράτσικ του, είχε το χαρούμενο βλέμμα ενός μαθητή που καλούνταν μπροστά σε ένα μεγάλο ακροατήριο για εξετάσεις, στις οποίες ήταν σίγουρος ότι θα διαπρέψει. Κοίταξε γύρω του καθαρά και λαμπερά τους πάντες, σαν να τους ζητούσε να προσέξουν πώς στέκεται ήρεμα κάτω από τις οβίδες. Αλλά και στο πρόσωπό του, το ίδιο χαρακτηριστικό κάτι καινούργιου και αυστηρού, παρά τη θέλησή του, φαινόταν κοντά στο στόμα.
- Ποιος υποκλίνεται εκεί; Yunkeg "Mig" ons! Hexog "ω, κοίτα με" ite! - φώναξε ο Ντενίσοφ, που δεν μπορούσε να σταθεί ακίνητος και που στριφογύριζε πάνω σε ένα άλογο μπροστά στη μοίρα.
Το μουντό και μαυρομάλλη πρόσωπο του Βάσκα Ντενίσοφ και ολόκληρη η πεσμένη φιγούρα του με το κουρελιασμένο (με κοντά δάχτυλα καλυμμένα με μαλλιά) χέρι του, στο οποίο κρατούσε τη λαβή ενός τραβηγμένου σπαθιού, ήταν ακριβώς το ίδιο όπως πάντα, ειδικά το βράδυ, αφού ήπιε δύο μπουκάλια. Ήταν μόνο πιο κόκκινος απ' ό,τι συνήθως, και, πετώντας το δασύτριχο κεφάλι του σαν πουλιά όταν πίνουν, πιέζοντας αδίστακτα τα σπιρούνια του στα πλάγια του καλού Βεδουίνου με τα μικρά του πόδια, σαν να έπεσε πίσω, κάλπασε στην άλλη πλευρά του μοίρα και με βραχνή φωνή φώναξε να επιθεωρήσει πιστόλια. Οδήγησε μέχρι την Κίρστεν. Ο επιτελάρχης, πάνω σε μια φαρδιά και καταπραϋντική φοράδα, οδήγησε προς τον Ντενίσοφ με ρυθμό. Το επιτελείο του καπετάνιου, με τα μακριά του μουστάκια, ήταν τόσο σοβαρό όσο ποτέ, μόνο που τα μάτια του έλαμπαν περισσότερο από το συνηθισμένο.
- Ναι τι? - είπε στον Ντενίσοφ, - δεν θα έρθει σε καυγά. Θα δεις, ας πάμε πίσω.
- Ο Τσογκ «δεν ξέρει τι κάνουν», γκρίνιαξε ο Ντενίσοφ. «Α! Γ» σκελετός! φώναξε στον μαθητή, παρατηρώντας το εύθυμο πρόσωπό του. - Λοιπόν, περίμενα.
Και χαμογέλασε επιδοκιμαστικά, προφανώς χαιρόμενος για το τζούνκερ.
Ο Ροστόφ ένιωθε απόλυτα χαρούμενος. Εκείνη την ώρα, ο αρχηγός εμφανίστηκε στη γέφυρα. Ο Ντενίσοφ κάλπασε κοντά του.
- Το pg σας "υψόμετρο! Αφήστε με να επιτεθώ! Θα τους πετάξω."
«Τι είδους επιθέσεις υπάρχουν», είπε ο αρχηγός με θαμπή φωνή, τσακίζοντας σαν από ενοχλητική μύγα. «Και γιατί στέκεσαι εδώ;» Βλέπετε, οι πλευρές υποχωρούν. Οδηγήστε τη μοίρα πίσω.
Η μοίρα πέρασε τη γέφυρα και βγήκε κάτω από τους πυροβολισμούς χωρίς να χάσει ούτε ένα άτομο. Ακολουθώντας τον, η δεύτερη μοίρα, που ήταν στην αλυσίδα, πέρασε επίσης και οι τελευταίοι Κοζάκοι καθάρισαν εκείνη την πλευρά.
Δύο μοίρες κατοίκων του Pavlograd, έχοντας περάσει τη γέφυρα, η μία μετά την άλλη, πήγαν πίσω στο βουνό. Ο διοικητής του συντάγματος Karl Bogdanovich Schubert οδήγησε στη μοίρα του Denisov και οδήγησε με ρυθμό όχι μακριά από το Rostov, χωρίς να του δώσει καμία σημασία, παρά το γεγονός ότι μετά την προηγούμενη σύγκρουση για τον Telyanin, είδαν ο ένας τον άλλον για πρώτη φορά. Ο Ροστόφ, νιώθοντας στο μέτωπο με τη δύναμη ενός ανθρώπου για τον οποίο θεωρούσε τώρα τον εαυτό του ένοχο, δεν πήρε τα μάτια του από την αθλητική πλάτη, τον ξανθό αυχένα και τον κόκκινο λαιμό του διοικητή του συντάγματος. Στον Ροστόφ φάνηκε ότι ο Μπογκντάνιτς προσποιούνταν απλώς τον απρόσεκτο, και ότι ο στόχος του τώρα ήταν να δοκιμάσει το θάρρος του μαθητή, και ίσιωσε και κοίταξε γύρω του χαρούμενα. τότε του φάνηκε ότι ο Μπογκντάνιτς επέβαινε επίτηδες κοντά για να δείξει στον Ροστόφ το θάρρος του. Τότε σκέφτηκε ότι ο εχθρός του θα έστελνε τώρα σκόπιμα μια μοίρα σε μια απελπισμένη επίθεση για να τον τιμωρήσει, ο Ροστόφ. Θεωρήθηκε ότι μετά την επίθεση θα ερχόταν κοντά του και θα του άπλωνε γενναιόδωρα, τον τραυματία, το χέρι της συμφιλίωσης.

Θησαυρός(από τα ελληνικά θησαυροί - θησαυρός) στη σύγχρονη γλωσσολογία - ένα ειδικό είδος λεξικών γενικού ή ειδικού λεξιλογίου, που υποδεικνύουν σημασιολογικές σχέσεις (συνώνυμα, αντώνυμα, παρώνυμα, υποώνυμα, υπερώνυμα κ.λπ.) μεταξύ λεξικών ενοτήτων. Έτσι, οι θησαυροί, ειδικά σε ηλεκτρονική μορφή, είναι ένα από τα πιο αποτελεσματικά εργαλεία για την περιγραφή επιμέρους θεματικών περιοχών.

Διαφορετικός επεξηγηματικό λεξικό, ο θησαυρός σάς επιτρέπει να προσδιορίσετε το νόημα όχι μόνο με τη βοήθεια ενός ορισμού, αλλά και συσχετίζοντας μια λέξη με άλλες έννοιες και τις ομάδες τους, λόγω των οποίων μπορεί να χρησιμοποιηθεί σε συστήματα τεχνητής νοημοσύνης.

Στο παρελθόν, ο όρος θησαυρός δήλωνε κυρίως λεξικά που αντιπροσώπευαν το λεξιλόγιο της γλώσσας με τη μέγιστη πληρότητα με παραδείγματα χρήσης του σε κείμενα.

Παρωνυμία- μερική ηχητική ομοιότητα των λέξεων με τη σημασιολογική τους διαφορά (πλήρη ή μερική). Τα παρώνυμα είναι συχνά πηγή σφαλμάτων ομιλίας.

Παραδείγματα μονόριζων παρωνύμων: φόρεμα - φόρεσε, ανθρώπινο - ανθρώπινο, πλήρωσε - πλήρωσε - πλήρωσε.

Παραδείγματα εντελώς άσχετων παρωνύμων: βιολογία - βρυολογία, ζωμός - μπρίλον, κομπόστα - κομπλότα, υφή - κάταγμα.

Ωστόσο, ένας θησαυρός είναι κάτι περισσότερο από ένα εργαλείο ανάκτησης πληροφοριών. Ο θησαυρός μπορεί να θεωρηθεί ως ένα καθολικό μοντέλο ενός ορολογικού συστήματος, και επομένως - ως ένα επίσημο σύστημα γνώσης που περιέχεται στη γλώσσα ενός συγκεκριμένου επιστημονικού πεδίου.

Θησαυρός γενικού σκοπού

Ο θησαυρός στον πιο γενικό ορισμό είναι ένα λεξικό με σημασιολογικούς δεσμούς μεταξύ λεξιλογικών μονάδων. Από τα τέλη της δεκαετίας του 1950, οι θησαυροί έχουν χρησιμοποιηθεί σε συστήματα μηχανικής μετάφρασης και συστήματα ανάκτησης πληροφοριών (IPS).

Σε αντίθεση με τα σημασιολογικά λεξικά, τα οποία έχουν σχεδιαστεί για να περιγράφουν λεπτομερώς το γενικό λεξιλόγιο, οι θησαυροί έχουν σχεδιαστεί για να αποθηκεύουν και να ταξινομούν εξαιρετικά συγκεκριμένες λέξεις και φράσεις. Για παράδειγμα, η λέξη ουσίαβρίσκεται στο λεξικό ROSS (Ρωσικό Γενικό Σημασιολογικό Λεξικό) και όλα τα ονόματα των χημικών ενώσεων βρίσκονται ήδη στον θησαυρό.

Ποιες σχέσεις περιγράφονται στον θησαυρό; Συνήθως:

    γένος-είδος (AKO)

    μέρος-ολόκληρο (POF)

    συνωνυμία/αντωνυμία

    προσεταιριστική.

Ένα παράδειγμα σχέσης γένους-είδους

Παράδειγμα σημασιολογικής ανάλυσης

το παραδειγματικός(σταθερές συνδέσεις που υπάρχουν μεταξύ λέξεων σε μια γλώσσα). Και δεν είναι μόνο αυτό.

Συνταγματική(κείμενο) οι σύνδεσμοι δεν αντιπροσωπεύονται στον θησαυρό.

Παράδειγμα: WORDNET - ευφυής θησαυρός υπολογιστή

http://wordnet.princeton.edu/perl/webwn

Δημιουργήθηκε στο Πανεπιστήμιο του Πρίνστον και διανέμεται ελεύθερα.

Βασικά χαρακτηριστικά.

Οι λέξεις σε αυτό ομαδοποιούνται σε συνώνυμες ομάδες ( synsets - συνετ). Χωρίζονται σε 4 λεξικά - ουσιαστικά, επίθετα, ρήματα και επιρρήματα.

Οι συνθέσεις ενώνονται τόσο σε ιεραρχικές σχέσεις (υπώνυμα και υπερώνυμα), όσο και σε σχέση με την αντωνυμία και επίσης τη μερωνυμία (να είναι μέρος κάτι ή να αποτελείται από μέρη).

Το πρόβλημα της μορφολογίας έχει επίσης λυθεί - η λέξη μετά την κλήση στο WN επιστρέφει στην αρχική της μορφή.

Θησαυρός ανάκτησης πληροφοριών

Στον τομέα της ανάκτησης πληροφοριών, οι θησαυροί επωφελούνται από τη μετάβαση από το κείμενο σε περιγραφείς που περιγράφουν ένα αντικείμενο του πραγματικού κόσμου. Η μετάβαση σε περιγραφείς επιτρέπει την εκτεταμένη (περιττή) ευρετηρίαση.

Στον θησαυρό ανάκτησης πληροφοριών, οι ΠΑΡΑΔΕΙΓΜΑΤΙΚΕΣ σχέσεις μεταξύ των περιγραφικών παραγόντων εκφράζονται ρητά (όχι όλες, αλλά αυτές που είναι πιο συχνά σημαντικές για την αύξηση της πληρότητας της ανάκτησης πληροφοριών). Έχει προσδιοριστεί πειραματικά ότι οι πιο σημαντικές παραδειγματικές σχέσεις είναι

    υποταγή

    ομοιότητα

    είδος-γένος (γένος-είδος)

    αιτία-αποτελέσματα

    μέρος-ολόκληρο.

Παράδειγμα καταχώρισης λεξικού:

Agreecultural μηχανές

Συν. γεωργικά μηχανήματα, γεωργικά μηχανήματα,

Θέα: πατατοθεριστής, σπαρτήρας κ.λπ.

Ένα παράδειγμα περιττής ευρετηρίασης

Αίτηση "Agreecultural μηχανές. Agreecultural εξοπλισμός"

Παράδειγμα: Κοινωνικοπολιτικός Θησαυρός του Πληροφοριακού Συστήματος Πανεπιστημίων Ρωσικής Γλώσσας ΡΩΣΙΑ

http://www.cir.ru/index.jsp

Αναπτύχθηκε από τον Αυτόνομο μη κερδοσκοπικό οργανισμό "Center for Information Research" (ANO TsII)

Ο θησαυρός είναι ένας ορολογικός πόρος που υλοποιείται ως λεξικό εννοιών και όρων με συνδέσμους μεταξύ τους. Ο κύριος σκοπός του θησαυρού είναι να βοηθήσει στην ανάκτηση πληροφοριών: με βάση τους συνδέσμους του θησαυρού, το ερώτημα επεκτείνεται, η πλοήγηση στους συνδέσμους του θησαυρού βοηθά στη διατύπωση του ίδιου του ερωτήματος με μεγαλύτερη σαφήνεια.

Ένα χαρακτηριστικό της ιεραρχίας του Thesaurus UIS "Russia" είναι η πολλαπλότητα της ταξινόμησης, δηλαδή, για τις περισσότερες έννοιες, δεν αναζητείται ούτε μία έννοια ταξινόμησης (σύνδεση ABOVE - BELOW), αλλά υπάρχουν διαφορετικές απόψεις για μια συγκεκριμένη έννοια. περιγράφεται, για παράδειγμα, η έννοια του ΚΑΤΑΣΤΗΜΑΤΟΣ μπορεί να θεωρηθεί τόσο ως ΚΤΙΡΙΟ όσο και ως ΕΜΠΟΡΙΚΟΣ ΟΡΓΑΝΙΣΜΟΣ.

Ο θησαυρός για κοινωνικοπολιτικά θέματα, περιλαμβάνει περισσότερες από 26.000 έννοιες, 62.000 όρους, 100.000 άμεσες και 700.000 κληρονομικές σχέσεις μεταξύ εννοιών. Η τρέχουσα έκδοση του Θησαυρού περιγράφει την ορολογία που χρησιμοποιείται στον κοινωνικοπολιτικό τομέα, συμπεριλαμβανομένων των οικονομικών, πολιτικών, στρατιωτικών, νομοθετικών, κοινωνικών, διεθνείς σχέσειςκαι άλλες περιοχές.

Το πλήρες όνομα του Θησαυρού είναι ένας θησαυρός ανάκτησης πληροφοριών για κοινωνικοπολιτικά θέματα για αυτόματη ευρετηρίαση. Εδώ όλοι οι ορισμοί είναι σημαντικοί:

    "ανάκτηση πληροφοριών" - καθώς έχει σχεδιαστεί ειδικά για χρήση στην ανάκτηση πληροφοριών για να βοηθήσει τον χρήστη στη διαμόρφωση (διευκρίνιση) του αιτήματος και να επεκτείνει αυτόματα τους όρους του αιτήματος κατά την αναζήτηση.

    "για κοινωνικοπολιτικά θέματα" - καθώς καλύπτει το 95-99% του λεξιλογίου και της ορολογίας του ρωσικού κειμένου για κοινωνικοπολιτικά θέματα.

    «για αυτόματη ευρετηρίαση» - καθώς αποτελεί τη βάση για τη διαδικασία αυτόματου προσδιορισμού του θέματος των εγγράφων - ομαδοποίηση όρων κοντά στην ιεραρχία του θησαυρού σε θεματικούς κόμβους, αυτόματη κατηγοριοποίηση και αυτόματο σχολιασμό.

Θησαυροί - Συμπέρασμα

Για πολλούς γνωστούς θησαυρούς (WordNet, Roget, EuroWordNet), η αυτόματη εξαγωγή συμπερασμάτων από συνδέσμους θησαυρού παραμένει μεγάλο πρόβλημα - όταν η επέκταση στην πλησιέστερη γειτονιά είναι σωστή, αλλά όχι πλήρης, και οι προσπάθειες επέκτασης της γειτονιάς οδηγούν σε σφάλματα.

ΤΟ ΚΟΥΔΟΥΝΙ

Υπάρχουν εκείνοι που διαβάζουν αυτές τις ειδήσεις πριν από εσάς.
Εγγραφείτε για να λαμβάνετε τα πιο πρόσφατα άρθρα.
ΗΛΕΚΤΡΟΝΙΚΗ ΔΙΕΥΘΥΝΣΗ
Ονομα
Επώνυμο
Πώς θα θέλατε να διαβάσετε το The Bell
Χωρίς ανεπιθύμητο περιεχόμενο