Οι γραφηματικές αναπαραστάσεις δεδομένων έχουν χρησιμοποιηθεί για την επίτευξη πολύ καλής απόδοσης στις εργασίες ταξινόμησης κειμένου. Η δομή στην οποία στηρίζονται οι γράφοι γνώσης και οι μεγάλες βάσεις γνώσεις που περιέχουν πλούσια πληροφορία σχετικά με τις οντότητες του κόσμου είναι σε ένα μεγάλο βαθμό ίδια. Σε αυτό το άρθρο αξιοποιείται τα μοντέλο γραφήματος λέξεων και εμπλουτίζεται με έννοιες από γράφους γνώσης, με αποτέλεσμα μια πιο εκφραστική, υβριδική αναπαράσταση ενός σώματος κειμένων. Για την πρακτική εφαρμογή της μεθόδου, το άρθρο εστιάζει στην περιοχή της ταξινόμησης ιατρικών κειμένων με χρήση ιατρικών οντολογιών ώστε να αξιολογηθεί η επίδοση της και να αναλυθούν διάφορες εναλλακτικές σε σχέση με τα μοντέλα αναπαράστασης κειμένου και τεχνικές ενσωμάτωσης γνώσης. Η μέθοδος που προτείνεται παράγει αναπαραστάσεις κειμένων που είναι και εξηγήσιμες αλλά και βελτιώνουν την ακρίβεια στο πρόβλημα ταξινόμησης OHSUMED, ξεπερνώντας νευρωνικά δίκτυα όπως τα GraphStar και Text GCN.
Enriching Graph Representations of Text: Application to Medical Text Classification
International Conference on Complex Networks and their Applications, Madrid, Spain.
COMPLEX NETWORKS 2020: Complex Networks and their Applications IX pp 92-103.