Του Δρα Δημήτρη Βογιατζή*
Μία μεγάλη πρόκληση των συστημάτων υγείας στην Ευρώπη είναι η εξισορρόπηση της υγειονομικής περίθαλψης με το κόστος παροχής της. Για παράδειγμα, το 2009, ο καρκίνος στοίχισε στην Ευρωπαϊκή Ένωση 126 δις ευρώ, με τις δαπάνες της περίθαλψης να ανέρχονται σε 51 δις ευρώ (40%). Ο καρκίνος με το υψηλότερο οικονομικό κόστος ήταν ο καρκίνος του πνεύμονα (18,8 δις ευρώ, 15% του συνολικού κόστους καρκίνου). Από την άλλη, οι συννοσηρότητες σε πολλούς ασθενείς περιπλέκουν το πώς λαμβάνουν αποφάσεις οι ογκολόγοι.
Συχνά υπoεκπροσωπούνται στις κλινικές δοκιμές, και οι πληροφορίες σχετικά με την αποτελεσματικότητα των θεραπειών προέρχονται από μελέτες σε νεότερους ασθενείς δίχως συννοσηρότητες, με αποτέλεσμα η αντιμετώπισή τους να είναι συχνά ανεπαρκής και όχι εξατομικευμένη, επηρεάζοντας επίσης συνολικά την επιβίωση. Αυτοί οι περιορισμοί οδήγησαν σε μεγάλο κοινωνικοοικονομικό άχθος, καθώς οι ασθενείς δεν ήταν σε θέση να συνεχίσουν να εργάζονται.
Βιοϊατρικά δεδομένα και προκλήσεις
H Επιστήμη Δεδομένων μπορεί να συμβάλει στη διαχείριση ασθενών με καρκίνο κατά τη διάρκεια της θεραπείας και της παρακολούθησής τους αλλά και στο τελικό στάδιο της ασθένειας, με στόχο να βελτιώσει την εμπειρία, την ικανοποίηση, τα βασικά αποτελέσματα, καθώς και να ελαφρύνει το σύστημα υγείας από σημαντικό κόστος.
Η Επιστήμη Δεδομένων βασίζεται στην ανάλυση όγκων μεγάλων δεδομένων με στόχο να αναδείξει κρυφά πρότυπα, τάσεις, κ.λπ. καθώς και να διευκολύνει τη λήψη αποφάσεων. Αυτήν τη στιγμή υπάρχει αφθονία βιοϊατρικών δεδομένων που μπορούν να χρησιμοποιηθούν για το πρόβλημα της αντιμετώπισης του καρκίνου του πνεύμονα. Οι τεχνικές της Επιστήμης Δεδομένων μπορούν να συμβάλουν στον εντοπισμό ομάδων με τους μακροβιότερους ασθενείς με καρκίνο του πνεύμονα, στην ανάλυση όλων των σημαντικών παραγόντων οι οποίοι βρέθηκαν να συνδέονται με μακρά επιβίωση, και στη σύγκριση ασθενών με υψηλό προσδόκιμο επιβίωσης σε σχέση με τους υπόλοιπους ασθενείς, με στόχο την αναζήτηση και ανεύρεση συγκεκριμένων προτύπων. Επιπλέον, η Επιστήμη των Δεδομένων μπορεί να συμβάλει στον εντοπισμό φαρμακοτοξικοτήτων.
Η πρόκληση των βιοϊατρικών δεδομένων είναι ότι εμπεριέχουν δομημένες και αδόμητες πληροφορίες. Για παράδειγμα, τα Ηλεκτρονικά Μητρώα Υγείας (EHR) περιέχουν δημογραφικά δεδομένα, τα οποία μπορεί να θεωρηθούν δομημένα. Όμως τα Ηλεκτρονικά Μητρώα Υγείας περιέχουν επίσης αξιολογήσεις γνωματεύσεων ιατρικών εξετάσεων ως ελεύθερο κείμενο, το οποίο είναι αδόμητο. Επιπλέον, τα αποθετήρια άρθρων βιοϊατρικής (όπως το PubMed) είναι επίσης αδόμητες πηγές πληροφοριών. Ένας άλλος διαχωρισμός που περιπλέκει ακόμα περισσότερο την ανάλυση είναι ότι υπάρχουν ανοικτές πηγές (π.χ. PubMed) και ευαίσθητες πηγές δεδομένων (όπως π.χ. τα ΗΜΥ). Όλες αυτές οι ανομοιογενείς πληροφορίες πρέπει να συγκεντρωθούν, ή με άλλα λόγια, να ενοποιηθούν σε μία κεντρική τοποθεσία και με τρόπο που να συνδέονται σημασιολογικά.
Data Analytics σε ετερογενή βιοϊατρικά δεδομένα
Το πρώτο βήμα είναι η ανάλυση των Ηλεκτρονικών Μητρώων Υγείας ασθενών με σκοπό την εξαγωγή πληροφοριών σχετικών με πραγματοποιηθείσες ιατρικές εξετάσεις, αποτελέσματα και ιατρικά σημειώματα. Αυτό το βήμα περιλαμβάνει τη χρήση τεχνικών Επεξεργασίας Φυσικής Γλώσσας. Καθώς τα Ηλεκτρονικά Μητρώα Υγείας περιέχουν ευαίσθητα προσωπικά δεδομένα.
Το επόμενο βήμα είναι η εξασφάλιση βιοϊατρικών άρθρων –ως επί το πλείστον από το δημόσιο αποθετήριο PubMed– σχετικών με τον καρκίνο του πνεύμονα. Στη συνέχεια, πραγματοποιείται μία ανάλυση αυτών των άρθρων για την εξαγωγή πληροφοριών σχετικά με θεραπείες, φάρμακα και αλληλεπιδράσεις φαρμάκων. Η ανάλυση αυτή επίσης απαιτεί την εφαρμογή τεχνικών Επεξεργασίας Φυσικής Γλώσσας. Ένα σημαντικό θέμα είναι η ποιότητα της πληροφορίας. Φυσικά, η πληροφορία προέρχεται από άρθρα τα οποία έχουν εκδοθεί, επομένως πόσο πρόσφατη είναι η έκδοση, ο βαθμός επιρροής του ερευνητικού περιοδικού ή η φύση του άρθρου μπορούν να συμβάλουν στον υπολογισμό της ποιότητας της εξαγόμενης πληροφορίας.
Τέλος, οι πληροφορίες από άρθρα και ΗΜΥ μπορούν να ενοποιηθούν σε ένα γράφημα γνώσης (ΚΒ) που συνενώνει σχετικές πληροφορίες. Έτσι, το γράφημα γνώσης επιτρέπει μία σημασιολογική αναπαράσταση όλων των πληροφοριών που προέρχονται από διαφορετικές πηγές. Το γράφημα γνώσης μπορεί να παραγάγει analytics σχετικά με τις καμπύλες επιβίωσης των ασθενών λαμβάνοντας υπόψη διάφορες πληροφορίες, όπως φύλο, ηλικία, οικογενειακό προηγούμενο, ιατρικά τεστ που πραγματοποιήθηκαν.
Eπιπλέον, από το Γράφημα Γνώσης μπορούμε να λάβουμε πληροφορίες για την τοξικότητα των φαρμάκων. Για παράδειγμα, είναι αρκετά σύνηθες για ογκολογικούς ασθενείς να λαμβάνουν μη ογκολογικά φάρμακα για συννοσηρότητες. Η έγκαιρη πληροφόρηση σχετικά με τις ανεπιθύμητες ενέργειες από την αλληλεπίδραση των φαρμάκων μπορεί να αποτρέψει την τοξικότητα και πιθανόν να μειώσει τον χρόνο νοσηλείας. Παρόλο που οι πληροφορίες για την τοξικότητα των φαρμάκων προέρχεται από δημόσια ιατρικά αποθετήρια, τα analytics μπορούν να χρησιμοποιηθούν για να εξαχθούν τοξικότητες μέχρι τώρα μη καταγεγραμμένες.
Για να μάθετε περισσότερα γύρω από την Επιστήμη Δεδομένων στον τομέα της υγείας, επισκεφθείτε τα ακόλουθα πρότζεκτ, που επιδοτούνται από την Ευρωπαϊκή Ένωση:
Bigmedilitcs, https://www.bigmedilytics.eu/big-data-project/
iASIS, https://www.project-iasis.eu/

Ο Δρ Δημήτρης Βογιατζής είναι υπεύθυνος του μεταπτυχιακού προγράμματος MS in Data Science στο Deree – The American College of Greece.
Οι πιο πρόσφατες Ειδήσεις
Διαβάστε πρώτοι τις Ειδήσεις για ό,τι συμβαίνει τώρα στην Ελλάδα και τον Κόσμο στο thetoc.gr