Automated big data quality assessment and enhancement through data curation
Αυτοματοποιημένη αξιολόγηση και βελτίωση της ποιότητας δεδομένων μεγάλου όγκου μέσω της επιμέλειας δεδομένων
"Η ανεπαρκής ποιότητα των δεδομένων οδηγεί σε λανθάνουσα επεξεργασία των ιατρικών δεδομένων, η οποία καθιστά τα δεδομένα ανώφελα και έχει ποικίλες επιζήμιες επιπτώσεις στη μετέπειτα επεξεργασία τους. Η υπηρεσία αυτή αποσκοπεί στη μετατροπή των μη δομημένων ιατρικών δεδομένων σε μίας νέας μορφής που θα ικανοποιεί προκαθορισμένες απαιτήσεις ποιότητας. Τα μέτρα ποιότητας περιλαμβάνουν, μεταξύ άλλων, την ευστοχία, την πληρότητα, τη συνέπεια, την ερμηνευσιμότητα, τη συνάφεια και την ευκολία του χειρισμού τους. Ο εντοπισμός και η αφαίρεση των διπλότυπων πεδίων, ο χαρακτηρισμός των δεδομένων σύμφωνα με το περιεχόμενό τους, ο εντοπισμός πεδίων με ιδιαίτερα συναφείς κατανομές, ο μετασχηματισμός των δεδομένων σε τυποποιημένες μορφές, η αντιμετώπιση των ελλιπών τιμών μέσω ειδικά διαμορφωμένων υπολογισμών, και η ανίχνευση ακραίων τιμών για τον εντοπισμό τιμών που αποκλίνουν από το τυπικό εύρος των δεδομένων είναι ορισμένοι από τους μηχανισμούς για την επιμέλεια των αναδρομικών δεδομένων. Ενώ περιορισμοί ελέγχου μπορούν να χρησιμοποιηθούν για την υλοποίηση μηχανισμών για την επιμέλεια προοπτικών δεδομένων."