DIASTEMA (Τ2ΕΔΚ-04612)

Δεδομενο-στρεφής υποδομή τεχνολογιών για διαχείριση και ανάπτυξη εφαρμογών μεγάλων δεδομένων

Το Έργο

Είναι γεγονός πως ζούμε σε μία δεδομενο-κεντρική κοινωνία. Καθώς η πλειοψηφία των προσεγγίσεων σχετικά με την επεξεργασία δεδομένων και δεδομενο-κεντρικών εφαρμογών (π.χ. Hadoop, Spark, Hive, κτλ.) εκτελούνται σε τυποποιημένα συστήματα διαχείρισης υποδομών (π.χ. Mesos, Docker, OpenStack, κτλ.), το DIASTEMA θα προσφέρει ένα δεδομενο-κεντρικό σύστημα διαχείρισης πόρων το οποίο θα είναι πλήρως αποτελεσματικό και βελτιστοποιημένο για λειτουργίες δεδομένων, διαχειρίζοντας πόρους σύμφωνα με δεδομενο-στρεφείς αποφάσεις. Ο βασικός στόχος είναι να παρέχονται τα «Δεδομένα ως Υπηρεσία» ως μία βέλτιστη λύση, η οποία θα εκτελείται σε ένα περιβάλλον που θα καθίσταται διαχειρίσιμο μέσω δεδομενο-στρεφών λύσεων, μετατρέποντας τα ακατέργαστα δεδομένα σε πολύτιμη γνώση, μέσω της ανάπτυξης λειτουργιών που θα βασίζονται σε ολόκληρο τον κύκλο ζωής των δεδομένων.

Ειδικότερα, τα οφέλη του DIASTEMA απεικονίζονται μέσω μία πλήρους «στοίβας» που στοχεύει τόσο στο να διευκολύνει τις ανάγκες των δεδομένων και των εφαρμογών (οι οποίες τείνουν να είναι δεδομενο-στρεφείς), όσο και στο να διευκολύνει τις ανάγκες αυτές κατά τον βέλτιστο τρόπο, μέσω της παροχής ενός ολοκληρωμένου περιβάλλοντος διαχείρισης υποδομών, αποτελούμενο από έξι (6) βασικούς πυρήνες:

• Ο 1ος πυρήνας αναφέρεται στο λειτουργικό σύστημα που θα χρησιμοποιείται για την αποτελεσματική και βελτιστοποιημένη διαχείριση υποδομών. Όλες οι αποφάσεις θα βασίζονται στα δεδομένα, προτείνοντας έτσι το λειτουργικό σύστημα αποκλειστικά δεδομενο-κεντρικές, και όχι υπηρεσιο-κεντρικές λύσεις.

• Ο 2ος πυρήνας εκμεταλλεύεται το σύστημα διαχείρισης δεδομενο-κεντρικών υποδομών προκειμένου να παρέχει τεχνικές «Δεδομένων ως Υπηρεσία» με αποτελεσματικό, αποδοτικό και ελαστικό τρόπο. Οι εν λόγω τεχνικές θα ενσωματώνουν ένα σύνολο τεχνολογιών βάσει ολόκληρου του κύκλου ζωής των δεδομένων, όπως για παράδειγμα τη μοντελοποίηση, τον καθαρισμό, και την ανάλυση των δεδομένων.

• Ο 3ος πυρήνας αναφέρεται στο Περιβάλλον Απεικόνισης των Δεδομένων που ξεπερνά την απλή αναπαράσταση των δεδομένων και της ανάλυσής τους, οδηγώντας σε προσαρμόσιμες απεικονίσεις κατά έναν αυτόματο τρόπο σύμφωνα με την ανάλυση των εφαρμογών και τη σημασιολογία των δεδομένων.

• Ο 4ος πυρήνας αναφέρεται στο Πολυεργαλείο Δεδομένων, το οποίο επιτρέπει τη συγχώνευση των λειτουργιών ανάλυσης δεδομένων και τον ορισμό των τεχνικών ανάλυσης δεδομένων, παρέχοντας ταυτόχρονα συμβουλές στο σύστημα διαχείρισης υποδομών σχετικά με το βέλτιστο τρόπο που μπορούν να πραγματοποιηθούν οι εν λόγω αναλύσεις.

• Ο 5ος πυρήνας αναφέρεται στη Μοντελοποίηση Διαδικασιών, όπου παρέχεται μία υποδομή που επιτρέπει την ευέλικτη μοντελοποίηση της ανάλυσης των διαδικασιών προκειμένου να εκτελεστούν.

• Ο 6ος πυρήνας αναφέρεται στο Πολυεργαλείο Διαστασιολόγησης Εφαρμογών, το οποίο στοχεύει στη διαστασιολόγηση των εφαρμογών ώστε να προβλέπονται οι απαιτούμενες υπηρεσίες δεδομένων, οι εξαρτήσεις τους με τις μικρο-υπηρεσίες των εφαρμογών και οι απαραίτητοι πόροι.

Στόχοι

  • Βελτιστοποίηση & Ελαστικότητα: Σχεδιασμός και υλοποίηση ενός ολοκληρωμένου δεδομενο-στρεφούς περιβάλλοντος πραγματικού χρόνου, στοχεύοντας σε λειτουργίες δεδομένων και δεδομενο-στρεφείς εφαρμογές.
  • Διασταστιολόγηση & Αυτοματισμός: Κατανόηση και μοντελοποίηση κατανεμημένων εργασιών ανάλυσης δεδομένων και εξόρυξης διαδικασιών, καθώς και δεδομένω-στρεφών εφαρμογών με στόχο τη δυναμική σύνταξη μοτίβων ανάπτυξης.
  • Αυτοματισμός, Προσαρμοστικότητα & Ποιότητα: Υλοποίηση «Δεδομένων ως Υπηρεσία» μέσω λειτουργιών δεδομένων κατά μήκους του κύκλου ζωής των δεδομένων.
  • Προσβασιμότητα & Ευελιξία: Παροχή ενός Πολυεργαλείου Δεδομένων και ενός προσαρμοζόμενου Περιβάλλοντος Απεικονίσεων.
  • Εφαρμογή & Επικαιροποίηση: Επίδειξη των καινοτομιών του DIASTEMA μέσω διαφορετικών περιπτώσεων χρήσης.
  • Μονιμότητα & Ανταγωνιστικό Πλεονέκτημα: Καθορισμός τρόπων εκμετάλλευσης των αποτελεσμάτων και των στρατηγικών.

Αποτελέσματα

Συνεισφορά σε μία δεδομενο-κεντρική οικονομία

Οι ανθρώπινες δραστηριότητες, οι επιχειρησιακές διαδικασίες και οι έρευνες οδηγούν στη συλλογή και επεξεργασία δεδομένων, δημιουργώντας προϊόντα, υπηρεσίες, και μεθοδολογίες. Σαν αποτέλεσμα, τα δεδομένα βρίσκονται στο κέντρο της οικονομίας και κοινωνίας των γνώσεων, οδηγώντας σε μία δεδομενο-κεντρική οικονομία. Η τελευταία έχει ανάγκη να εφαρμόζει ανάλυση στα δεδομένα της, προσφέροντας καλύτερα αποτελέσματα και αποφάσεις, συμβάλλοντας στην παραγωγή ανταγωνιστικών ιδεών. Εκτός των δεδομένων, υπάρχει μια αυξανόμενη ανάγκη ενίσχυσης των τεχνικών υποδομών, καθώς “τα μεγάλα δεδομένα χρειάζονται εξυπνότερες, και όχι μεγαλύτερες υποδομές”, υποδεικνύοντας την ανάγκη δημιουργίας περιβαλλόντων σχετιζόμενων με την δεδομενο-κεντρική οικονομία. Προτεινόμενη πράξη: Το DIASTEMA θα παρουσιάσει μία ολιστική δεδομενο-κεντρική λύση βασιζόμενη σε ένα λειτουργικό σύστημα, ως ιδανικό περιβάλλον τεχνικών «Δεδομένων ως Υπηρεσία», παρέχοντας ακριβή δεδομένα και αποτελέσματα, διευκολύνοντας τις ανάγκες των δεδομενο-κεντρικών εφαρμογών, όπως απαιτείται από τους εκάστοτε εμπλεκομένους.

Συνεισφορά στην επιχειρησιακή προσαρμοστικότητα και ανταγωνιστικότητα

Τα δεδομένα είναι ένα ισχυρό εργαλείο για επιχειρήσεις που ψάχνουν να παράγουν νέα αποτελέσματα. Ωστόσο, χωρίς σωστές υποδομές για την κατανόησή τους, μεγάλο μέρος της πληροφορίας αυτής δεν γίνεται εκμεταλλεύσιμη. Η αναπαράσταση των δεδομένων είναι αυτή που τους επιτρέπει να εμφανίσουν την πραγματική τους δύναμη, και να επιτρέψει σε επιχειρήσεις όπως την Amazon, Facebook, και Netflix να προβούν σε καλύτερες αποφάσεις, αυξάνοντας την αποτελεσματικότητά τους, παραδίδοντας σωστής μορφής δεδομένα στους σωστούς ανθρώπους. Προτεινόμενη πράξη: Το DIASTEMA θα παρέχει το Πολυεργαλείο Δεδομένων όπου θα επιτρέπει στις επιχειρήσεις να αναλύουν τα δεδομένα τους, καθώς και να αξιοποιούν τα εξαγόμενα αποτελέσματα, αλλά και το Περιβάλλον Απεικονίσεων το οποίο θα επιτρέπει στις επιχειρήσεις να απεικονίζουν τα αποτελέσματα με διαφορετικούς τρόπους, έχοντας τη δυνατότητα τροποποίησής τους.

Στρατηγική συνεισφορά

Όπως καταγράφεται στο Gartner Hype Cycle, κομβικής σημασίας είναι η έρευνα στον τομέα των «Advanced Analytics With Self-Service Delivery». Το DIASTEMA, θα διευκολύνει τη χρήση προηγμένων αναλύσεων, όχι μόνο μέσα από μια κατανεμημένη και βαθμιαία αντιμετώπιση, αλλά και με τη σύνταξη των δεδομένων που συλλέγονται, ώστε να μπορούν να αναλυθούν ακόμη και αν προέρχονται από διαφορετικές πηγές. Μια επιπλέον τεχνολογία όπου απευθύνεται το DIASTEMA, είναι αυτή του «Citizen Data Science», η οποία επιτρέπει σε επιχειρηματίες να εξερευνούν και να αναλύουν τα δεδομένα τους βάσει των προτιμήσεών τους, μέσω του Πολυεργαλείου Δεδομένων.

Επιπλέον, το DIASTEMA αποκρίνεται σε προτεραιότητες που έχουν αναγνωριστεί στην έρευνα της BDVA Strategic Research and Innovation Agenda (SRIA). Αναφορικά με το «Data Processing Architectures», το DIASTEMA παρέχει μια αδιάλειπτη προσέγγιση, ενεργοποιώντας αναλύσεις δεδομένων σε πραγματικό χρόνο, ενώ βασίζει ολόκληρο το σύστημα διαχείρισης υποδομής σε μια αρχιτεκτονική που έχει ως βάση την αποκεντροποίηση των δεδομένων, η οποία θα αναπτύσσεται και θα προσαρμόζεται, ώστε να επεξεργάζεται αποτελεσματικά μεγάλο όγκο δεδομένων. Επιπροσθέτως, το DIASTEMA απευθύνεται στο «Data Analytics» μέσω εργαλείων ανάλυσης, που παρέχουν δυνατότητες αναγνώρισης προτύπων, καθώς και προηγμένης μηχανικής και λογικής μάθησης. Ταυτόχρονα δίνεται έμφαση στην παραλληλοποίηση και τη βαθμιαία επεξεργασία αυτών των αναλύσεων, με σκοπό την αποτελεσματική αξιοποίηση των παραπάνω τεχνικών, στοχεύοντας στο «Data Management», λόγω των τεχνικών «Δεδομένων ως Υπηρεσία» που οραματίζεται να υλοποιήσει. Επίσης, το DIASTEMA απευθύνεται στο θέμα «Data Visualisation and User Interaction» μέσω της απεικόνισης των δεδομένων, η οποία θα προσαρμόζεται ανάλογα με τις πηγές δεδομένων και τις προτιμήσεις/ανάγκες των χρηστών.

Partners