Η πρόοδος της τεχνολογίας οδήγησε ήδη από τη δεκαετία του 1980 στην εταιρικά προσβάσιμη τεχνογνωσία αλλά και υλική υποδομή για την αποθήκευση ενός διαρκώς αυξανόμενου όγκου δεδομένων. Καθώς τα δεδομένα αυτά έκρυβαν πολύτιμες πληροφορίες για την επιχειρηματική δραστηριότητα, αρχικά χρησιμοποιήθηκαν στατιστικές μέθοδοι για την εξαγωγή τους. Ωστόσο, οι μέθοδοι αυτές δεν ήταν αποδοτικές για τους όγκους δεδομένων που ήταν απαραίτητο να τύχουν επεξεργασίας. Έτσι από το 1995 ήδη έγιναν οι πρώτες δράσεις έρευνας και εφαρμογής μεθόδων εξόρυξης γνώσης (Data Mining and Knowledge Discovery) [1].
Στις μέρες μας, παρότι το πεδίο εξόρυξης γνώσης είναι ενδελεχώς ανεπτυγμένο, παρουσιάζεται ένα διαφορετικό πρόβλημα. Η πολυδιάσπαση της (εταιρικής) πληροφορίας σε διαφορετικές μορφές, που πολύ συχνά δεν είναι προσανατολισμένες για μηχανική επεξεργασία ούτε βασίζονται σε μια δεδομένη δομή, την κατακερματίζει διατηρώντας την πολύτιμη γνώση της πληροφορίας κρυμμένη [4]. Συνήθη παραδείγματα τέτοιου κατακερματισμού είναι τα μηνύματα email, έγγραφα, δεδομένα σε εφαρμογές κινητής πλατφόρμας, διάδραση σε υπηρεσίες κοινωνικής δικτύωσης, κ.ά.
Παρότι τα περισσότερα από αυτά, εσωτερικά στην υπηρεσία διάθεσής τους, είναι δομημένα και οργανωμένα, απουσία διεπαφής της οργάνωσης αυτής με τις μεθόδους του τελικού χρήστη παρουσιάζονται ως μη δομημένη και οργανωμένη πληροφορία.
Αναφορές [2,4] δείχνουν πως 80-90% της διαθέσιμης εταιρικής πληροφορίας βρίσκεται στην προαναφερθείσα κατάσταση και ακολούθως είναι μη διαθέσιμη με αποτέλεσμα αποφάσεις που δεν βασίζονται στην πλήρη εικόνα, μη εκμετάλλευση επιχειρηματικών ευκαιριών, περιορισμένη παραγωγικότητα, πελατολόγιο που δεν είναι ικανοποιημένο και πολλά άλλα.
Η τεχνολογία των αποθηκών δεδομένων (data warehouses) έχει ως κεντρικό ρόλο να ολοκληρώσει ετερογενείς πηγές πληροφορίας ώστε να είναι έτοιμες για τις μεθόδους εξαγωγής γνώσης [3].
Με τη χρήση των data warehouses (που συνήθως διατηρούν αντίγραφο των δεδομένων των πηγών τους) [3] είναι δυνατό να:
- Συνενωθούν πολλαπλές πηγές σε μία βάση δεδομένων ώστε να είναι δυνατή η δημιουργία ερωτημάτων,
- Αντιμετωπιστεί το πρόβλημα δημιουργίας ερωτημάτων που απαιτούν πολύ χρόνο εκτέλεσης και κλειδώνουν την βάση για τα υπόλοιπα,
- Υπάρχει ιστορικό των δεδομένων παρότι η αρχική πηγή δεν διατηρούσε,
- Ολοκληρωθούν πηγές διαφορετικές ως προς το σχήμα και τη διεπαφή σε ένα ενιαίο σύστημα,
- Βελτιωθεί η ποιότητα των δεδομένων έχοντας συνεπή περιγραφή και μεθοδολογία αναφοράς στα δεδομένα,
- (Επανα)δομηθούν τα δεδομένα ώστε να είναι εκμεταλλεύσιμα στο επιχειρηματικό περιβάλλον,
- (Επανα)δομηθούν τα δεδομένα ώστε να είναι αποδοτική η αναζήτηση σε αυτά
Είναι λοιπόν προφανές πως με δεδομένες την ανάγκη (πολλές εταιρίες με όγκο διάσπαρτων δεδομένων 10 Tebibyte – 1 Pebibyte) και την ήδη ώριμη τεχνογνωσία (~20 χρόνια έρευνας και ανάπτυξης στην εξόρυξη γνώσης και της αποθήκες δεδομένων) η Διαχείριση Επιχειρηματικής Πληροφορίας (Enterprise Information Management) ήρθε για να μείνει.
Επικοινωνήστε μαζί μας για να συζητήσουμε πώς μπορείτε να αυξήσετε το βαθμό ολοκλήρωσης των μεθόδων συλλογής πληροφορίας από ετερογενείς πηγές ώστε να αποκτήσετε πρόσβαση στην κρυμμένη πληροφορία των δεδομένων σας με οφέλη στην επιχείρηση και τους πελάτες σας.
Πηγές: