άρθρο του Ευθύμη Βαϊόπουλου*
Ενώ φτιάχνω καφέ στην κουζίνα ακούω ομιλία στο γραφείο. Αναγνωρίζω τη φωνή της γυναίκας μου. Όμως δεν έχει τη ζωντάνια της τηλεφωνικής ή διαδικτυακής συνομιλίας. Μάλλον μοιάζει με υπαγόρευση. Τελικά καταλαβαίνω. Πρόκειται για υπαγόρευση κειμένου στον υπολογιστή, που αξιοποιεί την πρόσφατα αποκτηθείσα “ικανότητα” της μηχανής να αναγνωρίζει την ομιλία και μάλιστα στα ελληνικά.
Συχνά ακούμε για τεχνολογίες που θα αλλάξουν τον κόσμο όπως το Block Chain ή το Internet of Things. Μέσα στις ανατρεπτικές τεχνολογίες που διαφημίζονται σήμερα περιλαμβάνεται και η Τεχνητή Νοημοσύνη. Η Τεχνητή Νοημοσύνη, όμως, έχει μία ουσιαστική διαφορά: δεν αποτελεί απλά μία τεχνολογία, είναι η εξέλιξη των πραγμάτων, όπως ο ατμός και η μηχανική στα τέλη του δέκατου όγδοου αιώνα, το τηλέφωνο και ο ηλεκτρισμός στα τέλη του δέκατου ένατου, το διαδίκτυο στα τέλη του εικοστού.
Αν, πραγματικά, η Τεχνητή Νοημοσύνη είναι το επόμενο μεγάλο βήμα της ανθρωπότητας, τότε πολίτες και επιχειρήσεις πρέπει να εξοικειωθούμε μαζί της και να μάθουμε να την αξιοποιούμε και να την προάγουμε. Πρώτα-πρώτα πρέπει να καλλιεργήσουμε κλίμα εμπιστοσύνης στην Τεχνητή Νοημοσύνη. Αυτό προϋποθέτει τη μέριμνα για χρήση ηθικών, αμερόληπτων και, κατά το δυνατόν, ερμηνεύσιμων αλγορίθμων και κυρίως την εξάλειψη του φόβου της κοινωνίας για τις “νοήμονες” μηχανές. Έχοντας κερδίσει την εμπιστοσύνη στις μηχανές που “σκέφτονται”, μπορούμε να κάνουμε αποφασιστικότερα βήματα στην κατεύθυνση αξιοποίησης της Τεχνητής Νοημοσύνης στην καθημερινότητα των ανθρώπων και τη λειτουργία των επιχειρήσεων (4η βιομηχανική επανάσταση).
Ένα παράδειγμα χρήσης της Τεχνητής Νοημοσύνης στην καθημερινότητα ενός εργαζόμενου αναφέρθηκε στην αρχή του άρθρου. Είναι αυτό της αναγνώρισης ομιλίας (speech recognition) από τη μηχανή, δηλαδή από προγράμματα όπως η υπηρεσία μηνυμάτων στο κινητό τηλέφωνο ή ο κειμενογράφος στον προσωπικό υπολογιστή. Πριν από 50 χρόνια για να γραφτεί μία επιστολή χρειαζόταν μία δακτυλογράφος και μία γραφομηχανή. Πριν από 30 χρόνια η γραφομηχανή αντικαταστάθηκε από τον προσωπικό υπολογιστή και όλοι, σιγά-σιγά, γίναμε δακτυλογράφοι. Σήμερα, αντί να πληκτρολογεί κάποιος το κείμενο στον υπολογιστή, έχει πλέον τη δυνατότητα να το υπαγορεύει. Ενδιάμεσα, μπορεί να πληκτρολογεί μικρές διορθώσεις και προσθήκες και, τελικά, το κείμενο είναι έτοιμο ταχύτερα, ευκολότερα και, το κυριότερο, πιο ποιοτικά. Η υπαγόρευση κειμένου στον υπολογιστή έχει πλεονεκτήματα: μπορεί κάποιος γρήγορα να μεταφέρει χειρόγραφο κείμενο σε ηλεκτρονική μορφή ή να καταγράφει τις σκέψεις του κατευθείαν στον υπολογιστή, χωρίς να χρειάζεται να πληκτρολογεί φράσεις ολόκληρες και να χάνει τον ειρμό στη σκέψη του (που συχνά συμβαίνει, ιδιαίτερα με ανθρώπους που η πληκτρολόγηση δεν είναι το φόρτε τους).
Η προφορική επικοινωνία με το μηχάνημα, όνειρο δεκαετιών, που σήμερα έρχεται σαν επικουρική του πληκτρολογίου διεπαφή του χρήστη με τον υπολογιστή, υπόσχεται μαζί με την αφή την πλήρη αντικατάσταση του πληκτρολογίου στο μέλλον και συνακόλουθα την εκρηκτική διεύρυνση της χρήσης των μηχανών. Η αναγνώριση της ομιλίας (speech recognition) και η κατανόηση της φυσικής γλώσσας (natural language understanding) από τη μηχανή είναι οι δύο τεχνολογίες που θα επιτρέψουν το διάλογο ανθρώπου – μηχανής με ερωταποκρίσεις. Φυσικά μιλάμε για διάλογο στο πλαίσιο σαφώς οριοθετημένων προβλημάτων, όπως, για παράδειγμα, την αναζήτηση απαντήσεων για συγκεκριμένο γνωστικό αντικείμενο. Η αναγνώριση ομιλίας, η κατανόηση φυσικής γλώσσας και η μηχανική όραση (computer vision) αποτελούν τις τρεις κύριες περιοχές ανάπτυξης και εφαρμογής της Τεχνητής Νοημοσύνης.
Όσον αφορά την εφαρμογή της Τεχνητής Νοημοσύνης στη λειτουργία των επιχειρήσεων, οι εξελίξεις δείχνουν ότι οι ανάγκες για μηχανική όραση και η σχετική βασική έρευνα και τεχνολογία έχουν ωριμάσει σε βαθμό που μπορεί να πυροδοτηθεί βιομηχανική έρευνα με εφαρμογές σε πολλούς κλάδους της οικονομίας. Σήμερα, είναι εφικτή η μηχανική αναγνώριση και ο εντοπισμός αντικειμένων σε εικόνα ή video σε πραγματικό χρόνο, γεγονός που αποτελεί ουσιαστικό βήμα στην γενικότερη επιστημονική προσπάθεια ανάπτυξης της ικανότητας των μηχανών να έχουν οπτική αντίληψη του τι συμβαίνει στο περιβάλλον τους (τεχνητή οπτική αντίληψη – artificial visual perception). Η αναγνώριση αντικειμένων σε εικόνα ή video με τον ταυτόχρονο εντοπισμό τους μέσα στην εικόνα (ή το video) είναι ευρύτερα γνωστή με τον όρο ανίχνευση αντικειμένων (object detection).
Η δυνατότητα των μηχανών να αναγνωρίζουν αντικείμενα στον περιβάλλοντα χώρο με ακρίβεια και ταχύτητα ανταγωνιστική του ανθρώπου φέρνει μια νέα βιομηχανική επανάσταση, την 4η βιομηχανική επανάσταση, καθώς ανοίγει νέες προοπτικές στη μηχανική παρακολούθηση της γραμμής παραγωγής και στην ανίχνευση ελαττωματικών προϊόντων, στον αυτόματο έλεγχο των αποθεμάτων στις αποθήκες και στα ράφια, στη μηχανική επιτήρηση της κίνησης των πλοίων σε λιμένες και διαύλους, στη μηχανική υποστήριξη της παρακολούθησης και του ελέγχου της καλλιέργειας, στην υποβοήθηση της ιατρικής πράξης και της ιατρικής διάγνωσης με μηχανικό εντοπισμό ευρημάτων σε ιατρικές απεικονίσεις και εξετάσεις.
Η Τεχνητή Νοημοσύνη, αν και ακόμη σε εμβρυακό στάδιο, είναι πλέον πραγματικότητα και αναμένεται να αλλάξει τον τρόπο που ζούμε και εργαζόμαστε. Αν χρησιμοποιηθεί σύμφωνα με τις ανθρώπινες αξίες, τότε μπορεί να συντελέσει στην βελτίωση της ποιότητας ζωής όλων.
* Ο Ευθύμης Βαϊόπουλος είναι Φυσικός με Μεταπτυχιακό Τίτλο Σπουδών στα Πληροφοριακά Συστήματα, ασχολείται με την επιστήμη των δεδομένων και είναι μέλος του AICatalyst.