Το πρώτο πλήρως αυτοματοποιημένο πρόγραμμα υπολογιστή το οποίο διδάσκει μόνο του στον εαυτό του όλα όσα πρέπει να γνωρίζει για οποιαδήποτε οπτική έννοια δημιούργησαν ερευνητές του University of Washington (UW) και του Allen Institute for Artificial Intelligence.
To όνομα του προγράμματος είναι LEVAN (Learning Everything About Anything), και αναζητεί σε εκατομμύρια πηγές και φωτογραφίες στο Web για να «μάθει» όλες τις πιθανές εκδοχές μίας έννοιας. Στη συνέχεια παρουσιάζει στους χρήστες τα αποτελέσματα ως μία αναλυτική λίστα εικόνων, βοηθώντας στην γρήγορη και λεπτομερή κατανόηση διαφόρων θεμάτων.
«Όλη η υπόθεση είναι ο εντοπισμός συσχετισμών μεταξύ οπτικών δεδομένων και δεδομένων σε κείμενο» αναφέρει ο Άλι Φαράντι, επίκουρος καθηγητής επιστήμης υπολογιστών του University of Washington. «Το πρόγραμμα μαθαίνει να συνδυάζει πλούσια σετ φράσεων με πίξελ σε εικόνες. Αυτό σημαίνει ότι μπορεί να αναγνωρίζει περιπτώσεις συγκεκριμένων νοημάτων όταν τα βλέπει».
Η ομάδα θα παρουσιάσει το project και ένα σχετικό paper μέσα στο μήνα στη συνδιάσκεψη Computer Vision and Pattern Recognition στο Κολόμπους του Οχάιο. Το πρόγραμμα μαθαίνει ποιοι όροι είναι σχετικοί «κοιτώντας» στο περιεχόμενο των εικόνων που βρίσκει στο Web και εντοπίζοντας χαρακτηριστικά «μοτίβα» μέσω της χρήσης αλγορίθμων αναγνώρισης αντικειμένων. Διαφέρει από τις online «βιβλιοθήκες» εικόνων επειδή αντλεί από ένα μεγάλο σετ φράσεων προκειμένου να κατανοήσει και να καταδείξει φωτογραφίες βάσει του περιεχομένου και της διάταξης των pixels- όχι μόνο από λέξεις σε λεζάντες.
Οι χρήστες μπορούν να περιηγηθούν στην υπάρχουσα «βιβλιοθήκη», όπου υπάρχουν περίπου 175 έννοιες, από «αερογραμμές» και «παράθυρα» μέχρι «όμορφο», «λαμπερό», «καρκίνος», «καινοτομία», «ρομπότ», «άλογο» κ.α.
LEVAN
Mία
αναζήτηση για «σκύλο» (dog) θα εμφανίσει φωτογραφίες από υποκατηγορίες
όπως «chihuahua dog», «black dog», «swimming dog» κ.α., καθώς και «dog
nose», «sad dog» κλπ.
«Μεγάλες πηγές πληροφοριών όπως τα λεξικά και οι εγκυκλοπαίδειες κινούνται προς την κατεύθυνση της παρουσίασης οπτικών πληροφοριών στους χρήστες επειδή είναι ευκολότερη η κατανόηση και η πλοήγηση μέσα σε έννοιες. Ωστόσο, έχουν περιορισμένες δυνατότητες ʽκάλυψηςʼ καθώς πολύ συχνά η τακτοποίηση/ διαχείρισή τους γίνεται χειροκίνητα. Το νέο πρόγραμμα δεν χρειάζεται ανθρώπινη επίβλεψη και έτσι μπορεί να μάθει αυτόματα το οπτικό περιεχόμενο κάθε έννοιας» αναφέρει ο Σαντός Ντιβάλα, του Allen Institute for Artificial Intelligence.
Το πρόγραμμα ξεκίνησε τη λειτουργία του τον Μάρτιο. Προς το παρόν η ταχύτητά με την οποία «μαθαίνει» για μια έννοια περιορίζεται λόγω της διαθέσιμης υπολογιστικής ισχύος που απαιτείται για κάθε αναζήτηση (χρειάζονται μέχρι και 12 ώρες για κάποιες ευρείες έννοιες). Οι ερευνητές εργάζονται πάνω στην αύξηση των δυνατοτήτων και της ταχύτητας επεξεργασίας, ενώ ευελπιστούν στη χρήση του προγράμματος ως εκπαιδευτικού εργαλείου και «τράπεζας» πληροφοριών για επιστήμονες που δουλεύουν πάνω στον τομέα του computer vision.
Η έρευνα χρηματοδοτήθηκε από το U.S. Office of Naval Research, το National Science Foundation και το UW.
Δημοσίευση σχολίου