αρχικηΤΕΧΝΟΛΟΓΙΑ«Τρελό» project από τη Salesforce: Δημιούργησε εργαλείο που κάνει αυτόματη περίληψη κειμένου

«Τρελό» project από τη Salesforce: Δημιούργησε εργαλείο που κάνει αυτόματη περίληψη κειμένου

Μέσα στο 2017 υπολογίζεται ότι οι χρήστες θα ξοδέψουν περίπου την μισή μέρα τους διαβάζοντας e-mail, άρθρα ή posts στα social media και όσο περνά ο καιρός, ο χρόνος προβλέπεται ότι θα αυξηθεί. Πως θα σας φαινόταν όμως αν μπορούσατε να έχετε μια μόνο περίληψη με τα όσα πρέπει να διαβάσετε;

Αυτό επιχειρεί να κάνει η Salesforce με τον αλγόριθμο που ανέπτυξε και μέσω machine learning δημιουργεί συνεπείς και ακριβείς περιλήψεις.

Η αυτόματη σύνοψη θα είναι μια ιδιαίτερα χρήσιμη τεχνολογία για την Salesforce, η οποία δημιουργεί μια σειρά από προϊόντα που εστιάζουν στην εξυπηρέτηση πελατών. Η εταιρεία αναφέρει πως οι περιλήψεις αυτές θα μπορούσαν να χρησιμοποιούν από πωλητές και όσους εργάζονται στην εξυπηρέτηση πελατών για να διαβάζουν γρήγορα τα emails και τις πληροφορίες, έτσι ώστε να να επικεντρωθούν και να ξοδέψουν περισσότερο χρόνο στην εξυπηρέτηση των πελατών.

Η εταιρεία ανακοίνωσε ότι πραγματοποίησε δύο καινοτομίες στην επεξεργασία της φυσικής γλώσσας, εισάγοντας ένα νέο «μοντέλο δημιουργίας λέξεων με βάση τα συμφραζόμενα» και έναν «νέο τρόπο κατάρτισης μοντέλων σύνοψης». Οι δύο αυτές καινοτομίες επιτρέπουν στους ερευνητές να δημιουργούν αυτόματα περιλήψεις μεγαλύτερων κειμένων. Να σημειωθεί ότι η εταιρεία πέρσι απέκτησε την MetaMind, η οποία ασχολείται με το deep learning και είναι πίσω από την έρευνα.

Οι ερευνητές εξηγούν πως η αυτόματη περίληψη κειμένου λειτουργεί με δυο τρόπους: εξαγωγή ή αφαίρεση. Με την εξαγωγή, ο υπολογιστής μπορεί να αντλήσει από προϋπάρχουσα διατύπωση σε ένα κείμενο, αλλά δεν είναι πολύ ευέλικτο. Η αφαίρεση επιτρέπει στον υπολογιστή να εισαγάγει νέες λέξεις, αλλά το σύστημα πρέπει να καταλάβει το αρχικό άρθρο σε τέτοιο βαθμό ώστε να μπορέσει να εισαγάγει τις σωστές λέξεις.

Εδώ έρχονται τα δίκτυα deep learning. Επεξεργάζονται πολυάριθμα παραδείγματα φράσεων για να βγάλουν αυτά που δεν χρειάζονται και στο τέλος να παρουσιάσουν το κείμενο με δικά τους λόγια. Οι ερευνητές επιτρέπουν στο σύστημα να κοιτάξει πίσω στο κείμενο που επεξεργάζεται για να λάβει περισσότερες πληροφορίες. Μπορεί επίσης να ανατρέξει σε κομμάτια που έχει δημιουργήσει ήδη, για να σιγουρευτεί ότι δεν επαναλαμβάνει τα ίδια.

Η άλλη σημαντική ανακάλυψη αφορά τον τρόπο με τον οποίο οι ερευνητές εκπαιδεύουν το σύστημα για να μάθει και να βελτιωθεί. Χρησιμοποίησαν δύο προσεγγίσεις: τη μάθηση των εκπαιδευτικών και την ενίσχυση της μάθησης. Η ενίσχυση της μάθησης είναι μια μέθοδος που εμπνέεται από το πώς μαθαίνουν τα ζώα και έχει χρησιμοποιηθεί για να διδαχτεί το σύστημα DeepMind της Google για να παίξει βιντεοπαιχνίδια. Σε αυτήν την περίπτωση, στο σύστημα δημιουργήσει μια ακολουθία λέξεων και το αποτέλεσμα βαθμολογείται στη συνέχεια με μια αυτοματοποιημένη μέτρηση αξιολόγησης γνωστή ως ROUGE. Ο αλγόριθμος ενημερώνεται με υψηλότερες βαθμολογίες, οδηγώντας σε καλύτερα αποτελέσματα με μελλοντικές περιλήψεις.

Όπως διαβάζουμε στο Techblog.gr, τα αποτελέσματα είναι αρκετά εντυπωσιακά: οι ερευνητές παρείχαν διάφορα παραδείγματα, παρουσιάζοντας το αρχικό άρθρο, μια σύνοψη που δημιουργήθηκε από τον άνθρωπο και μια σύνοψη που δημιουργήθηκε από το δικό τους μοντέλο και στις δυο περιπτώσεις οι περιλήψεις είναι σημαντικά μικρότερες από το αρχικό κείμενο, αλλά περιέχουν τα απαραίτητα στοιχεία για μια ευανάγνωστη μορφή.

ΔΕΝ ΥΠΑΡΧΟΥΝ ΣΧΟΛΙΑ

Αφήστε ένα σχόλιο

2 + 12 =