Την Τετάρτη 20 Ιανουαρίου η ομάδα της SciFY, διοργάνωσε στο χώρο του INNOVATHENS Κόμβου Καινοτομίας και Επιχειρηματικότητας της Τεχνόπολης του Δήμου Αθηναίων, ένα σεμινάριο, αφιερωμένο στις Τεχνολογίες σύνθεσης και αναγνώρισης ομιλίας.
Σχεδόν 100 άτομα, παρακολούθησαν τον Αιμίλιο Χαλαμανδάρη, συνιδρυτή και διευθυντή της εταιρίας INNOETICS, και τoν Νάσο Κατσαμάνη, ερευνητή του Ε.Κ. Αθηνά και συνιδρυτή της εταιρίας beenotes να αναλύουν στις τεχνολογίες της σύνθεσης ομιλίας (text-to-speech) και αναγνώρισης ομιλίας (speech-to-text).
Την εκδήλωση άνοιξε ο Βασίλης Σαλαπάτας, ένας εκ των συνιδρυτών της SciFY, παρουσιάζοντας την νέα βελτιωμένη έκδoση της καινοτόμας εφαρμογής ICSee, με χρηματοδότηση από το Ίδρυμα Λάτση. Συγκεκριμένα ανέφερε ότι: “με το ICSee (I Can See), άτομα με χαμηλή όραση μπορούν να διαβάσουν ένα μικρό κείμενο, όπως ο κατάλογος ενός εστιατορίου ή η τιμή σε μια απόδειξη, κάτι που ειδάλλως θα ήταν πολύ δύσκολο ή ακόμα και αδύνατον να το κάνουν. Έτσι, η καθημερινότητά τους βελτιώνεται σημαντικά.” Όσοι έχετε android συσκευές (smartphone ή tablet), σας προτείνουμε να καταβάσετε την εφαρμογή από το google play δωρεάν
“Κοίτα, μπορώ και χωρίς οθόνη!”
Στην συνέχεια το λόγο πήρε, ο Αιμίλιος Χαλαμανδάρης ο οποίος αναφέρθηκε στη Μίμηση του τρόπου παραγωγής ομιλίας (παραμετρική, μίμηση φωνής ως σήμα και υβριδική), καθώς και στα συστήματα που χρησιμοποιεί η σύνθεση ομιλίας , όπως το Text normalization και Unit selection. Επιπλέον μας περιέγραψε σε ποιους τομείς της καθημερινότητας βρίσκει εφαρμογή η συγκεκριμένη τεχνολογία. Ενδεικτικά αναφέρεται η Εκπαίδευση (audio books, κούκλες που μιλούν), τα GPS πλοήγησης, οι ανακοινώσεις των ΜΜΜ, η διεπαφή ανθρώπου μηχανής, καθώς και η διατήρηση γλωσσών που τείνουν να εξαφανιστούν!
“Κοίτα, μπορώ και χωρίς πληκτρολόγιο!”
Στο δεύτερο μέρος της εκδήλωσης ο Νάσος Κατσαμάνης, ανέλυσε την τεχνολογία της αναγνώρισης ομιλίας, τη μετατροπή δηλαδή του προφορικού λόγου σε κείμενο. Χαρακτηριστικά παραδείγματα χρήσης της συγκεκριμένης τεχνολογίας είναι ο υποτιτλισμός των video στο youtube, το google voice input καθώς και η τηλεφωνική παρακολούθηση.
Στη συνέχεια μας εξήγησε ότι για τη δημιουργία μίας εφαρμογής όπου θα γίνεται χρήση της τεχνολογίας αναγνώριση ομιλίας απαιτούνται: δεδομένα, μία λίστα φωνημάτων, ακουστικά μοντέλα και εργαλεία για αναγνώριση φωνής όπως τα : KALDI & CMU Sphinx
Επιπλέον ενημερωθήκαμε ότι σε ορισμένες περιπτώσεις είναι καλό όταν και οι …“Τοίχοι να έχουν αυτιά”. Πιο συγκεκριμένα έγινε αναφορά στο πως μπορούν οι συμπολίτες μας με κάποια μορφή αναπηρίας να μπορούν να χρησιμοποιούν τις ηλεκτρικές συσκευές του σπιτιού τους δίνοντας απλές φωνητικές εντολές . Το όνομα του project αυτού: DIRHA
Απολαύστε το σχετικό βίντεο: “Σπιτάκι μου…άκουσε!”
Τελειώνοντας θα θέλαμε να ευχαριστήσουμε τους εισηγητές της ομιλίας Αιμίλιο Χαλαμανδάρη και Νάσο Κατσαμάνη, το Ίδρυμα Λάτση για τη χορηγία που μας πρόσφερε ώστε να καταφέρουμε να αναβαθμίσουμε την εφαρμογή ICSee, καθώς και όλους εσάς που παρευρεθήκατε στην εκδήλωση..
Θα τα ξαναπούμε σύντομα..
Κατεβάστε την παρουσίαση του κ. Χαλαμανδάρη εδώ.
Κατεβάστε την παρουσίαση του κ. Κατσαμάνη εδώ.
Μπορείτε να παρακολουθήσετε όλη την εκδήλωση της 7ης SciFY Academy εδώ.
Για να ενημερώνεστε για τις επόμενες εκδηλώσεις της SciFY Academy μπορείτε να γραφτείτε εδώ.