Sensory Systems/Visual Signal Processing

Από Βικιβιβλία

Επεξεργασία σήματος[επεξεργασία]

Όπως αναφέρθηκε προηγουμένως ο αμφιβληστροειδής είναι το κύριο στοιχείο στο μάτι, επειδή περιέχει όλα τα φωτοευαίσθητα κύτταρα. Χωρίς αυτό, το μάτι θα ήταν συγκρίσιμο με μια ψηφιακή κάμερα χωρίς τον αισθητήρα CCD (Charge Coupled Device). Αυτό το μέρος εξηγεί πώς ο αμφιβληστροειδής αντιλαμβάνεται το φως, πώς μεταδίδεται το οπτικό σήμα στον εγκέφαλο και πώς ο εγκέφαλος επεξεργάζεται το σήμα για να σχηματίσει αρκετές πληροφορίες για τη λήψη αποφάσεων.

Δημιουργία των αρχικών σημάτων - Λειτουργία φωτοαισθητήρα[επεξεργασία]

Η όραση γεννάται πάντα με το φως να χτυπά τα φωτοευαίσθητα κύτταρα που βρίσκονται στον αμφιβληστροειδή χιτώνα. Οι οπτικές χρωστικές που απορροφούν το φως, μια ποικιλία ενζύμων και πομπών σε ραβδίους αμφιβληστροειδούς και κώνοι θα ξεκινήσουν τη μετατροπή από ορατά ΗΜ ερεθίσματα σε ηλεκτρικούς παλμούς, με μια διαδικασία γνωστή ως φωτοηλεκτρική μεταγωγή.

Χρησιμοποιώντας ραβδία ως παράδειγμα, τα εισερχόμενα ορατά ΗΜ συναντούν μόρια ροδοψίνης, διαμεμβρανικά μόρια που βρίσκονται στη δομή του εξωτερικού δίσκου των ράβδων. Κάθε μόριο ροδοψίνης αποτελείται από ένα σύμπλεγμα ελίκων που ονομάζεται opsin που περιβάλλει και περιβάλλει τον 11-cis αμφιβληστροειδή, το οποίο είναι το τμήμα του μορίου που θα αλλάξει λόγω της ενέργειας από τα εισερχόμενα φωτόνια. Σε βιολογικά μόρια, τμήματα ή τμήματα μορίων που θα προκαλέσουν αλλαγές διαμόρφωσης λόγω αυτής της ενέργειας αναφέρονται μερικές φορές ως χρωμοφόρα. Ο 11-cis αμφιβληστροειδής ισορροπεί σε απόκριση στην εισερχόμενη ενέργεια, μετατρέποντας τον αμφιβληστροειδή (all-trans αμφιβληστροειδής), η οποία ωθεί τις έλικες opsin πιο μακριά, προκαλώντας την αποκάλυψη ειδικών αντιδραστικών θέσεων.

Αυτό το "ενεργοποιημένο" μόριο ροδοψίνης αναφέρεται μερικές φορές ως Μεθαροδοψίνη II. Από αυτό το σημείο, ακόμα και αν σταματήσει η διέγερση του ορατού φωτός, η αντίδραση θα συνεχιστεί. Η μεθαροδοψίνη II μπορεί στη συνέχεια να αντιδρά με περίπου 100 μόρια μιας πρωτεΐνης Gs που ονομάζεται μεταγωγή, η οποία στη συνέχεια οδηγεί σε α και β; μετά την μετατροπή του ΑΕΠ σε GTP. Το ενεργοποιημένο ως-ΟΤΡ στη συνέχεια δεσμεύεται με cGMP-φωσφοδιεστεράση (PDE), καταστέλλοντας τις κανονικές λειτουργίες ανταλλαγής ιόντων, με αποτέλεσμα τη χαμηλή συγκέντρωση ιόντων κατιόντων κυτοσόλης και επομένως μια αλλαγή στην πόλωση του κυττάρου.

Η φυσική αντίδραση φωτοηλεκτρικής μεταγωγής έχει μια καταπληκτική δύναμη ενίσχυσης. Ένα μόριο αμφιβληστροειδούς ροδοψίνης που ενεργοποιείται από ένα μοναδικό κβαντικό φως προκαλεί την υδρόλυση μέχρι 106 μορίων cGMP ανά δευτερόλεπτο.

Μεταγωγή φωτογραφιών[επεξεργασία]

Παρουσίαση μοριακών σταδίων στη φωτοενεργοποίηση (τροποποιημένη από Leskov et αϊ., 2000). Εμφανίζεται ένας δίσκος εξωτερικής μεμβράνης σε μια ράβδο. Βήμα 1: Το φωτόνιο συμβάντος (hν) απορροφάται και ενεργοποιεί μια ροδοψίνη με μεταβολή διαμόρφωσης στη μεμβράνη σε μεμβράνη R *. Βήμα 2: Στη συνέχεια, το R * κάνει επαναλαμβανόμενες επαφές με μόρια transducin, καταλύοντας την ενεργοποίησή του στο G * με την απελευθέρωση δεσμευμένου ΑΕΠ σε αντάλλαγμα για κυτοπλασμικό GTP (Στάδιο 3). Η α και γ υπομονάδα G * δεσμεύει ανασταλτικές γ υπομονάδες της φωσφοδιεστεράσης (PDE) ενεργοποιώντας τις α και β υπομονάδες της. Στάδιο 4: Η ενεργοποιημένη PDE υδρολύει cGMP. Βήμα 5: Η κυκλάση γουανυλύλης (GC) συνθέτει cGMP, τον δεύτερο αγγελιοφόρο στον καταρράκτη φωτομεταδόσεως. Τα μειωμένα επίπεδα κυτοσολικής cGMP προκαλούν κυκλικά νουκλεοτιδικά κανάλια που εγκλείονται για τον εντοπισμό περαιτέρω εισροής Na + και Ca2 +.
  1. Ένα φωτεινό φωτόνιο αλληλεπιδρά με τον αμφιβληστροειδή σε ένα φωτοδέκτη. Ο αμφιβληστροειδής υποβάλλεται σε ισομερισμό, αλλάζοντας από τη διαμόρφωση από 11-cis σε all-trans.
  2. Ο αμφιβληστροειδής δεν ταιριάζει πλέον στη θέση δέσμευσης opsin.
  3. Επομένως, το Opsin υφίσταται μεταβολική διαμόρφωση σε μεταροδoψίνη II.
  4. Η μεταορδοψίνη II είναι ασταθής και διασπάται, αποδίδοντας οψίνη και all-trans αμφιβληστροειδούς.
  5. Η οψίνη ενεργοποιεί τη ρυθμιστική πρωτεΐνη transducin. Αυτό προκαλεί την αποικοδόμηση της transducin από το δεσμευμένο ΑΕΠ της και τη δέσμευση του GTP, τότε η άλφα υπομονάδα της transducin διαχωρίζεται από τις βήτα και γάμμα υπομονάδες, ενώ η GTP εξακολουθεί να συνδέεται με την άλφα υπομονάδα.
  6. Το σύμπλεγμα άλφα υπομονάδας-GTP ενεργοποιεί τη φωσφοδιεστεράση.
  7. Η φωσφοδιεστεράση διασπά το cGMP σε 5'-GMP. Αυτό μειώνει τη συγκέντρωση της cGMP και κατά συνέπεια τα κανάλια νατρίου κλείνουν.
  8. Το κλείσιμο των διαύλων νατρίου προκαλεί υπερπόλωση του κυττάρου λόγω του συνεχούς ρεύματος καλίου.
  9. Η υπερπόλωση του κυττάρου προκαλεί το κλείσιμο των τασεοελεγχόμενων διαύλων ασβεστίου.
  10. Καθώς πέφτει το επίπεδο ασβεστίου στο κύτταρο φωτοϋποδοχέα, μειώνεται επίσης η ποσότητα του γλουταμικού νευροδιαβιβαστή που απελευθερώνεται από το κύτταρο. Αυτό συμβαίνει επειδή το ασβέστιο απαιτείται για τα κυστίδια που περιέχουν γλουταμινικό να συγχωνευθούν με την κυτταρική μεμβράνη και να απελευθερώσουν τα περιεχόμενά τους.
  11. Μία μείωση της ποσότητας γλουταμινικού που απελευθερώνεται από τους φωτοϋποδοχείς προκαλεί αποπόλωση των κεντρικών διπολικών κυττάρων (ραβδίου και κώνου στα διπολικά κύτταρα) και υπερπόλωση κώνου εκτός διπολικών κυττάρων.

Χωρίς ορατή ΗΜ διέγερση, τα κύτταρα ραβδίου που περιέχουν ένα κοκτέιλ ιόντων, πρωτεϊνών και άλλων μορίων, έχουν διαφορές δυναμικού μεμβράνης περίπου -40mV. Σε σύγκριση με άλλα νευρικά κύτταρα, αυτό είναι αρκετά υψηλό (-65mV). Σε αυτή την κατάσταση, ο γλουταμικός νευροδιαβιβαστής απελευθερώνεται συνεχώς από τα τερματικά του νευραξονίου και απορροφάται από τα γειτονικά διπολικά κύτταρα. Με την εισερχόμενη ορατή ΗM και την προαναφερθείσα καταρράκτη, η διαφορά δυναμικού πέφτει στα -70mV. Αυτός ο υπερπολισμός του κυττάρου προκαλεί μείωση της ποσότητας του απελευθερούμενου γλουταμικού, επηρεάζοντας έτσι τη δραστηριότητα των διπολικών κυττάρων και στη συνέχεια τα ακόλουθα στάδια στην οπτική οδό. Παρόμοιες διεργασίες υπάρχουν στα κωνικά-κύτταρα και στα φωτοευαίσθητα γαγγλιακά κύτταρα, αλλά κάνουν χρήση διαφορετικών οψινών. Η φωτοψίνη Ι έως ΙΙΙ (κιτρινοπράσινη, πράσινη και μπλε-βιολετί αντίστοιχα) βρίσκεται στα τρία διαφορετικά κωνικά κύτταρα και η μελανοψίνη (μπλε) μπορεί να βρεθεί στα φωτοευαίσθητα γαγγλιακά κύτταρα.

Επεξεργασία σημάτων στον αμφιβληστροειδή[επεξεργασία]

Διαφορετικά διπολικά κύτταρα αντιδρούν διαφορετικά στις αλλαγές στο απελευθερούμενο γλουταμικό. Τα λεγόμενα διπολικά κύτταρα ON και OFF χρησιμοποιούνται για να σχηματίσουν την άμεση ροή σήματος από κώνους σε διπολικά κύτταρα. Τα διπολικά κύτταρα ON θα αποπολωθούν με ορατή ΗΜ διέγερση και θα ενεργοποιηθούν τα αντίστοιχα ΟΝ γαγγλιοκύτταρα. Από την άλλη πλευρά, τα διπολικά κύτταρα OFF είναι υπερπολικά πολωμένα με την ορατή ΗM διέγερση, και τα κύτταρα γαγγλίων OFF αναστέλλονται. Αυτή είναι η βασική οδός της απευθείας ροής σήματος. Η πλευρική ροή σήματος θα ξεκινήσει από τα ραβδία και στη συνέχεια θα μεταβεί στα διπολικά κύτταρα, τα κύτταρα της αμακρίνης και τα διπολικά κύτταρα OFF που αναστέλλονται από τα κύτταρα Rodamacrine και τα διπολικά κύτταρα ON θα διεγερθούν μέσω μιας ηλεκτρικής συνάψεως, μετά από όλα τα προηγούμενα στα βήματα, το σήμα θα φτάσει στα κύτταρα γαγγλίων ON ή OFF και θα καθοριστεί ολόκληρη η πορεία της ροής σήματος.

Όταν το δυναμικό δράσης (ΔΔ) είναι στο ON, τα κύτταρα των γαγγλίων θα ενεργοποιηθούν από το ορατό ΗΜ ερέθισμα. Η συχνότητα ΔΔ θα αυξηθεί όταν αυξηθεί το δυναμικό του αισθητήρα. Με άλλα λόγια, το ΔΔ εξαρτάται από το εύρος του δυναμικού του αισθητήρα. Η περιοχή των γαγγλιοκυττάρων όπου τα διεγερτικά και ανασταλτικά αποτελέσματα επηρεάζουν τη συχνότητα ΔΔ ονομάζεται πεδίο δεκτικότητας (ΠΔ). Γύρω από τα κύτταρα των γαγγλίων, το ΠΔ συνήθως αποτελείται από δύο περιοχές: την κεντρική ζώνη και την περιφερειακή ζώνη που μοιάζει με δακτύλιο. Διακρίνονται κατά τη διάρκεια της ορατής ΗΜ προσαρμογής. Μια ορατή ΗM διέγερση στην κεντρική ζώνη θα μπορούσε να οδηγήσει σε αύξηση της συχνότητας ΔΔ και η διέγερση στη ζώνη της περιφέρειας θα μειώσει τη συχνότητα ΔΔ. Όταν η πηγή φωτός είναι απενεργοποιημένη, εμφανίζεται η διέγερση. Έτσι, το όνομα του πεδίου ON (κεντρικό πεδίο ON) αναφέρεται σε αυτό το είδος περιοχής. Φυσικά, το ΠΔ των κυττάρων των γαγγλίων OFF ενεργεί με τον αντίθετο τρόπο και επομένως ονομάζεται "πεδίο OFF" (κεντρικό πεδίο απενεργοποιημένο). Τα ΠΔ οργανώνονται από τα οριζόντια κελιά. Η ώθηση στην περιοχή της περιφέρειας θα παρορμηθεί και θα μεταδοθεί στην κεντρική περιοχή και εκεί θα σχηματιστεί η αποκαλούμενη αντίθεση ερεθίσματος. Αυτή η λειτουργία θα κάνει το σκοτάδι να φαίνεται πιο σκοτεινό και το φως πιο φωτεινό. Εάν ολόκληρο το ΠΔ εκτίθεται στο φως, η ώθηση της κεντρικής περιοχής θα κυριαρχήσει.

Μετάδοση σήματος στο φλοιό[επεξεργασία]

Όπως αναφέρθηκε προηγουμένως, οι άξονες των κυττάρων των γαγγλιοκυττάρων συγκλίνουν στον οπτικό δίσκο του αμφιβληστροειδούς, σχηματίζοντας το οπτικό νεύρο. Αυτές οι ίνες τοποθετούνται μέσα στη δέσμη σε συγκεκριμένη σειρά. Οι ίνες από τη ζώνη της ωχράς κηλίδας του αμφιβληστροειδούς είναι στο κεντρικό τμήμα και εκείνες από το προσωρινό ήμισυ του αμφιβληστροειδούς καταλαμβάνουν το περιφερικό τμήμα. Παρουσιάζεται μερική αποκοπή ή διασταύρωση όταν αυτές οι ίνες είναι έξω από την κοιλότητα των ματιών. Οι ίνες από τα ρινικά μισά του κάθε αμφιβληστροειδούς περνούν στα αντίθετα μισά και εκτείνονται στον εγκέφαλο. Εκείνοι από τα αντίθετα μισά παραμένουν χωρίς περικοπή. Αυτή η μερική διασταύρωση ονομάζεται οπτικό σχίσμα και τα οπτικά νεύρα πέρα από αυτό το σημείο ονομάζονται οπτικοί οδοί, κυρίως για να τα διακρίνουν από τα νεύρα ενός αμφιβληστροειδούς. Η λειτουργία της μερικής διασταύρωσης είναι η μετάδοση του δεξιού οπτικού πεδίου που παράγεται από τα δύο μάτια μόνο στο αριστερό ήμισυ του εγκεφάλου και αντιστρόφως. Επομένως, οι πληροφορίες από το δεξιό ήμισυ του σώματος και το σωστό οπτικό πεδίο μεταδίδονται στο αριστερό μέρος του εγκεφάλου όταν φθάνουν στο οπίσθιο τμήμα του προ-εγκεφάλου (διεγκεφάλου).

Η διαδρομή προς τον κεντρικό φλοιό.


Ο αναμεταδότης πληροφοριών μεταξύ των ινών των οπτικών οδών και των νευρικών κυττάρων εμφανίζεται στα πλευρικά όργανα γονιδιώματος, το κεντρικό τμήμα της επεξεργασίας οπτικού σήματος, που βρίσκεται στον θάλαμο του εγκεφάλου. Από εδώ η πληροφορία μεταφέρεται στα νευρικά κύτταρα στον ινιακό φλοιό της αντίστοιχης πλευράς του εγκεφάλου. Οι συνδέσεις από τον αμφιβληστροειδή προς τον εγκέφαλο μπορούν να διαχωριστούν σε μια «παραβοκυτταρική οδό» και μια «μαγνητική κυτταρική οδό». Τα μονοκύτταρα μονοπάτια σηματοδοτούν χρώμα και λεπτή λεπτομέρεια, ενώ τα μαγνητικά μονοπάτια ανιχνεύουν ταχέως κινούμενα ερεθίσματα.

Οι συνδέσεις από τον αμφιβληστροειδή στον εγκέφαλο μπορούν να διαχωριστούν σε ένα "μονοκύτταρο μονοπάτι" και ένα "μαγνητικό μονοπάτι". Το μονοκύτταρο μονοπάτι προέρχεται από κύτταρα μικροκυττάρων του αμφιβληστροειδούς και σηματοδοτεί το χρώμα και τις λεπτομέρειες. Η μαγνητική κυτταρική οδός ξεκινά με κύτταρα οροφής και ανιχνεύει ταχέως κινούμενα ερεθίσματα.

Τα σήματα από τις τυποποιημένες ψηφιακές κάμερες αντιστοιχούν περίπου σε εκείνα της μονοκυτταρικής οδού. Για να προσομοιώσουν τις αποκρίσεις των μονοκυτταρικών μονοπατιών, οι ερευνητές αναπτύσσουν νευρομορφικά αισθητήρια συστήματα, τα οποία προσπαθούν να μιμηθούν υπολογισμό με βάση ακίδα σε νευρικά συστήματα. Χρησιμοποιούν έτσι ένα σχήμα που ονομάζεται "ΑddressΕvent representation" για τη μετάδοση σήματος στα νευρομορφικά ηλεκτρονικά συστήματα (Liu και Delbruck 2010 [1]).

Ανατομικά, τα κύτταρα γαγγλίων Magno και Parvo αμφιβληστροειδούς προβάλλουν αντιστοίχως σε 2 κοιλιακά μαγνητικά στρώματα και 4 ραχιαία μεσοκυττάρια στρώματα του Lateral Geniculate Nucleus (LGN). Κάθε ένα από τα έξι στρώματα LGN λαμβάνει εισροές είτε από το ομόπλευρο είτε από το αντίθετο μάτι, δηλαδή τα γαγγλιακά κύτταρα του αριστερού οφθαλμού περνούν και προβάλλουν στο στρώμα 1, 4 και 6 του δεξιού LGN και το έργο των κυττάρων των δεξιών γαγγλίων (χωρίς περικοπή ) στο στρώμα 2, 3 και 5. Από εκεί διαχωρίζονται οι πληροφορίες από το δεξί και το αριστερό μάτι. Αν και η ανθρώπινη όραση συνδυάζεται με δύο μισά του αμφιβληστροειδούς και το σήμα επεξεργάζεται από τα αντίθετα εγκεφαλικά ημισφαίρια, το οπτικό πεδίο θεωρείται ως ομαλή και πλήρης μονάδα. Ως εκ τούτου οι δύο οπτικές φλοιώδεις περιοχές θεωρούνται ότι είναι στενά συνδεδεμένες. Αυτή η σύνδεση, που ονομάζεται corpus callosum, αποτελείται από νευρώνες, άξονες και δενδρίτες. Επειδή οι δενδρίτες σχηματίζουν συναπτικές συνδέσεις στα σχετικά σημεία των ημισφαιρίων, η ηλεκτρική προσομοίωση κάθε σημείου σε ένα ημισφαίριο δείχνει προσομοίωση του διασυνδεδεμένου σημείου στο άλλο ημισφαίριο. Η μόνη εξαίρεση σε αυτόν τον κανόνα είναι ο πρωταρχικός οπτικός φλοιός.

Οι συνάψεις γίνονται από την οπτική οδό στις αντίστοιχες στρώσεις του πλευρικού γονιδιακού σώματος. Στη συνέχεια, οι άξονες αυτών των νευρικών κυττάρων τρίτης τάξης περνούν μέχρι τη σχισμή της χολινής σε κάθε ινιακό λοβό του εγκεφαλικού φλοιού. Επειδή οι ζώνες των λευκών ινών και των ζέυγη νευραξόνων από τα νευρικά κύτταρα του αμφιβληστροειδούς περνούν μέσα από αυτό, ονομάζεται φλοιός του ραβδωτού σώματος, ο οποίος παρεμπιπτόντως είναι ο πρωταρχικός μας οπτικός φλοιός, μερικές φορές γνωστός ως V1. Σε αυτό το σημείο, οι παρορμήσεις από τα ξεχωριστά μάτια συγκλίνουν σε κοινούς φλοιώδεις νευρώνες, που στη συνέχεια επιτρέπουν την πλήρη εισαγωγή και από τα δύο μάτια σε μια περιοχή για να χρησιμοποιηθούν για την αντίληψη και την κατανόηση. Η αναγνώριση των μοτίβων είναι μια πολύ σημαντική λειτουργία αυτού του συγκεκριμένου μέρους του εγκεφάλου, του οποίου βλάβες μπορύν να προκαλέσουν προβλήματα στην οπτική αναγνώριση ή τύφλωση.

Βάσει του διατεταγμένου τρόπου με τον οποίο οι ίνες της οπτικής οδού περνούν πληροφορίες στα πλευρικά σωμάτια του γονιδιώματος και μετά που περνούν στην περιοχή των ραβδώσεων, αν βρεθεί μία διέγερση ενός σημείου στον αμφιβληστροειδή, η απόκριση που παράγεται ηλεκτρικά και στο αμφίπλευρο σώμα γονιδιώματος και ο πτερυγικός φλοιός θα βρεθεί σε μια μικρή περιοχή στο συγκεκριμένο σημείο του αμφιβληστροειδούς. Αυτός είναι ένας προφανής τρόπος σημειακής επεξεργασίας σημάτων. Και αν διεγερθεί ολόκληρος ο αμφιβληστροειδής, οι αποκρίσεις θα συμβούν και στα δύο πλευρικά όργανα γονιδιώματος και στην περιοχή της φαιάς ύφανσης του σχοινιού. Είναι δυνατό να χαρτογραφηθεί αυτή η περιοχή του εγκεφάλου στα πεδία του αμφιβληστροειδούς, ή συνηθέστερα στα οπτικά πεδία.

Οποιαδήποτε περαιτέρω βήματα σε αυτό το μονοπάτι είναι πέρα από το πεδίο αυτού του βιβλίου. Είναι βέβαιο ότι υπάρχουν πολλά ακόμα επίπεδα και κέντρα, εστιάζοντας σε συγκεκριμένα συγκεκριμένα καθήκοντα, όπως για παράδειγμα χρώμα, προσανατολισμούς, χωρικές συχνότητες, συναισθήματα κ.λπ.

Επεξεργασία πληροφοριών στο οπτικό σύστημα[επεξεργασία]

Εξοπλισμένοι με μια πιο σταθερή κατανόηση ορισμένων από τις πιο σημαντικές έννοιες της επεξεργασίας σήματος στο οπτικό σύστημα, η κατανόηση ή η αντίληψη των επεξεργασμένων αισθητηριακών πληροφοριών είναι το τελευταίο σημαντικό τμήμα του παζλ. Η οπτική αντίληψη είναι η διαδικασία της μετάφρασης των πληροφοριών που λαμβάνονται από τα μάτια με σκοπό την κατανόηση της εξωτερικής κατάστασης των αντικειμένων. Μας κάνει να γνωρίζουμε τον κόσμο γύρω μας και μας επιτρέπει να το καταλάβουμε καλύτερα. Με βάση την οπτική αντίληψη εξοικειωνόμαστε με πρότυπα που εφαρμόζουμε στη συνέχεια αργότερα στη ζωή και λαμβάνουμε αποφάσεις βάσει αυτών και των πληροφοριών που έχουμε λάβει. Με άλλα λόγια, η επιβίωσή μας εξαρτάται από την αντίληψη. Το πεδίο της οπτικής αντίληψης χωρίστηκε σε διαφορετικά υποπεδία, λόγω του γεγονότος ότι η επεξεργασία είναι πολύ περίπλοκη και απαιτεί διαφορετικούς εξειδικευμένους μηχανισμούς για να αντιληφθεί αυτό που γίνεται ορατό. Αυτά τα υποπεδία περιλαμβάνουν: Αντίληψη χρώματος, αντίληψη κίνησης, αντίληψη βάθους και αναγνώριση προσώπου κλπ.

Βαθιά ιεραρχίες στον πρωτεύοντα οπτικό φλοιό[επεξεργασία]

Βαθιές ιεραρχίες στο οπτικό σύστημα

Παρά την συνεχώς αυξανόμενη υπολογιστική ισχύ των ηλεκτρονικών συστημάτων, υπάρχουν ακόμα πολλές δραστηριότητες όπου τα ζώα και οι άνθρωποι είναι εξαιρετικά ανώτεροι από τους ηλεκτρονικούς υπολογιστές – μια από αυτές είναι η αντίληψη και η συμφιλίωση των πληροφοριών. Ο κλασικός υπολογιστής, είτε αυτός του τηλεφώνου σας είτε ένας υπερυπολογιστής που αναλαμβάνει ολόκληρο το δωμάτιο, είναι κατ 'ουσία μια αριθμομηχανή. Μπορεί να εκτελέσει έναν απίστευτο αριθμό υπολογισμών σε ένα ελάχιστο χρονικό διάστημα. Αυτό που του λείπει είναι η δημιουργία αφαιρέσεων των πληροφοριών με τις οποίες συνεργάζεται. Αν προσαρμόζετε μια φωτογραφική μηχανή στον υπολογιστή σας, η εικόνα που "αντιλαμβάνεται" είναι απλά ένα πλέγμα εικονοστοιχείων, μια δισδιάστατη σειρά αριθμών. Ένας άνθρωπος θα αναγνωρίσει αμέσως τη γεωμετρία της σκηνής, τα αντικείμενα στην εικόνα, και ίσως ακόμη και το πλαίσιο του τι συμβαίνει. Αυτή η ικανότητα μας παρέχεται από αποκλειστικά βιολογικά μηχανήματα - το οπτικό σύστημα του εγκεφάλου. Επεξεργάζεται όλα όσα βλέπουμε με ιεραρχικό τρόπο, ξεκινώντας από τα απλούστερα χαρακτηριστικά της εικόνας σε πιο πολύπλοκα μέχρι την ταξινόμηση των αντικειμένων σε κατηγορίες. Ως εκ τούτου το οπτικό σύστημα λέγεται ότι έχει βαθιά ιεραρχία. Η βαθιά ιεραρχία του οπτικού συστήματος πρωτεύων έχει εμπνεύσει τους επιστήμονες υπολογιστών να δημιουργήσουν μοντέλα τεχνητών νευρωνικών δικτύων που θα διαθέτουν επίσης πολλά επίπεδα όπου κάθε ένα από αυτά δημιουργεί υψηλότερες γενικεύσεις των δεδομένων εισόδου.

Περίπου το ήμισυ του ανθρώπινου νεοκαρτέρου είναι αφιερωμένο στην όραση. Η επεξεργασία των οπτικών πληροφοριών συμβαίνει σε τουλάχιστον 10 λειτουργικά επίπεδα. Οι νευρώνες στις πρώιμες οπτικές περιοχές εξάγουν απλά χαρακτηριστικά εικόνας σε μικρές τοπικές περιοχές του οπτικού χώρου. Καθώς οι πληροφορίες μεταδίδονται σε υψηλότερες οπτικές περιοχές, οι νευρώνες ανταποκρίνονται σε όλο και πιο περίπλοκα χαρακτηριστικά. Με υψηλότερα επίπεδα επεξεργασίας πληροφοριών οι παραστάσεις γίνονται πιο αμετάβλητες - λιγότερο ευαίσθητες στο ακριβές μέγεθος, περιστροφή ή θέση του χαρακτηριστικού. Επιπλέον, αυξάνεται το μέγεθος του δεκτικού πεδίου των νευρώνων σε υψηλότερες οπτικές περιοχές, γεγονός που υποδηλώνει ότι προσαρμόζονται σε περισσότερο παγκόσμια χαρακτηριστικά εικόνας. Αυτή η ιεραρχική δομή επιτρέπει την αποτελεσματική υπολογιστική - διαφορετικές υψηλότερες οπτικές περιοχές μπορούν να χρησιμοποιούν τις ίδιες πληροφορίες που υπολογίζονται στις χαμηλότερες περιοχές. Η γενική περιγραφή της σκηνής που γίνεται στις πρώιμες οπτικές περιοχές χρησιμοποιείται από άλλα μέρη του εγκεφάλου για να ολοκληρώσει διάφορες διαφορετικές εργασίες, όπως αναγνώριση και κατηγοριοποίηση αντικειμένων, πιάσιμο, χειρισμό, σχεδιασμός κτλ.

Υποφλοιώδης όραση[επεξεργασία]

Η νευρωνική επεξεργασία των οπτικών πληροφοριών αρχίζει ήδη πριν από οποιαδήποτε από τις δομές του φλοιού. Οι φωτοϋποδοχείς στον αμφιβληστροειδή ανιχνεύουν το φως και στέλνουν σήματα στα κύτταρα γαγγλίων του αμφιβληστροειδούς. Το μέγεθος του δεκτικού χώρου ενός φωτοϋποδοχέα είναι ένα 100ο του ενός βαθμού (ένα μεγάλο, δεκτικό πεδίο είναι περίπου το μέγεθος του αντίχειρά σας, όταν το χέρι σας τεντώνεται μπροστά σας). Ο αριθμός των εισροών σε ένα κύτταρο γαγγλίων και συνεπώς το μέγεθος του δεκτικού του πεδίου εξαρτάται από τη θέση - στο κέντρο του αμφιβληστροειδούς λαμβάνει σήματα από μόλις πέντε υποδοχείς, ενώ στην περιφέρεια ένα μόνο κύτταρο μπορεί να έχει αρκετές χιλιάδες εισόδους. Αυτό σημαίνει ότι η υψηλότερη χωρική ανάλυση βρίσκεται στο κέντρο του αμφιβληστροειδούς, που ονομάζεται επίσης και βοθρίο. Λόγω αυτού του πρωτεύοντος ιδιοκτησίας κατέχει ένα μηχανισμό ελέγχου βλέμματος που κατευθύνει την όραση, έτσι ώστε τα χαρακτηριστικά ενδιαφέροντος να προβάλλονται πάνω στο βοθρίο.

Τα γαγγλιακά κύτταρα είναι επιλεκτικά συντονισμένα στην ανίχνευση διαφόρων χαρακτηριστικών της εικόνας, όπως η αντίθεση φωτεινότητας, η χρωματική αντίθεση και η κατεύθυνση και η ταχύτητα κίνησης. Όλες αυτές οι λειτουργίες είναι οι κύριες πληροφορίες που χρησιμοποιούνται περαιτέρω στον αγωγό επεξεργασίας. Αν υπάρχουν οπτικά ερεθίσματα που δεν ανιχνεύονται από τα κύτταρα των γαγγλίων, τότε δεν είναι διαθέσιμα για οποιαδήποτε φλοιώδη οπτική περιοχή.

Τα κύτταρα των γαγγλίων προβάλλουν σε μια περιοχή στον θάλαμο που ονομάζεται πλευρικός πυρήνας γονιδιώματος (LGN), ο οποίος με τη σειρά του μεταδίδει τα σήματα στον φλοιό. Δεν υπάρχει αξιόλογος υπολογισμός που να είναι γνωστός στο LGN - υπάρχει σχεδόν μια αντιστοιχία ενός προς ένα μεταξύ του γαγγλίου του αμφιβληστροειδούς και των κυττάρων LGN. Ωστόσο, μόνο το 5% των εισροών στην LGN προέρχεται από τον αμφιβληστροειδή - όλες οι άλλες εισροές είναι προβολές φλοιώδους ανάδρασης. Αν και το οπτικό σύστημα θεωρείται συχνά σύστημα προώθησης, οι επαναλαμβανόμενες συνδέσεις ανάδρασης καθώς και οι πλευρικές συνδέσεις είναι ένα κοινό χαρακτηριστικό που παρατηρείται σε όλο τον οπτικό φλοιό. Ο ρόλος της ανατροφοδότησης δεν είναι ακόμη πλήρως κατανοητός, αλλά προτείνεται να αποδοθεί σε διαδικασίες όπως η προσοχή, η προσδοκία, η φαντασία και η συμπλήρωση των πληροφοριών που λείπουν.

Οφθαλμική όραση[επεξεργασία]

Κύριες περιοχές του οπτικού συστήματος

Ο οπτικός φλοιός μπορεί να χωριστεί σε τρία μεγάλα τμήματα - το ινιακό τμήμα που λαμβάνει εισροή από το LGN και έπειτα στέλνει σήματα στα ραχιαία και κοιλιακά ρεύματα. Το περιθωριακό μέρος περιλαμβάνει τις περιοχές V1-V4 και MT, οι οποίες επεξεργάζονται διάφορες πτυχές της οπτικής πληροφορίας και δημιουργούν μια γενική απεικόνιση της σκηνής. Η ραχιαία δίοδος συμμετέχει στην ανάλυση του χώρου και του σχεδιασμού δράσης. Η κοιλιακή δίοδος εμπλέκεται στην αναγνώριση και κατηγοριοποίηση αντικειμένων.

Oργάνωση του οπτικού συστήματος

Το V1 είναι η πρώτη φλοιώδης περιοχή που επεξεργάζεται οπτικές πληροφορίες. Είναι ευαίσθητο στις άκρες, παράλληλες γραμμές, το τέλος των γραμμών, τις κινήσεις, το χρώμα και τις ανισότητες (γωνιακή διαφορά μεταξύ των προβολών ενός σημείου στον αριστερό και στον δεξιό αμφιβληστροειδή). Το πιο άμεσο παράδειγμα της ιεραρχικής επεξεργασίας από τη βάση προς τα πάνω είναι ο γραμμικός συνδυασμός των εισροών από διάφορα κύτταρα των γαγγλιοκυττάρων με κεντρικά δεκτικά πεδία για να δημιουργηθεί μια αναπαράσταση ενός ραβδίου. Αυτό γίνεται από τα απλά κύτταρα του V1 και περιγράφηκε για πρώτη φορά από τους εξέχοντες νευροεπιστήμονες Hubel και Wiesel. Αυτός ο τύπος ενοποίησης πληροφοριών υποδηλώνει ότι τα απλά κύτταρα είναι ευαίσθητα στην ακριβή θέση της ραβδίου και έχουν ένα σχετικά μικρό δεκτικό πεδίο. Τα σύνθετα κύτταρα του V1 λαμβάνουν εισροές από τα απλά κύτταρα και ενώ ανταποκρίνονται επίσης σε γραμμικά προσανατολισμένα μοτίβα, δεν είναι ευαίσθητα στην ακριβή θέση της ραβδίου και έχουν μεγαλύτερο πεδίο δεκτικότητας. Ο υπολογισμός που υπάρχει σε αυτό το βήμα θα μπορούσε να είναι μια λειτουργία τύπου MAX που παράγει αποκρίσεις παρόμοιες σε πλάτος με τις μεγαλύτερες από τις απαντήσεις που αφορούν τα μεμονωμένα ερεθίσματα. Ορισμένα απλά και πολύπλοκα κύτταρα μπορούν επίσης να ανιχνεύσουν το άκρο μιας ραβδίου και ένα κλάσμα των κυττάρων V1 είναι επίσης ευαίσθητα στην τοπική κίνηση μέσα στα αντίστοιχα δεκτικά πεδία.

Παράδειγμα ενός ιεραρχικού μοντέλου, που αποτελείται από πολλαπλά στρώματα ιεραρχικά οργανωμένα. Κάθε επίπεδο στην ιεραρχία αποτελείται από ένα στρώμα απλών κυττάρων που ακολουθείται από ένα στρώμα πολύπλοκων κυττάρων. Τα απλά κύτταρα εκτελούν μια διαδικασία εξαγωγής, συνδυάζοντας χαρακτηριστικά του κατώτερου επιπέδου για να σχηματίσουν πιο περίπλοκα χαρακτηριστικά. Τα σύνθετα κελιά κάνουν μια λειτουργία συγκέντρωσης, επιλέγοντας μόνο τις ισχυρότερες (MAX) λειτουργίες για τη μετάβαση στο επόμενο επίπεδο.

Η περιοχή V2 διαθέτει πιο εκλεπτυσμένη αναπαράσταση περιγράμματος, όπως περιγράμματα που ορίζονται από την υφή, παραπλανητικά περιγράμματα και περιγράμματα ποθ συμπεριλαμωάνουν σύνορα. Το V2 επίσης βασίζεται στην ανίχνευση απόλυτης ανισότητας σε V1 και χαρακτηρίζει κύτταρα που είναι ευαίσθητα σε σχετικές ανισότητες που είναι η διαφορά μεταξύ των απόλυτων ανισοτήτων δύο σημείων στο διάστημα. Η περιοχή V4 λαμβάνει εισροές από το V2 και την περιοχή V3, αλλά πολύ λίγα είναι γνωστά για τον υπολογισμό που λαμβάνει χώρα στο V3. Η περιοχή V4 διαθέτει νευρώνες που είναι ευαίσθητες σε περιγράμματα με διαφορετική καμπυλότητα και κορυφές με συγκεκριμένες γωνίες. Ένα άλλο σημαντικό χαρακτηριστικό είναι η κωδικοποίηση για την ανθεκτική στη φωτεινότητα απόχρωση. Αυτό έρχεται σε αντίθεση με την V1 όπου οι νευρώνες ανταποκρίνονται στην αντίθεση του χρώματος κατά μήκος των δύο βασικών αξόνων (κόκκινο-πράσινο και κίτρινο-μπλε) αντί του πραγματικού χρώματος. Το V4 εξέρχεται περαιτέρω στο κοιλιακό ρεύμα, στον φλεβοτονωτικός φλοιό (IT), ο οποίος έχει αποδειχθεί μέσω μελετών των αλλοιώσεων ότι είναι απαραίτητος για τη διάκριση αντικειμένων.

Ο φλεβοτονωτικός φλοιός: διάκριση αντικειμένων[επεξεργασία]

Μείωση του ερεθίσματος στην περιοχή ΤΕ

Ο φλεβοτονωτικός φλοιός (Inferior temporal cortex, ΙΤ) χωρίζεται σε δύο περιοχές: TEO και TE. Το πεδίο TEO ενσωματώνει πληροφορίες σχετικά με τα σχήματα και τις σχετικές θέσεις πολλαπλών στοιχείων περιγράμματος και χαρακτηρίζει κυρίως κύτταρα τα οποία ανταποκρίνονται σε απλούς συνδυασμούς χαρακτηριστικών. Το μέγεθος του δεκτικού πεδίου των νευρώνων ΤΕΟ είναι περίπου 3-5 μοίρες. Η περιοχή ΤΕ διαθέτει κύτταρα με σημαντικά μεγαλύτερα δεκτικά πεδία (10-20 μοίρες) τα οποία ανταποκρίνονται σε πρόσωπα, χέρια και σύνθετες διαμορφώσεις χαρακτηριστικών. Τα κύτταρα στην ΤΕ ανταποκρίνονται σε οπτικά χαρακτηριστικά που είναι μια απλούστερη γενίκευση του αντικειμένου ενδιαφέροντος, αλλά πιο περίπλοκα από απλές ραβδίους ή κηλίδες. Αυτό απεδείχθη χρησιμοποιώντας μία μέθοδο μείωσης ερεθίσματος από τους Tanaka κ.ά. όπου πρώτα μετράται μια απόκριση σε ένα αντικείμενο και στη συνέχεια το αντικείμενο αντικαθίσταται από απλούστερες αναπαραστάσεις έως ότου το κρίσιμο χαρακτηριστικό στο οποίο αντιδρούν οι νευρώνες ΤΕ περιορίζεται.

Φαίνεται ότι οι νευρώνες στον ΙΤ συναρμολογούν διάφορα χαρακτηριστικά μεσαίας πολυπλοκότητας από χαμηλότερα επίπεδα στο κοιλιακό ρεύμα για να διαμορφώσουν μοντέλα αντικειμένων. Οι νευρώνες στην ΤΕ που είναι επιλεκτικοί σε συγκεκριμένα αντικείμενα πρέπει να πληρούν δύο φαινομενικά αντιφατικές απαιτήσεις - επιλεκτικότητα και αμεταβλητότητα. Πρέπει να κάνουν διάκριση μεταξύ διαφορετικών αντικειμένων με τη βοήθεια της ευαισθησίας στα χαρακτηριστικά των εικόνων του αμφιβληστροειδούς. Ωστόσο, το ίδιο αντικείμενο μπορεί να αντιμετωπιστεί από διαφορετικές γωνίες και αποστάσεις σε διαφορετικές συνθήκες φωτισμού, αποδίδοντας εξαιρετικά ανόμοιες εικόνες αμφιβληστροειδούς του ίδιου αντικειμένου. Για να αντιμετωπιστούν όλες αυτές οι εικόνες ως ισοδύναμες, πρέπει να παραχθούν αμετάβλητα χαρακτηριστικά τα οποία είναι ανθεκτικά σε ορισμένους μετασχηματισμούς, όπως αλλαγές στη θέση, φωτισμό, μέγεθος στον αμφιβληστροειδή κλπ. Οι νευρώνες στην περιοχή ΤΕ δείχνουν αμετάβλητη θέση και μέγεθος καθώς και μερική απόφραξη , θέση στον χώρο και κατεύθυνση φωτισμού. Η περιστροφή σε βάθος χώρου έχει αποδειχθεί ότι έχει την ασθενέστερη μεταβλητότητα, με εξαίρεση εαν το αντικείμενο είναι ανθρώπινο πρόσωπο.

Οι κατηγορίες αντικειμένων δεν υπάρχουν ακόμη απόλυτα στην περιοχή ΤΕ - ένας νευρώνας μπορεί τυπικά να ανταποκρίνεται σε πολλά αλλά όχι όλα τα υποδείγματα της ίδιας κατηγορίας (π.χ. εικόνες δέντρων) και μπορεί επίσης να ανταποκρίνεται σε υποδείγματα διαφορετικών κατηγοριών (π.χ. δέντρα και μη- δέντρα). Η αναγνώριση αντικειμένων και η ταξινόμηση πιθανότατα περιλαμβάνει δειγματοληψία από μεγαλύτερο πληθυσμό νευρώνων ΤΕ καθώς και λήψη εισερχομένων από πρόσθετες περιοχές του εγκεφάλου, π.χ. εκείνες που είναι υπεύθυνες για την κατανόηση του πλαισίου της σκηνής. Πρόσφατα πειράματα ανάγνωσης απέδειξαν ότι οι στατιστικοί ταξινομητές (π.χ. μηχανές φορέων υποστήριξης) μπορούν να εκπαιδευτούν για την ταξινόμηση αντικειμένων με βάση τις αποκρίσεις ενός μικρού αριθμού νευρώνων ΤΕ. Ως εκ τούτου, ένας πληθυσμός των νευρώνων ΤΕ μπορεί κατ 'αρχήν να επισημάνει αξιόπιστα κατηγορίες αντικειμένων με τη συνδυασμένη δραστηριότητα τους. Είναι ενδιαφέρον ότι υπάρχουν επίσης αναφορές για εξαιρετικά επιλεκτικούς νευρώνες στον μεσαίο κροταφικό λοβό που ανταποκρίνονται σε πολύ συγκεκριμένες ενδείξεις, π.χ. στον πύργο της Πίζας σε διαφορετικές εικόνες ή στο πρόσωπο ενός συγκεκριμένου προσώπου.

Μάθηση στο οπτικό σύστημα[επεξεργασία]

Η εκμάθηση μπορεί να μεταβάλει την εκλεκτικότητα οπτικών χαρακτηριστικών των νευρώνων, με αποτέλεσμα να μαθαίνει να γίνεται ισχυρότερη σε υψηλότερα ιεραρχικά επίπεδα. Δεν υπάρχουν γνωστά στοιχεία για τη μάθηση στον αμφιβληστροειδή και επίσης οι χάρτες προσανατολισμού στο V1 φαίνεται να είναι γενικά γενετικά προκαθορισμένοι. Ωστόσο, η πρακτική αναγνώριση προσανατολισμού βελτιώνει την κωδικοποίηση προσανατολισμού στους νευρώνες V1, αυξάνοντας την κλίση της καμπύλης συντονισμού. Παρόμοια αλλά μεγαλύτερα αποτελέσματα έχουν παρατηρηθεί στο V4. Στην περιοχή της ΤΕ σχετικά μικρή οπτική κατάρτιση έχει αξιοσημείωτες φυσιολογικές επιδράσεις στην οπτική αντίληψη, σε ένα μόνο επίπεδο κυττάρων καθώς και στο fMRI. Για παράδειγμα, η μορφοποίηση δύο αντικειμένων μεταξύ τους αυξάνει την αντιληπτή ομοιότητά τους. Συνολικά, φαίνεται ότι ο ομοιόμορφος οπτικός φλοιός των ενηλίκων είναι αισθητά πλαστικός και το επίπεδο πλαστικότητας μπορεί να αυξηθεί σημαντικά, π.χ. χορηγώντας συγκεκριμένα φάρμακα ή ζώντας σε ένα εμπλουτισμένο περιβάλλον.

Bαθιά Νευρωνικά Δίκτυα[επεξεργασία]

Οπως συμβαίνει με τη βαθιά ιεραρχία του πρωτεύοντος οπτικού συστήματος, οι αρχιτεκτονικές βαθιάς εκμάθησης επιχειρούν να μοντελοποιήσουν υψηλού επιπέδου απλοποιήσεις της εισαγωγής δεδομένων χρησιμοποιώντας πολλαπλά επίπεδα μη γραμμικών μετασχηματισμών. Το μοντέλο που πρότειναν οι Hubel και Wiesel, όπου οι πληροφορίες ενσωματώνονται και πολλαπλασιάζονται σε μια αλληλουχία από τον αμφιβληστροειδή και το LGN σε απλά κύτταρα και σύνθετα κύτταρα στην V1, ενέπνευσαν τη δημιουργία μιας από τις πρώτες αρχιτεκτονικές βαθιάς εκμάθησης, το neocognitron - ένα μοντέλο πολλαπλών στρωμάτων τεχνητού νευρικού δικτύου. Χρησιμοποιήθηκε για διαφορετικές εργασίες αναγνώρισης προτύπων, συμπεριλαμβανομένης της αναγνώρισης χειρόγραφων χαρακτήρων. Ωστόσο, χρειάστηκε πολύς χρόνος για την κατάρτιση του δικτύου (σε επίπεδο ημερών) και από την έναρξή του στη δεκαετία του 1980 η βαθιά εκμάθηση δεν έλαβε μεγάλη προσοχή μέχρι τα μέσα της δεκαετίας του 2000 με την αφθονία των ψηφιακών δεδομένων και την εφεύρεση αλγορίθμων ταχείας εκμάθησης. Τα βαθιά νευρωνικά δίκτυα αποδείχθηκαν πολύ αποτελεσματικά σε καθήκοντα που οχι και τόσο πολύ καιρό πριν ήταν δυνατά μόνο για τον άνθρωπο, όπως η αναγνώριση των προσώπων συγκεκριμένων ανθρώπων στις φωτογραφίες, η κατανόηση του ανθρώπινου λόγου (σε κάποιο βαθμό) και η μετάφραση κειμένου από ξένες γλώσσες . Επιπλέον, έχουν αποβεί σε μεγάλη βοήθεια στη βιομηχανία και την επιστήμη για την αναζήτηση πιθανών υποψήφιων φαρμάκων, χαρτογράφηση πραγματικών νευρωνικών δικτύων στον εγκέφαλο και πρόβλεψη των λειτουργιών των πρωτεϊνών. Πρέπει να σημειωθεί ότι η βαθιά εκμάθηση είναι μόνο πολύ χαλαρά εμπνευσμένη από τον εγκέφαλο και είναι πολύ περισσότερο ένα επίτευγμα του πεδίου της επιστήμης των υπολογιστών / μηχανικής μάθησης παρά της νευροεπιστήμης. Οι βασικές ομοιότητες είναι ότι τα βαθιά νευρωνικά δίκτυα αποτελούνται από μονάδες που ενσωματώνουν εισόδους πληροφοριών με μη γραμμικό τρόπο (νευρώνες) και στέλνουν σήματα μεταξύ τους (συνάψεις) και ότι υπάρχουν διαφορετικά επίπεδα όλο και πιο αφηρημένων αναπαραστάσεων των δεδομένων. Οι αλγόριθμοι μάθησης και οι μαθηματικές περιγραφές των «νευρώνων» που χρησιμοποιούνται στη βαθιά εκμάθηση είναι πολύ διαφορετικοί από τις πραγματικές διαδικασίες που λαμβάνουν χώρα στον εγκέφαλο. Ως εκ τούτου, η έρευνα στη βαθιά εκμάθηση, δίνοντας μια τεράστια ώθηση σε μια πιο εξελιγμένη τεχνητή νοημοσύνη, μπορεί να δώσει περιορισμένες γνώσεις για τον εγκέφαλο.

Bιβλιογραφικές Aναφορές[επεξεργασία]

Έγγραφα σχετικά με τις βαθιές ιεραρχίες στο οπτικό σύστημα
  • (August 2013) "Deep Hierarchies in the Primate Visual Cortex: What Can We Learn for Computer Vision?". IEEE Transactions on Pattern Analysis and Machine Intelligence 35 (8): 1847–1871. DOI:10.1109/TPAMI.2012.272.
  • (1 November 1999) "{{{title}}}". Nature Neuroscience 2 (11): 1019–1025. DOI:doi:10.1038/14819.
Πείραμα μείωσης τόνωσης
Στοιχεία μάθησης στο οπτικό σύστημα
  • (23 September 2010) "Unsupervised Natural Visual Experience Rapidly Reshapes Size-Invariant Object Representation in Inferior Temporal Cortex". Neuron 67 (6): 1062–1075. DOI:10.1016/j.neuron.2010.08.029.
  • (14 June 2006) "Learning to See the Difference Specifically Alters the Most Informative V4 Neurons". Journal of Neuroscience 26 (24): 6589–6602. DOI:10.1523/JNEUROSCI.0457-06.2006.
  • (2 August 2001) "Practising orientation identification improves orientation coding in V1 neurons.". Nature 412 (6846): 549-53.
Μια πρόσφατη και προσβάσιμη επισκόπηση του status quo της έρευνας βαθιάς μάθησης
  • (8 January 2014) "Computer science: The learning machines". Nature 505 (7482): 146–148. DOI:10.1038/505146a.

Αντίληψη κίνησης[επεξεργασία]

Η αντίληψη κίνησης είναι η διαδικασία υπολογισμού της ταχύτητας και της κατεύθυνσης των κινούμενων αντικειμένων. Η περιοχή V5 στον άνθρωπο και στην περιοχή MT (Middle Temporal) στα πρωτεύοντα θηλαστικά είναι υπεύθυνη για την φλοιική αντίληψη της κίνησης. Η περιοχή V5 είναι μέρος του εξωστρεφούς φλοιού, που είναι η περιοχή στην ινιακή περιοχή του εγκεφάλου δίπλα στον πρωτογενή οπτικό φλοιό. Η λειτουργία της Περιοχής V5 είναι να ανιχνεύσει την ταχύτητα και την κατεύθυνση των οπτικών ερεθισμάτων και να ενσωματώσει τα τοπικά οπτικά σήματα κίνησης σε παγκόσμια κίνηση. Η περιοχή V1 ή πρωτογενής οπτικός φλοιός βρίσκεται στον ινιακό λοβό του εγκεφάλου και στα δύο ημισφαίρια. Διαχειρίζεται το πρώτο στάδιο της φλοιώδους επεξεργασίας των οπτικών πληροφοριών. Αυτή η περιοχή περιέχει έναν πλήρη χάρτη του οπτικού πεδίου που καλύπτεται από τα μάτια. Η διαφορά μεταξύ της περιοχής V5 και της περιοχής V1 (Primary Visual Cortex) είναι ότι η περιοχή V5 μπορεί να ενσωματώσει την κίνηση τοπικών σημάτων ή μεμονωμένων τμημάτων ενός αντικειμένου σε μια συνολική κίνηση ενός ολόκληρου αντικειμένου. Η περιοχή V1, από την άλλη πλευρά, αποκρίνεται στην τοπική κίνηση που συμβαίνει εντός του δεκτικού πεδίου. Οι εκτιμήσεις από αυτούς τους πολλούς νευρώνες είναι ενσωματωμένες στην περιοχή V5.

Η κίνηση ορίζεται ως αλλαγές στον φωτισμό του αμφιβληστροειδούς στο διάστημα και στο χρόνο. Τα σήματα κίνησης ταξινομούνται σε κινήσεις πρώτης τάξης και κινήσεις δεύτερης τάξης. Αυτοί οι τύποι κίνησης περιγράφονται εν συντομία στις επόμενες παραγράφους.

Παράδειγμα "Kίνηση βήτα".

Η αντίληψη κίνησης πρώτης τάξης αναφέρεται στην κίνηση που γίνεται αντιληπτή όταν δύο ή περισσότερα οπτικά ερεθίσματα ενεργοποιούν και απενεργοποιούν την πάροδο του χρόνου και παράγουν διαφορετικές αντιλήψεις κίνησης. Η κίνηση της πρώτης τάξης ονομάζεται επίσης «φαινομενική κίνηση» και χρησιμοποιείται στην τηλεόραση και στην ταινία. Ένα παράδειγμα αυτού είναι το «κίνημα της βήτα», το οποίο είναι μια ψευδαίσθηση στην οποία οι σταθερές εικόνες φαίνεται να κινούνται, παρόλο που δεν κινούνται Η οπτική αυτή ψευδαίσθηση συμβαίνει επειδή το ανθρώπινο οπτικό νεύρο αποκρίνεται σε αλλαγές φωτός σε δέκα κύκλους ανά δευτερόλεπτο, έτσι ώστε οποιαδήποτε αλλαγή να είναι ταχύτερη από αυτή την ταχύτητα θα εγγραφεί ως κίνηση συνεχούς λειτουργίας και όχι ως ξεχωριστές εικόνες.

Η κίνηση δεύτερης τάξης αναφέρεται στην κίνηση που εμφανίζεται όταν ένα μετακινούμενο περίγραμμα ορίζεται από την αντίθεση, την υφή, την τρεμόπαιξη ή κάποια άλλη ποιότητα που δεν έχει ως αποτέλεσμα την αύξηση της φωτεινότητας ή της κίνησης της εικόνας. Τα στοιχεία δείχνουν ότι η έγκαιρη επεξεργασία της κίνησης πρώτης τάξης και της κίνησης δεύτερης τάξης πραγματοποιείται με ξεχωριστές διαδρομές. Οι μηχανισμοί δεύτερης τάξης έχουν φτωχότερη χρονική ανάλυση και είναι χαμηλής διέλευσης από την άποψη της κλίμακας χωρικών συχνοτήτων στις οποίες ανταποκρίνονται. Η κίνηση δεύτερης τάξης παράγει μια πιο αδύναμη κίνηση. Τα σήματα πρώτης και δεύτερης τάξης συνδυάζονται στο V5.

Σε αυτό το κεφάλαιο θα αναλύσουμε τις έννοιες Ανίχνευση κίνησης και ανάλυσης κινήσεων και θα εξηγήσουμε τον λόγο για τον οποίο οι όροι αυτοί δεν θα πρέπει να χρησιμοποιούνται εναλλακτικά. Θα αναλύσουμε τους μηχανισμούς με τους οποίους γίνεται αντιληπτή η κίνηση όπως οι αισθητήρες κίνησης και η παρακολούθηση χαρακτηριστικών. Υπάρχουν τρία κύρια θεωρητικά μοντέλα που προσπαθούν να περιγράψουν τη λειτουργία των νευρωνικών αισθητήρων κίνησης. Έχουν διεξαχθεί πειραματικές δοκιμές για να επιβεβαιωθεί η ακρίβεια αυτών των μοντέλων. Δυστυχώς, τα αποτελέσματα αυτών των δοκιμών είναι ασαφή και μπορεί να ειπωθεί ότι κανένα από αυτά τα μοντέλα δεν περιγράφει πλήρως τη λειτουργία των αισθητήρων κίνησης. Ωστόσο, κάθε ένα από αυτά τα μοντέλα προσομοιώνει ορισμένα χαρακτηριστικά των αισθητήρων κίνησης. Περιγράφονται μερικές ιδιότητες αυτών των αισθητήρων. Τέλος, αυτό το κεφάλαιο παρουσιάζει κάποιες ψευδαισθήσεις κίνησης, που δείχνουν ότι η αίσθηση κίνησης μπορεί να παραπλανηθεί από στατικούς εξωτερικούς παράγοντες που διεγείρουν τους αισθητήρες κίνησης με τον ίδιο τρόπο όπως και η κίνηση.

Ανάλυση κίνησης και αντίληψη κίνησης[επεξεργασία]

Οι έννοιες της ανάλυσης κίνησης και της αντίληψης κίνησης συχνά συγχέονται ως εναλλάξιμες. Η αντίληψη κίνησης και η ανάλυση κίνησης είναι σημαντικές μεταξύ τους, αλλά δεν είναι οι ίδιες. Ανάλυση κίνησης αναφέρεται στους μηχανισμούς στους οποίους επεξεργάζονται τα σήματα κίνησης. Με παρόμοιο τρόπο, όπου η αντίληψη κίνησης δεν εξαρτάται απαραίτητα από τα σήματα που δημιουργούνται από την κίνηση εικόνων στον αμφιβληστροειδή, η ανάλυση κίνησης μπορεί να οδηγήσει ή να μην οδηγήσει σε αντίληψη κίνησης. Ένα παράδειγμα αυτού του φαινομένου είναι το Vection, το οποίο συμβαίνει όταν ένα άτομο αντιλαμβάνεται ότι κινείται όταν είναι ακίνητο, αλλά το αντικείμενο που παρατηρεί κινείται. Η εντολή δείχνει ότι η κίνηση ενός αντικειμένου μπορεί να αναλυθεί, αν και δεν θεωρείται κίνηση που προέρχεται από το αντικείμενο. Αυτός ο ορισμός της ανάλυσης κίνησης υποδηλώνει ότι η κίνηση είναι μια βασική ιδιότητα εικόνας. Στο οπτικό πεδίο, αναλύεται σε κάθε σημείο. Τα αποτελέσματα αυτής της ανάλυσης χρησιμοποιούνται για την εξαγωγή αντιληπτικών πληροφοριών.

Η αντίληψη κίνησης αναφέρεται στη διαδικασία απόκτησης αντιληπτικής γνώσης σχετικά με την κίνηση αντικειμένων και επιφανειών σε μια εικόνα. Η κίνηση γίνεται αντιληπτή είτε από ευαίσθητους τοπικούς αισθητήρες στον αμφιβληστροειδή είτε από παρακολούθηση χαρακτηριστικών. Οι αισθητήρες τοπικής κίνησης είναι εξειδικευμένοι νευρώνες ευαίσθητοι στην κίνηση και είναι ανάλογοι με εξειδικευμένους αισθητήρες για το χρώμα. Η παρακολούθηση χαρακτηριστικών είναι ένας έμμεσος τρόπος για να αντιληφθεί κανείς την κίνηση και συνίσταται στην υποκίνηση κίνησης από αλλαγές στην αμφιβληστροειδική θέση αντικειμένων με την πάροδο του χρόνου. Αναφέρεται επίσης ως ανάλυση κίνησης τρίτης τάξης. Η παρακολούθηση χαρακτηριστικών λειτουργεί εστιάζοντας την προσοχή σε ένα συγκεκριμένο αντικείμενο και παρατηρώντας τον τρόπο με τον οποίο η θέση του έχει αλλάξει με την πάροδο του χρόνου.

Αισθητήρες κίνησης[επεξεργασία]

Η ανίχνευση της κίνησης είναι το πρώτο στάδιο της οπτικής επεξεργασίας και συμβαίνει χάρη στις εξειδικευμένες νευρικές διεργασίες, οι οποίες ανταποκρίνονται στις πληροφορίες σχετικά με τις τοπικές αλλαγές της έντασης των εικόνων με την πάροδο του χρόνου. Η κίνηση ανιχνεύεται ανεξάρτητα από άλλες ιδιότητες εικόνας σε όλες τις θέσεις της εικόνας. Έχει αποδειχθεί ότι υπάρχουν αισθητήρες κίνησης και λειτουργούν τοπικά σε όλα τα σημεία της εικόνας. Οι αισθητήρες κίνησης είναι εξειδικευμένοι νευρωνικοί αισθητήρες τοποθετημένοι στον αμφιβληστροειδή που είναι ικανοί να ανιχνεύουν μια κίνηση που παράγεται από δύο μικρές και μικρές φωτεινές αναλαμπές που είναι τόσο κοντά μεταξύ τους ώστε να μην μπορούν να ανιχνευθούν από την παρακολούθηση χαρακτηριστικών. Υπάρχουν τρία βασικά μοντέλα που προσπαθούν να περιγράψουν τον τρόπο με τον οποίο λειτουργούν αυτοί οι εξειδικευμένοι αισθητήρες. Αυτά τα μοντέλα είναι ανεξάρτητα το ένα από το άλλο και προσπαθούν να διαμορφώσουν συγκεκριμένα χαρακτηριστικά της αντίληψης κίνησης. Παρόλο που δεν υπάρχουν επαρκή στοιχεία για να υποστηριχθεί ότι κάποιο από αυτά τα μοντέλα αντιπροσωπεύει τον τρόπο που το οπτικό σύστημα (αισθητήρες κίνησης ιδιαίτερα) αντιλαμβάνεται την κίνηση, εξακολουθούν να διαμορφώνουν σωστά ορισμένες λειτουργίες αυτών των αισθητήρων.

Ο ανιχνευτής Reichardt[επεξεργασία]

Δύο διαφορετικοί μηχανισμοί ανίχνευσης κίνησης.


Ο ανιχνευτής Reichardt χρησιμοποιείται για να υποδείξει πώς οι αισθητήρες κίνησης ανταποκρίνονται στα σήματα κίνησης πρώτης τάξης. Όταν ένα αντικείμενο μετακινείται από το σημείο Α στο οπτικό πεδίο στο σημείο Β, παράγονται δύο σήματα: ένα πριν ξεκινήσει η κίνηση και ένα άλλο μετά την ολοκλήρωση της κίνησης. Αυτό το μοντέλο αντιλαμβάνεται αυτή την κίνηση ανιχνεύοντας αλλαγές φωτεινότητας σε ένα σημείο στον αμφιβληστροειδή και συσχετίζοντάς το με μια αλλαγή φωτεινότητας σε άλλο σημείο κοντά μετά από μια σύντομη καθυστέρηση. Ο ανιχνευτής Reichardt λειτουργεί με βάση την αρχή της συσχέτισης (στατιστική σχέση που περιλαμβάνει εξάρτηση). Ερμηνεύει ένα σήμα κίνησης με χωροχρονική συσχέτιση σημάτων φωτεινότητας στα γειτονικά σημεία. Χρησιμοποιεί το γεγονός ότι δύο δεκτικά πεδία σε διαφορετικά σημεία στην τροχιά ενός κινούμενου αντικειμένου λαμβάνουν μια χρονικά μετατοπισμένη έκδοση του ίδιου σήματος - ένα μοτίβο φωτεινότητας κινείται κατά μήκος ενός άξονα και το σήμα σε ένα σημείο του άξονα είναι μια χρονικά μετατοπισμένη έκδοση του ένα προηγούμενο σήμα στον άξονα. Το μοντέλο ανιχνευτή Reichardt διαθέτει δύο χωριστά χωριστούς ανιχνευτές γειτνίασης. Τα σήματα εξόδου των ανιχνευτών πολλαπλασιάζονται (συσχετίζονται) με τον ακόλουθο τρόπο: ένα σήμα πολλαπλασιασμένο με ένα δεύτερο σήμα που είναι η χρονικά μετατοπισμένη εκδοχή του πρωτοτύπου. Η ίδια διαδικασία επαναλαμβάνεται αλλά στην αντίστροφη κατεύθυνση της κίνησης (το σήμα που μετατοπίστηκε στο χρόνο γίνεται το πρώτο σήμα και το αντίστροφο). Στη συνέχεια, λαμβάνεται η διαφορά μεταξύ αυτών των δύο πολλαπλασιασμών και το αποτέλεσμα δίνει την ταχύτητα κίνησης. Η απόκριση του ανιχνευτή εξαρτάται από τη φάση, την αντίθεση και την ταχύτητα του ερεθίσματος. Πολλοί ανιχνευτές που συντονίζονται με διαφορετικές ταχύτητες είναι απαραίτητοι για την κωδικοποίηση της πραγματικής ταχύτητας του σχεδίου. Τα πιο συναρπαστικά πειραματικά στοιχεία για αυτό το είδος ανιχνευτή προέρχονται από μελέτες της διάκρισης κατεύθυνσης των ελάχιστα ορατών στόχων.

Φιλτράρισμα κίνησης-ενέργειας[επεξεργασία]

Το φίλτρο ενέργειας κίνησης είναι ένα μοντέλο αισθητήρων κίνησης που βασίζεται στην αρχή των φίλτρων αμετάβλητης φάσης. Αυτό το μοντέλο δημιουργεί χωροχρονικά φίλτρα προσανατολισμένα σε χωροχρόνο ώστε να ταιριάζουν με τη δομή των κινούμενων μοτίβων. Αποτελείται από διαχωρίσιμα φίλτρα, για τα οποία τα χωρικά προφίλ παραμένουν το ίδιο σχήμα με την πάροδο του χρόνου αλλά κλιμακώνονται με την τιμή των χρονικών φίλτρων. Τα φίλτρα ενέργειας κίνησης ταιριάζουν με τη δομή των κινούμενων μοτίβων προσθέτοντας μαζί διαχωρίσιμα φίλτρα Για κάθε κατεύθυνση κίνησης δημιουργούνται δύο φίλτρα χωροχρόνου: ένα, το οποίο είναι συμμετρικό (σαν ραβδίο) και το ένα είναι ασύμμετρο (άκρο). Το άθροισμα των τετραγώνων αυτών των φίλτρων καλείται ενέργεια κίνησης. Η διαφορά στο σήμα για τις δύο κατευθύνσεις ονομάζεται ενέργεια του αντιπάλου. Αυτό το αποτέλεσμα διαιρείται στη συνέχεια από την τετραγωνική έξοδο ενός άλλου φίλτρου, το οποίο συντονίζεται σε στατική αντίθεση. Αυτή η διαίρεση γίνεται για να ληφθεί υπόψη η επίδραση της αντίθεσης στην κίνηση. Τα φίλτρα ενέργειας κίνησης μπορούν να μοντελοποιήσουν ένα αριθμό φαινομένων κίνησης, αλλά παράγουν μια ανεξάρτητη από τη φάση μέτρηση, η οποία αυξάνεται με την ταχύτητα αλλά δεν δίνει αξιόπιστη τιμή ταχύτητας.

Χωροχρονική Διαβαθμίσεις[επεξεργασία]


Αυτό το μοντέλο αισθητήρων κίνησης αναπτύχθηκε αρχικά στον τομέα της όρασης του υπολογιστή και βασίζεται στην αρχή ότι η αναλογία του χρονικού παραγώγου της φωτεινότητας της εικόνας με το χωρικό παράγωγο της φωτεινότητας της εικόνας δίνει την ταχύτητα κίνησης. Είναι σημαντικό να σημειωθεί ότι στις κορυφές και τις καμπύλες της εικόνας, αυτό το μοντέλο δεν θα υπολογίσει μια επαρκή απάντηση, επειδή το παράγωγο στον παρονομαστή θα είναι μηδέν. Για την επίλυση αυτού του προβλήματος, μπορούν επίσης να αναλυθούν τα χωρικά παράγωγα πρώτης τάξης και υψηλότερης τάξης σε σχέση με το χώρο και το χρόνο. Οι Spatiotemporal Gradients είναι ένα καλό μοντέλο για τον προσδιορισμό της ταχύτητας κίνησης σε όλα τα σημεία της εικόνας.

Οι αισθητήρες κίνησης είναι Προσανατολισμός-Επιλεκτικός[επεξεργασία]

Μία από τις ιδιότητες των αισθητήρων κίνησης είναι η επιλεκτικότητα προσανατολισμού, η οποία περιορίζει την ανάλυση κίνησης σε μία μόνο διάσταση. Οι αισθητήρες κίνησης μπορούν να καταγράφουν κίνηση μόνο σε μία διάσταση κατά μήκος ενός άξονα ορθογώνιου προς τον προτιμώμενο προσανατολισμό του αισθητήρα. Ένα ερέθισμα που περιέχει χαρακτηριστικά ενός μόνο προσανατολισμού μπορεί μόνο να θεωρηθεί ότι κινείται προς μια κατεύθυνση ορθή προς τον προσανατολισμό του ερεθίσματος. Τα μονοδιάστατα σήματα κίνησης δίνουν διφορούμενες πληροφορίες σχετικά με την κίνηση των δισδιάστατων αντικειμένων. Ένα δεύτερο στάδιο της ανάλυσης κίνησης είναι απαραίτητο για την επίλυση της πραγματικής κατεύθυνσης κίνησης ενός αντικειμένου ή μοτίβου 2-D. Τα σήματα κίνησης 1-D από αισθητήρες συντονισμένους σε διαφορετικούς προσανατολισμούς συνδυάζονται για να παράγουν ένα σαφές σήμα κίνησης 2-D. Η ανάλυση της κίνησης 2-D εξαρτάται από σήματα από τοπικούς ευρέως προσανατολισμένους αισθητήρες καθώς και από σήματα από στενά προσανατολισμένους αισθητήρες.

Παρακολούθηση λειτουργιών[επεξεργασία]

Ένας άλλος τρόπος με τον οποίο αντιλαμβανόμαστε την κίνηση είναι μέσω της παρακολούθησης χαρακτηριστικών. Η Παρακολούθηση στοιχείων συνίσταται στην ανάλυση του εάν οι τοπικές λειτουργίες ενός αντικειμένου έχουν αλλάξει θέσεις ή όχι και υπονοούν τη μετακίνηση από αυτήν την αλλαγή. Σε αυτήν την ενότητα αναφέρονται ορισμένες λειτουργίες σχετικά με τους ιχνηλάτες λειτουργιών.

Οι ιχνηλάτες λειτουργιών αποτυγχάνουν όταν ένα κινούμενο ερέθισμα εμφανίζεται πολύ γρήγορα. Οι ιχνηλάτες λειτουργιών έχουν το πλεονέκτημα έναντι των αισθητήρων κίνησης ώστε να μπορούν να αντιλαμβάνονται την κίνηση ενός αντικειμένου, ακόμη και αν η κίνηση διαχωρίζεται από διαλείπον κενά διαστήματα. Μπορούν επίσης να διαχωρίσουν αυτά τα δύο στάδια (κινήσεις και κενά διαστήματα). Οι αισθητήρες κίνησης, από την άλλη πλευρά, απλώς θα ενσωμάτωναν τα κενά με το κινούμενο ερέθισμα και θα δουν μια συνεχή κίνηση. Οι ιχνηλάτες λειτουργιών λειτουργούν στις θέσεις των αναγνωρισμένων χαρακτηριστικών. Για το λόγο αυτό, έχουν ελάχιστο όριο απόστασης που ταιριάζει με την ακρίβεια με την οποία οι θέσεις των χαρακτηριστικών μπορούν να διακρίνονται. Οι ιχνηλάτες λειτουργιών δεν εμφανίζουν μετακινήσεις, οι οποίες είναι οπτικές ψευδαισθήσεις που προκαλούνται ως αποτέλεσμα οπτικής προσαρμογής. Οι συνέπειες της κίνησης εμφανίζονται όταν, μετά την παρατήρηση ενός κινούμενου ερεθίσματος, ένα σταθερό αντικείμενο φαίνεται να κινείται προς την αντίθετη κατεύθυνση του προηγουμένως παρατηρούμενου κινούμενου ερεθίσματος. Είναι αδύνατο για αυτόν τον μηχανισμό να παρακολουθεί πολλαπλές κινήσεις σε διαφορετικά μέρη του οπτικού πεδίου και ταυτόχρονα. Από την άλλη πλευρά, οι πολλαπλές κινήσεις δεν αποτελούν πρόβλημα για τους αισθητήρες κίνησης, επειδή λειτουργούν παράλληλα σε όλο το οπτικό πεδίο.

Πειράματα έχουν διεξαχθεί χρησιμοποιώντας τις παραπάνω πληροφορίες για να φτάσουν ενδιαφέροντα συμπεράσματα σχετικά με τους ιχνηλάτες χαρακτηριστικών. Τα πειράματα με σύντομα ερεθίσματα έχουν δείξει ότι τα σχέδια χρώματος και τα σχήματα αντίθεσης σε υψηλές αντιθέσεις δεν αντιλαμβάνονται οι ιχνηλάτες χαρακτηριστικών αλλά οι αισθητήρες κίνησης. Τα πειράματα με κενά διαστήματα έχουν επιβεβαιώσει ότι η παρακολούθηση χαρακτηριστικών μπορεί να συμβεί με κενά διαστήματα στην οθόνη. Μόνο σε μεγάλη αντίθεση, οι αισθητήρες κίνησης αντιλαμβάνονται την κίνηση των χρωματικών ερεθισμάτων και των μοντέλων αντίθεσης. Σε χαμηλές αντιθέσεις, οι ιχνηλάτες αναλύουν την κίνηση τόσο των χρωματογραφικών μοτίβων όσο και των φακέλων αντίθεσης και σε υψηλές αντιθέσεις οι αισθητήρες κίνησης αναλύουν τους φακέλους αντίθεσης. Τα πειράματα στα οποία τα άτομα κάνουν κρίσεις πολλαπλής κίνησης υποδηλώνουν ότι η παρακολούθηση χαρακτηριστικών είναι μια διαδικασία που πραγματοποιείται υπό συνειδητό έλεγχο και ότι είναι ο μόνος τρόπος που πρέπει να αναλύσουμε την κίνηση των φακέλων αντίθεσης σε οθόνες χαμηλής αντίθεσης. Αυτά τα αποτελέσματα συμφωνούν με την άποψη ότι η κίνηση των φακέλων αντίθεσης και των χρωμάτων εξαρτάται από την παρακολούθηση χαρακτηριστικών, εκτός εάν τα χρώματα είναι πολύ πάνω από το κατώφλι ή η μέση αντίθεση είναι υψηλή. Το κύριο συμπέρασμα αυτών των πειραμάτων είναι ότι πιθανότατα είναι η παρακολούθηση χαρακτηριστικών που επιτρέπει την αντίληψη των φακέλων αντίθεσης και των χρωμάτων.

Ψευδαισθήσεις κινήσεων[επεξεργασία]

Ως συνέπεια της διαδικασίας στην οποία λειτουργεί η ανίχνευση κίνησης, κάποιες στατικές εικόνες μπορεί να φανούν σαν να κινούνται. Αυτές οι εικόνες δίνουν μια εικόνα για τις υποθέσεις που κάνει το οπτικό σύστημα και ονομάζονται οπτικές ψευδαισθήσεις.

Μια διάσημη ψευδαίσθηση κινήσεων που σχετίζεται με σήματα κίνησης πρώτης τάξης είναι το φαινόμενο Phi, το οποίο είναι μια οπτική ψευδαίσθηση που μας κάνει να αντιλαμβανόμαστε την κίνηση αντί μιας ακολουθίας εικόνων. Αυτή η ψευδαίσθηση κινήσεων μας επιτρέπει να βλέπουμε ταινίες ως συνέχεια και όχι ως ξεχωριστές εικόνες. Το φαινόμενο phi επιτρέπει σε μια ομάδα παγωμένων εικόνων που αλλάζουν με σταθερή ταχύτητα να θεωρούνται ως μια συνεχής κίνηση. Το φαινόμενο Phi δεν πρέπει να συγχέεται με τη Βήτα Κίνηση, επειδή η πρώτη είναι μια εμφανής κίνηση που προκαλείται από φωτεινούς παλμούς σε μια ακολουθία, ενώ η τελευταία είναι μια εμφανής κίνηση που προκαλείται από φωτεινούς στατικές παλμούς.

Οι ψευδαισθήσεις κινήσεων συμβαίνουν όταν η αντίληψη κίνησης, η ανάλυση κίνησης και η ερμηνεία αυτών των σημάτων είναι παραπλανητικές και το οπτικό μας σύστημα δημιουργεί ψευδαισθήσεις σχετικά με την κίνηση. Αυτές οι ψευδαισθήσεις μπορούν να ταξινομηθούν ανάλογα με το ποια διαδικασία τους επιτρέπει να συμβούν. Οι ψευδαισθήσεις ταξινομούνται ως ψευδαισθήσεις που σχετίζονται με την ανίχνευση κίνησης, την ολοκλήρωση 2D και την τρισδιάστατη ερμηνεία.

Οι πιο δημοφιλείς ψευδαισθήσεις σχετικά με την ανίχνευση κίνησης είναι οι τετράχρονες κινήσεις, οι RDK και οι κινήσεις δεύτερης τάξης σηματοδοτούν ψευδαισθήσεις. Οι πιο δημοφιλείς ψευδαισθήσεις σχετικά με την ενσωμάτωση 2D είναι Motion Capture, Plaid Motion και Direct Repulsion. Ομοίως, αυτές που αφορούν την τρισδιάστατη ερμηνεία είναι η Μετασχηματιστική Κίνηση, το Κινητικό Βάθος, η Σκιώδης Κίνηση, η Βιολογική Κίνηση, η Στερεοκινητική κίνηση, η Κινητή Εικόνα και η κίνηση 2 Stroke. Υπάρχουν πολύ περισσότεροι κινούμενοι ψευδαισθήσεις, και όλα δείχνουν κάτι ενδιαφέρον για τους μηχανισμούς ανίχνευσης κινήσεων, ανίχνευσης κινήσεων και ανάλυσης. Για περισσότερες πληροφορίες, επισκεφθείτε τον ακόλουθο σύνδεσμο:

http://www.lifesci.sussex.ac.uk/home/George_Mather/Motion/

Άνοιγμα προβλημάτων[επεξεργασία]

Παρόλο που ακόμα δεν καταλαβαίνουμε τις περισσότερες λεπτομέρειες σχετικά με την αντίληψη κίνησης, η κατανόηση των μηχανισμών με τους οποίους γίνεται αντιληπτή η κίνηση καθώς και η ψευδαίσθηση της κίνησης μπορούν να δώσουν στον αναγνώστη μια καλή εικόνα της κατάστασης της τέχνης στο θέμα. Μερικά από τα ανοιχτά προβλήματα σχετικά με την αντίληψη κίνησης είναι οι μηχανισμοί σχηματισμού 3D εικόνων σε παγκόσμια κίνηση και το πρόβλημα διαφράγματος.

Παγκόσμια σήματα κίνησης από τον αμφιβληστροειδή είναι ενσωματωμένα για να φθάσουν σε ένα 2-διαστάσεων σήμα παγκόσμιας κίνησης? Ωστόσο, δεν είναι σαφές πώς διαμορφώνεται η 3D παγκόσμια κίνηση. Το πρόβλημα της διαφράγματος συμβαίνει επειδή κάθε πεδίο υποδοχής στο οπτικό σύστημα καλύπτει μόνο ένα μικρό κομμάτι του οπτικού κόσμου, το οποίο οδηγεί σε ασάφειες στην αντίληψη. Το πρόβλημα ανοίγματος αναφέρεται στο πρόβλημα ενός κινούμενου περιγράμματος το οποίο, όταν παρατηρείται τοπικά, είναι συνεπές με διαφορετικές δυνατότητες κίνησης. Αυτή η ασάφεια έχει γεωμετρική προέλευση - δεν μπορεί να ανιχνευθεί κίνηση παράλληλη με το περίγραμμα, καθώς οι αλλαγές σε αυτό το στοιχείο της κίνησης δεν αλλάζουν τις εικόνες που παρατηρούνται μέσω του ανοίγματος. Το μόνο συστατικό που μπορεί να μετρηθεί είναι η ταχύτητα ορθογώνια προς τον προσανατολισμό του περιγράμματος. Για το λόγο αυτό, η ταχύτητα του κινήματος θα μπορούσε να είναι οτιδήποτε από την οικογένεια κινήσεων κατά μήκος μιας γραμμής στον χώρο ταχύτητας. Αυτό το πρόβλημα ανοίγματος δεν παρατηρείται μόνο σε ευθεία περίγραμμα, αλλά και σε ομαλά καμπύλες, καθώς είναι κατά προσέγγιση ίσια όταν παρατηρείται τοπικά. Παρόλο που οι μηχανισμοί για την επίλυση του Προβλήματος Ανοιγμάτων είναι ακόμα άγνωστοι, υπάρχει κάποια υπόθεση για το πώς θα μπορούσε να λυθεί. Για παράδειγμα, θα μπορούσε να επιλυθεί αυτό το πρόβλημα συνδυάζοντας πληροφορίες σε ολόκληρο το διάστημα ή από διαφορετικά περιγράμματα του ίδιου αντικειμένου.

Συμπεράσματα[επεξεργασία]

Σε αυτό το κεφάλαιο, παρουσιάσαμε την αντίληψη κίνησης και τους μηχανισμούς με τους οποίους το οπτικό μας σύστημα εντοπίζει την κίνηση. Οι ψευδαισθήσεις κίνησης έδειξαν πώς τα σήματα κίνησης μπορεί να είναι παραπλανητικά και, συνεπώς, να οδηγούν σε εσφαλμένα συμπεράσματα σχετικά με την κίνηση. Είναι σημαντικό να θυμάστε ότι η αντίληψη κίνησης και η ανάλυση κίνησης δεν είναι οι ίδιες. Οι αισθητήρες κίνησης και οι ιχνηλάτες λειτουργιών αλληλοσυμπληρώνονται ώστε το οπτικό σύστημα να αντιλαμβάνεται την κίνηση.

Η αντίληψη κίνησης είναι περίπλοκη και εξακολουθεί να είναι μια ανοιχτή περιοχή έρευνας. Αυτό το κεφάλαιο περιγράφει μοντέλα σχετικά με τον τρόπο λειτουργίας των αισθητήρων κίνησης και υποθέσεις σχετικά με τα χαρακτηριστικά των ιχνηλατών χαρακτηριστικών. Ωστόσο, χρειάζονται περισσότερα πειράματα για να μάθουν για τα χαρακτηριστικά αυτών των μηχανισμών και να είναι σε θέση να κατασκευάσουν μοντέλα που μοιάζουν με τις πραγματικές διαδικασίες του οπτικού συστήματος με μεγαλύτερη ακρίβεια.

Η ποικιλία των μηχανισμών ανάλυσης κίνησης και αντίληψης κίνησης που περιγράφονται σε αυτό το κεφάλαιο, καθώς και η εκλέπτυνση των τεχνητών μοντέλων που έχουν σχεδιαστεί για να τα περιγράψουν, καταδεικνύουν ότι υπάρχει πολύ μεγάλη πολυπλοκότητα στον τρόπο με τον οποίο ο φλοιός επεξεργάζεται σήματα από το εξωτερικό περιβάλλον. Χιλιάδες εξειδικευμένοι νευρώνες ενσωματώνουν και ερμηνεύουν κομμάτια τοπικών σημάτων για να σχηματίσουν σφαιρικές εικόνες κινούμενων αντικειμένων στον εγκέφαλό μας. Η κατανόηση ότι πολλοί φορείς και διαδικασίες στο σώμα μας πρέπει να δουλεύουν μαζί για να αντιληφθούμε την κίνηση καθιστά την ικανότητά μας σε αυτό πιο αξιοσημείωτο ότι εμείς ως άνθρωποι μπορούμε να το κάνουμε με τέτοια ευκολία.

Πρότυπο:BookCat

Bιβλιογραφικές Aναφορές[επεξεργασία]

Πρότυπο:BookCat