Quand les stimuli CMOS riment avec vision artificielle chez IBM
sur
Quand notre regard est porté sur une scène, nous sommes attirés par les éléments les plus pertinents de l’image (contours des objets, couleurs vives, éléments en mouvement, …) et de moins en moins vers les informations redondantes (zones uniformes et peu contrastées). C’est cette attention visuelle que les ingénieurs IniLabs tentent de synthétiser dans la toute dernière architecture biomimétique du géant informatique IBM. Il s’agit d’intégrer un capteur visuel similaire à la rétine humaine au sein d’une nouvelle génération d’ordinateurs multicœurs mimant le réseau neuronal du cerveau humain. Un peu comme pour le cortex visuel de notre cerveau, ce type singulier de caméra est hypersensible au mouvement d’où son nom de capteur visuel de mouvement : DVS ou Dynamic Vision Sensor en anglais.
Afin de travailler sur une vidéo, la plupart des détecteurs de mouvements s’appuient sur la différence d’une succession d’image décrivant l’objet en mouvement. Ce qui provoque un temps de calcul considérable quand les informations redondantes (tel que les zones non contrastées) de l’image ne sont pas éliminées. De plus avec cette méthode, il est nécessaire que deux images successives aient un même niveau d’éclairage afin de ne pas perdre la détection d’un objet dont le niveau d’exposition des pixels est fluctuant.
Avec DVS, la détection de mouvement n’est pas faite de façon globale (ou sur la différence deux images successives) mais locale. C’est-à-dire que des cellules photoréceptrices permettent de charger des condensateurs reliés à l’entrée d’un certain nombre de transistors CMOS. Ceux-ci transmettent l’activité des pixels en mouvements tout en se passant des zones statiques de la vidéo. Les pixels décrivant une dynamique locale sont transmis via USB vers une API java open source.
Tobi Delbruck, responsable de l’équipe scientifique d’Initlabs, espère que leur collaboration avec IBM aboutira à un système plus apte à appréhender les problèmes de détection de mouvement en temps réel au sein des architectures des machines intelligentes. Reste encore à gérer la sensibilité aux couleurs ainsi qu’aux orientations singulières quand il n’y a rien qui bouge dans la scène.
Discussion (0 commentaire(s))