AI의 눈이 진화한다. 컴퓨터 비전



컴퓨터 비전(Computer Vision)은 컴퓨터에 시각을 부여해 이미지를 분석함으로써 유용한 정보를 생성하는 기술이다. 컴퓨터 비전은 인공지능의 한 분야로, 딥러닝 기술이 확장한 분야라고 볼 수 있다.


컴퓨터 비전은 영상에서 물체를 감지, 인식, 분류, 위치 파악을 하거나 연속 영상에서 물체를 추적할 때 필요하다. 인간의 자세와 팔다리 움직임을 3차원으로 추정할 때나, 콘텐츠에 따라 디지털 영상을 탐색할 때도 필요하다. 


컴퓨터 비전은 먼저 인간의 눈, 시신경, 뇌가 하는 작업을 수학적으로 이해하고, 이를 그대로 혹은 비슷하게 수행할 수 있는 컴퓨터 시스템을 만든다. 최근에는 시각 정보 뿐만 아니라 청각, 촉각 등 대부분의 감각 분석을 통합해서 실시하고 있다. 구글, 애플, 페이스북, 테슬라 등 글로벌 ICT 기업들은 컴퓨터 비전에 적극적으로 투자하고 기술 개발에 매진하고 있는데, 2020년 이후에는 이를 기반으로 한 상용화 서비스들이 등장할 것으로 기대된다.


구글은 보쉬(Bosch), 엔비디아(Nvidia) 등 다양한 분야의 기업들과 협업해 탱고 프로젝트를 진행했다. 탱고 프로젝트는 모바일 기기가 실제 현실 세계를 학습해나가게 하는 프로젝트로, 센서를 이용한 동작 감지, 원근 거리 이해, 시각 정보를 해석한 공간 인식 등 모바일 기기의 카메라가 사람의 눈, 시신경, 뇌가 하는 역할을 구대로 수행하게 하는 것을 목표로 했다. 스마트폰 뿐만 아니라 태블릿, 웨어러블 등 모바일 기기 전체를 대상으로 실시했으며 고성능, 대용량의 컴퓨터가 아닌 일반 소비재 기기에서도 컴퓨터 비전 기술을 활용할 수 있도록 하는 상업화 기술의 초석이다.



<출처: 2020 빅 체인지 - PUBLY 기사>

반응형
반응형