AI의 눈이 진화한다. 컴퓨터 비전



컴퓨터 비전(Computer Vision)은 컴퓨터에 시각을 부여해 이미지를 분석함으로써 유용한 정보를 생성하는 기술이다. 컴퓨터 비전은 인공지능의 한 분야로, 딥러닝 기술이 확장한 분야라고 볼 수 있다.


컴퓨터 비전은 영상에서 물체를 감지, 인식, 분류, 위치 파악을 하거나 연속 영상에서 물체를 추적할 때 필요하다. 인간의 자세와 팔다리 움직임을 3차원으로 추정할 때나, 콘텐츠에 따라 디지털 영상을 탐색할 때도 필요하다. 


컴퓨터 비전은 먼저 인간의 눈, 시신경, 뇌가 하는 작업을 수학적으로 이해하고, 이를 그대로 혹은 비슷하게 수행할 수 있는 컴퓨터 시스템을 만든다. 최근에는 시각 정보 뿐만 아니라 청각, 촉각 등 대부분의 감각 분석을 통합해서 실시하고 있다. 구글, 애플, 페이스북, 테슬라 등 글로벌 ICT 기업들은 컴퓨터 비전에 적극적으로 투자하고 기술 개발에 매진하고 있는데, 2020년 이후에는 이를 기반으로 한 상용화 서비스들이 등장할 것으로 기대된다.


구글은 보쉬(Bosch), 엔비디아(Nvidia) 등 다양한 분야의 기업들과 협업해 탱고 프로젝트를 진행했다. 탱고 프로젝트는 모바일 기기가 실제 현실 세계를 학습해나가게 하는 프로젝트로, 센서를 이용한 동작 감지, 원근 거리 이해, 시각 정보를 해석한 공간 인식 등 모바일 기기의 카메라가 사람의 눈, 시신경, 뇌가 하는 역할을 구대로 수행하게 하는 것을 목표로 했다. 스마트폰 뿐만 아니라 태블릿, 웨어러블 등 모바일 기기 전체를 대상으로 실시했으며 고성능, 대용량의 컴퓨터가 아닌 일반 소비재 기기에서도 컴퓨터 비전 기술을 활용할 수 있도록 하는 상업화 기술의 초석이다.



<출처: 2020 빅 체인지 - PUBLY 기사>

반응형

■ '제4차 산업혁명', 인공지능 신시대 (2 of 4)



'제4차 산업혁명'의 중심이라 할 수 있는 '글로벌 CPS 생태계'에 대해서 다시 한 번 언급한다.

우리가 최근에 흔히 접하는 용어인 IoT(Internet of Things), IoE(Internet of Everything)는 세상의 모든 사물과 서비스가 인터넷으로 연결된다는 개념이다. 그리고 이렇게 연결된 스마트 디바이스에는 센서가 내장되어 있고, 혹은 외부의 센서를 인식할 수 있는 기능이 있다. 센서를 통해서 우리는 빅데이터를 수집하게 된다. 그리고 인공지능(AI)을 통해서 목적에 맞게 분석하여 해석이 된다.

이런 일련의 과정을 통해서 실제 현실(Physical)의 세계와 사이버(Cyber) 세계가 연결시켜줌으로써 서로 새로운 피드백과 진화를 거듭하게 된다. 이를 글로벌 CPS(Cyber Physical System) 생태계라고 칭한다.


오늘은 '글로벌 CPS 생태계'에서 빅데이터를 분석하고 해석하는 '인공지능(AI)'에 대해서 살펴 보자.

인공지능의 최신 기술 중 '딥러닝(Deep Learning)'은 한 마디로 말하면 컴퓨터가 사람처럼 생각하고 학습하는 기술이다.


# Deep Learning


딥러닝 기술이 등장한 배경에는 인간의 힘으로는 처리할 수 없는 초거대 빅데이터를 분석해야 하는 필요성이 한층 증대되었기 때문이다. 특히 IoT의 등장으로 인공지능 학습에 필요한 빅데이터의 수집이 가능해지면서, 그 학습에 요구되는 정보처리를 위한 강력한 컴퓨터 이용 환경이 실현되었기 때문이다. 앞으로 IoT에서 IoE 환경으로 발전하고 컴퓨터 성능이 향상되면 인공지능의 진화는 보다 가속화될 전망이다. (p106)


인공지능의 역사는 1956년에 개최된 미국 다트머스대학교의 학술회의에서 존 매카시 교수가 사용한 것이 시초가 되었다. 그 후 지속적인 발전을 해왔으나 해결하지 못한 문제들도 많았다. 그러한 문제 해결에 돌파구를 열어준 것은 '스파스 코딩(Sparse coding)'이라는 기술이었다. 이것은 시각, 청각, 미각 등 인간의 다양한 인지 기제 알고리즘을 기반으로 한 기술이었다. 스파스 코딩은 뉴럴 네트워크로의 입력 정보에서 인식에 필요한 개념 형성을 위한 정보를 추출하는 기술이다. 스파스 코딩을 탑재한 다중화 뉴럴 네트워크는 숨은 층의 정보가 심층까지 전달됨에 따라 예를 들어 화상일 경우 점에서 선, 선에서 윤곽, 윤곽에서 부분, 부분에서 전체 이미지와 같은 식의 고차 개념으로 학습의 심도를 단계적으로 끌어올릴 수 있다. 이러한 학습 심도가 계층화된 뉴럴 네트워크를 총칭하는 심층학습, 즉 딥러닝으로 부르고 있다. (p111)



딥러닝은 현재 세계 유수의 ICT 기업이 최우선 과제로 대응하고 있는 인공지능 기술이다. 그 중 구글은 스탠퍼드대학교와 공동연구를 수행하면서 성과를 보이고 있다. 대표적인 사례가 구글이 딥러닝 기술을 이용해서 컴퓨터가 고양이에 대한 사전 정보가 전혀 없는 상황에서 대량의 유튜브 동영상에서 고양이를 식별해내는 데 성공한 것이다.  이외에도 구글의 음성 검색, 애플의 음성 인식 어플리케이션 '시리(Siri)'도 딥러닝 기술이 적용된 사례이다.


그 이외의 기술에 대해서 더 살펴보자.


이러한 딥러닝의 실용성에 주목하여 세계 유수의 IT 기업들은 일제히 딥러닝 전용 프로세서 개발에 착수하고 있다. 특히 미국 정부는 대뇌의 신경회로망을 모방한 반도체칩은 뉴로모픽칩(Neuromorphic Chip) 개발에 대한 지원을 강화하고 있다. 거대 칩 메이커인 퀄컴도 뇌를 모방한 칩 개발을 서두르고 있는데, 스파이킹 뉴럴 네트워크를 탑재한 뇌신경 모방 반도체칩을 개발하고 있다. (p112)

이외에도 인간의 뇌 기능 자체를 모방함으로써 인공지능을 실현하려는 시도도 나타나고 있다.  이는 전뇌 에뮬레이션(WBE : Whole Brain Emulation)이라고 부른다고 한다. WBE의 개념은 어느 특정 뇌를 스캔하여 그 오리지날 뇌와 같은 기능을 가진 소프트웨어를 만들어, 이에 대응하는 맞춤 하드웨어에 탑재하면 그것이 본래의 뇌와 같은 거동을 보일 것이라는 전제하에서 접근하는 것이라고 한다.


# 인간과 기계의 공생 생태계




구글은 2013년 이후 로봇 관련 7개 회사, 인공지능 관련 4개 회사를 매수했다. 제조업 혁신을 위해 독일 정부가 공식적으로 발표한 기술 전략인 '인더스트리 4.0'도 인공지능 탑재 로봇을 활용한 자율분산적인 생산 시스템 구축을 최종 목표로 하고 있다. (p115)


이제 인공지능 기술은 받아들일지 말지를 선택하는 단계를 넘어섰다. 인공지능 기술은 현실에 반영되고 있으며 앞으로 더 많은 분야에 반영이 될 것이다. 하지만 인공지능 개발에는 항상 딜레마가 따라 다닌다. 인간 친화적인 인공지능(AI) 이라면 언제나 환영이지만 인간을 위협하는 인공지능(AI)의 등장에 대한 두려움은 쉽게 떨쳐버리기 어렵다.


세계적인 물리학자 스티븐 호킹 박사는 BBC 와의 인터뷰에서 "AI 기술의 발전이 인류의 종말을 초래할 수도 있다" 고 경고했다. 그리고 최근 가장 주목을 받고 있는 한 사람인 테슬라 모터스의 CEO, 앨런 머스크도 "기계가 인간을 위해 많은 일을 해줄 수는 있지만 초지능은 그렇지 않다. AI 연구는 악마를 소환하는 일이다" 며 인공지능의 발전을 비판한 적이 있다.


이러한 논의는 과학의 역사에서 꾸준히 재기되어왔던 문제들이다. 특히 여전히 현재진행 중인 생명과학에 대한 분야에서의 갈등도 이와 같은 맥락이다. 하지만 분명히 인류에 엄청난 이득을 가져다 줄 것으로 기대되기 때문에 이 흐름은 막을 수 없다. 흐름을 막을 수 없을 때는 어쩔 수 없다. 발생 가능 할 것으로 예상되는 것을 막기 위해서 인공지능 기술에 대한 기본적인 지침을 마련하고, 인간과 인공지능이 공존할 수 있도록 인류의 지혜를 결집하는 수 밖에 없다.



반응형
반응형