관리 메뉴

클라이언트/ 서버/ 엔지니어 "게임 개발자"를 향한 매일의 공부일지

인간의 시각을 흉내 내는 컴퓨터 비전 1 - 컴퓨터 비전과 인간의 시각과의 관계 본문

인공지능/컴퓨터 비전

인간의 시각을 흉내 내는 컴퓨터 비전 1 - 컴퓨터 비전과 인간의 시각과의 관계

huenuri 2024. 11. 4. 05:32

드디어 어제까지 시각지능 공부를 마치고 오늘부터 컴퓨터 비전 공부를 할 수 있게 되었다. 어떤 공부가 될지 정말 기대가 된다. 이 책을 구입한지 두 달 이상 지났는데 드디어  첫 장을 열 수 있을 것 같아 기쁘다. 책과 함께 수업했던 내용도 다시 듣고 학습일지에 써볼 생각이다. 비록 선생님들은 기대했던 것만큼 잘 가르치지는 못했을 지라도 분명 배울 점이 있을 테니 말이다.
 
인간의 시각은 놀랍다. 영상에서 아래 그림과 같은 영상을 본 사람은 멋진 다이빙 선수라고 말한다. 아래쪽에 깊은 수영장이 있다고 누구나 추론한다. 그리고 물 속으로 풍덩 빠지는 장면이 순식간에 나타날 것이라고 다음을 예측한다. 관중의 환호를 받는 장면까지 상상한다.

 
인간의 이런 놀라운 시각을 컴퓨터가 흉내 낼 수 있을까? 이런 질문을 품고 컴퓨터 비전의 세상으로 들어가보자.


 
 
 

인간의 시각

시각은 오감 중에서 가장 뛰어난 감각이다. 물체에 반사된 빛은 렌즈에 해당하는 수정체를 통해 눈의 내부로 들어와 딧면에 있는 망막에 투영된다. 망막은 빛을 화학 신호로 변환하고 시신경은 노란색으로 표시되어 있는 1차 시각 피질로 신호를 전송한다. 도착한 신호는 녹색으로 표시된 등쪽 경로와 보라색으로 표시된 배쪽 경로로 나뉘어 전달된다. 이렇게 알아낸 인식 정보를 통해 신체 부위를 적절하게 제어한다. 이런 과정을 사람은 매 순간 빠르고 정확하게 아주 손쉽게 해낸다.

 
 
 
인간 시각의 강점은 다음과 같다.

인간 시각의 강점

  • 분류, 검출, 분할, 추척, 행동 분석에 능숙하다 : 이 기능들이 동시에 유기적으로 수행되어 매우 정확하고 빠르다.
  • 3차원 복원 능력이 있다 : 만맘에 맺힌 2차원 영상을 역으로 해석해 3차원 정보를 복원한다. 이때 두 눈을 사용해 정확성을 더욱 높인다.
  • 빠르고 강건하다 : 큰 노력을 들이지 않고도 변하는 장면을 빠르게 해석한다.
  • 지식 표현, 추론, 계확과 협동한다 : 시각은 다른 지능 요소의 도움을 받아 정확도를 높이고 해석의 지평을 넓힌다. 또한 인식한 정보를 이 지능 요소들에 제공함으로써 의사결정 수준을 높인다.
  • 사전 행동에 능숙하다 : 방금 전에 처리한 결과에 따라 미리 시점을 바꾸고 관심 물체에 선택적 주의집중을 하여 시각 정보 처리의 효과를 극대화한다.
  • 과업 전환이 매끄럽고 유기적이며 빠르다 : 앞에 있는 사람이 누구인지 알아내는 과압을 마친 다음 표정을 인식하는 과업으로 전환할 때 틈새 없이 전환한다. 이전 과업에서 알아낸 정보를 이후 과업에 적극 활용한다.
  • 비주얼 서보잉(visual servoing)이 뛰어나다 : 시각 처리로 알아낸 정보로 팔을 제어해 과일을 따거나 물건을 집능 등의 행동을 쉽게 달성한다.

 
 
그러나 인간 시각은 다음과 같은 한계를 안고 있다.

인간 시각의 약점

  • 착시가 있다 : 왼쪽부터 차례대로 '두 선분의 길이가 같은가?', 'A와 B의 밝기가 같은가?', '주황색 원의 크기가 같은가?', '수평선이 평행인가?'와 같은 질문을 던진다면 인간은 이 질문에 오답을 내기 일쑤다.
  • 정밀 측정에 오차가 있다 : 도구를 사용하지 않으면 물체 길이를 mm 단위까지 정확하게 알아내지 못한다.
  • 시야가 한정되어 있다 : 수평 방향으로 180도, 수직 방향으로 120도까지만 볼 수 있다.
  • 피로해지고 퇴화한다 : 단기적으로 피로 현상을 막을 수 없고 장기적으로 퇴화 현상을 피할 수 없다.

 
 
 
 

왜 컴퓨터 비전인가?

컴퓨터 비전은 인간의 시각을 흉내 내는 컴퓨터 프로그램이다. 아래 그림이 보여주는 바와 같이 컴퓨터 비전은 인공지능의 중요한 구성 요소다. 예를 들어 시각 지능이 없는 로봇은 다른 기능이 아 무리 뛰어나도 정해진 경로로 이동할 수밖에 없고 작업 환경이 조금만 바뀌어도 성능이 크게 떨어져 애물단지가 된다. 파란 테두리 박스의 내용이 이 책의 주제다.
 

 
 
현재의 컴퓨터 비전 기술로 인간에 필적하는 시각을 구현하는 일은 불가능하다. 하지만 과업을 한정하면 인간의 성능에 가깝거나 뛰어넘는 컴퓨터 비전을 만들어 당장 활용할 수 있는 응용 분야는 무궁무진하다. 


 
 
 

학습을 마치고

오늘부터 일주일 동안 컴퓨터 비전을 공부해볼 생각이다. 책은 총 13장으로 구성되어 있는데 연습문제는 해답도 제공되지 않는데다 무척 깊은 사고를 요하는 문제이다. 이 문제를 풀어보며 천천히 공부해볼 생각이다.
원래 첫 학습은 시간이 많이 걸린다. 이 과목에 흥미를 갖고 마음을 다질 필요가 있기 때문이다. 오늘 새벽에는 첫번째 장을 마치는 걸 목표로 삼겠지만 다 못해도 괜찮다. 여유롭게 학습에 임해볼 것이다.