일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- SQL
- 데이터베이스
- 혼공머신
- 딥러닝
- CSS
- 컴퓨터구조
- html/css
- 자바스크립트
- 자바
- 순환신경망
- 자바스크립트심화
- 오블완
- 상속
- 중학수학
- JDBC
- 파이썬
- 데이터분석
- 연습문제
- 머신러닝
- 컴퓨터비전
- 개발일기
- 디버깅
- 정보처리기사실기
- JSP
- 자바 실습
- 중학1-1
- rnn
- 정보처리기사필기
- c언어
- JSP/Servlet
- Today
- Total
목록인공지능 (385)
클라이언트/ 서버/ 엔지니어 "게임 개발자"를 향한 매일의 공부일지
영역 분할은 물체가 점유한 영역을 구분하는 작업이다. 에지는 물체의 경계를 지정하기 때문에 에지가 완벽하다면 영역 분할이 따로 필요하지 않다. 하지만 프로그램 4-3의 실행 결과에서 볼 수 있듯이 명암 변화가 낮은 곳에서 뚫려 폐곡선을 형성하지 못하는 경우가 허다하다.뚫린 곳을 메우는 작업을 시도하면 메우지 말아야 할 곳을 메워 또 다른 부작용이 발생한다. 사람은 영역 분할을 할 때 뇌에 저장되어 있는 물체의 3차원 모델을 꺼내서 사용한다. 관심이 있는 물체에 집중하는 선택적 주의집중 작용을 통해 때로는 사람 영역을 분할하고 때로는 더 세밀하게 눈과 입을 분할하여 표정까지 인식한다. 이처럼 의미 있는 단위로 분할하는 방식을 의미 분할이라 한다. 1. 배경이 단순한 영상의 영역 분할책을 스캔하거나 컨..
오늘은 원래 일어나는 시간에 일어나 공부를 시작해 본다. 이제 직선 검출에 대해서 공부해 볼 것이다. 검출한 에지 맵에서 에지 화소는 1, 에지가 아닌 화소는 0으로 표시한다 사람 눈에는 에지가 연결된 선분으로 보이는데, 에지 맵에는 연결 관계가 암시적으로 나타나 있을 뿐 명시적으로 표현되어 있지 않다. 이들을 연결하여 경계선으로 변환하고 경계선을 직선으로 변환하면 이후 단계인 물체 표현이나 인식에 무척 유리하다. 1. 경계선 찾기8-연결 에지 화소를 서로 연결해 경계선을 구성할 수 있다. 다음 그림은 에지 맵에서 경계선 3개를 찾아 연속된 점의 리스트로 표현하는 사례를 보여준다. OpecCV는 findContours 함수로 이 일을 수행한다. 에지 맵에서 경계선 검출다음 프로그램은 에지 맵에서..
이번에는 캐니 에니와 직선 검출에 대해서 공부해보려고 한다. 9시가 넘어가니 눈이 감기고 졸음이 몰려와서 여기까지 학습하고 취침하게 될 것 같다. 낮잠을 아무리 많이 자도 밤에는 꼭 자야 한다는 걸 어제와 오늘 깨달았다. 잠을 거의 안 잤더니 몸이 많이 안좋아서 내내 힘들었다.난 하루라도 잠을 못 자면 몸과 마음이 굉장히 힘들다는 걸 확실히 알게 되었다. 난 직장생활을 하더라도 꼭 수면 시간을 지키며 야간 근무는 절대로 하지 말아야겠다고 생각했다. 캐니 에지1986년에 캐니는 지금도 가장 체계적인 에지 검출 이론이라고 인정받는 알고리즘을 제안한다. 최소 오류율과 위치 정확도, 한 두께라는 기준에 따라 목적 함수를 정의하고 에지 검출을 최적화 문제로 풀었다. 에지 검출에서는 가우시안에 1차 미분을 적용..
드디어 4장을 공부할 수 있는 시간이 왔다. 연습문제를 푸는데 많은 시간을 보내느라 오늘 4장 학습을 개념까지만 끝내는 것도 힘들 수 있겠다. 그래도 남은 시간 최선을 다해서 공부해 볼 것이다. 시작하기 전에에지 검출과 영역 분할은 컴퓨터 비전이 초창기부터 중요하게 다루어온 연구 주제다. 아래 그림은 캘리포니아 대학교의 버클리 팀에서 영역 분할 알고리즘을 개 발하고 평가하기 위해 2011년에 공개한 BSDS 데이터셋의 예제 영상이다. 그림 b는 사람이 정성을 들여 정교하게 분할한 영상이다. 컴퓨터 비전이 이 정도 수준으로 할 수 있을까? 에지는 물체의 경계에 있는 점이다. 에지를 완벽하게 검출해 물체의 경계를 폐곡선으로 따낼 수 있다면 분할 문제가 저절로 풀린다. 반대로 영역 분할 알고리즘이 완벽해 물..
이어서 남은 두 문제를 마저 풀고 저녁을 먹으려고 한다. 연습문제 풀기 네 번째 문제 9번프로그램 3-8은 보간 품질을 관찰할 위치를 미리 프로그램 안에 지정해 놓았다. 마우스를 이용해 관찰하고 싶은 곳을 직사각형으로 지정할 수 있게 확장하시오.◆ 힌트 : 프로그램 2-8을 이용한다. 보간을 이용해 영상의 기하 변환하는 예제 마우스 드래그로 직사각형 그리는 예제 이 두 개의 코드를 이용해서 문제를 풀어보면 될 것 같다. 문제 풀기여기서는 프로그램 3-8에 프로그램 2-8에서의 마우스 콜백 함수를 이용하여 사용자가 마우스를 드래그하여 원하는 영역을 직사각형으로 지정할 수 있게 확장해 보겠다. 사용자가 드래그한 영역을 patch 변수에 저장하여, 그 영역을 확대하여 표시할 수 있도록 수정할 것이..
이어서 연습문제를 풀어보겠다. 한 문제를 푸는데 최소 40분 이상 걸리는 매우 어려운 문제들이다. 그래도 이 책에 나온 모든 문제를 다 풀어본 후에 다음 학습으로 진행하기로 다짐했었다.문제를 풀며 개념과 이론을 더 확실하게 이해할 수 있었다. 연습문제 풀기 세 번째 문제 6번그림 3-18의 1차원과 2차원 가우시안 함수를 그리는 파이썬 프로그램을 작성하시오. 우선 가우시안에 대해서 이해해야 이 문제를 풀 수 있다. 공부할 때는 무슨 말인지 모르고 넘어갔던 이 내용을 다시 처음부터 학습해 보겠다. 가우시안 함수는 통계와 이미지 처리에서 중요한 함수로, 평균 주변에서 최대값을 갖고 멀어질수록 값이 0에 가까워지는 종 모양의 분포를 가지고 있다. 1차원 가우시안 함수1차원 가우시안 함수의 수식은 다..
점심식사 후에 놀고 싶어서 한참 쉬고 놀고 낮잠을 자다 4시 반에 일어나서 공부를 시작해 본다. 어제 오늘은 공부의 열정이 조금 떨어진 것 같다. 아마도 컴퓨터 비전 공부가 생각만큼 쉽지 않고 지루한 부분이 많아서 하기가 싫은 마음이 큰 것 같다. 그래도 한번 하기로 마음먹은 공부를 포기한 적은 없었으니 다음주 화요일까지는 학습을 진행할 것이다. 오늘 아무리 못해도 4장까지 다 공부하기로 했는데 진도가 많이 늦어졌다. 서둘러서 이제부터 쉬지 않고 공부를 하려고 한다. 지루하다고 영상을 틀어놓고 공부를 했더니 집중은 하나도 되지 않고 영상에만 푹 빠지거나 도리어 잠이 오게 된다. 이제 영상을 완전히 끄고 공부에만 집중할 것이다. 연습문제 풀기 두번째 문제 4번그림 3-16 b의 원래 영상 f에 다음 필..
이제 3장을 마무리하는 연습문제를 풀어보려고 한다. 이번 장도 10문제나 되어 3번에 나누어서 문제를 풀어볼 것이다. 3장부터는 정말 어려워서 절반도 이해하지 못했지만 문제를 풀면서 고민하며 감이 좀 잡힐 것 같다. 연습문제 풀기 문제 1번그림 3-5는 다양한 형태의 영상을 예시한다. 다음 영상이 차지하는 메모리 양을 바이트 단위로 제시하시오. (1)~(4)에서는 한 채널을 구성하는 화소 하나가 8비트(1바이트)로 표현된다고 가정한다.(1) 512 x 512 컬러 영상(2) 30초 분량의 256 x 256 컬러 동영상(30FPS를 가정)(3) 256 x 256 x 128 CT 영상(4) 512 x 512 크기의 8채널 다분광 영상(5) 20,000개 점으로 구성된 점 구름 영상(한 점은 x, y, ..
지금까지는 어떤 화소가 자기 자신 또는 이웃을 보고 값을 정하는 연산을 다루었는데 영상의 크기를 조절하거나 영상을 회전하려면 멀리 있는 화소에서 값을 가져올 수 있어야 한다. 기하 연산은 이런 경우를 다룬다. 기하 연산 1. 동차 좌표와 동차 행렬동차 좌표는 2차원 점의 위치 (x, y)에 1을 추가해 식 (3.10)처럼 3차원 벡터로 표현한다. 동차 좌표에서는 3개 요소에 같은 값을 곱하면 같은 좌표를 나타낸다. 표 3-1의 변환 행렬은 아무리 여러 개를 곱해소 직선은 직선으로 유지되고 평행인 선은 평행을 유지한다. 이런 성질은 동차 행렬의 3행이 (0 0 1)이기 때문이다. 이런 성질을 가진 변환을 그렇지 않은 변환과 구분하려고 어파인 변환이라 한다. 투영은 멀리 있는 물체가 작게 보이기 ..
조금 지루한 부분이 많지만 그래도 공부를 이어가 볼 것이다. 영역 연산은 이웃 화소를 같이 고려해 새로운 값을 결정한다. 영역 연산은 주로 컨볼루션을 통해 이루어진다. 컨볼루션컨볼루션은 입력 영상 f의 각 화소에 필터를 적용해 곱의 합을 구하는 연산이다. 아래 그림의 a는 1차원 영상을 1차원 필터 u로 컨볼루션 한 예다. 곱의 합은 해당하는 화소끼리 곱한 다음 결과를 더한다. 필터를 가장자리 화소에 씌우면 필터의 일부가 밖으로 나가기 때문에 적용할 수 없다. 컨볼루션은 연산 도중에 발생하는 값을 입력 영상 f 자체에 기록하는 제자리 연산으로 구현할 수 없다. 다양한 필터컨볼루션 자체는 특정한 목적이 없는 일반 연산이다. 필터가 정해지면 목적인 결정된다. 영상은 다양한 잡음이 있다. 밝은..