일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 디버깅
- 자바스크립트
- 자바 실습
- 정보처리기사필기
- 혼공머신
- 오블완
- JDBC
- 데이터베이스
- 자바
- JSP/Servlet
- 정보처리기사실기
- JSP
- 컴퓨터비전
- c언어
- 상속
- rnn
- 데이터분석
- 연습문제
- 순환신경망
- 파이썬
- 머신러닝
- SQL
- 자바스크립트심화
- CSS
- 중학수학
- 컴퓨터구조
- html/css
- 딥러닝
- 개발일기
- 중학1-1
- Today
- Total
목록인공지능 (393)
클라이언트/ 서버/ 엔지니어 "게임 개발자"를 향한 매일의 공부일지
이번에는 캐니 에니와 직선 검출에 대해서 공부해보려고 한다. 9시가 넘어가니 눈이 감기고 졸음이 몰려와서 여기까지 학습하고 취침하게 될 것 같다. 낮잠을 아무리 많이 자도 밤에는 꼭 자야 한다는 걸 어제와 오늘 깨달았다. 잠을 거의 안 잤더니 몸이 많이 안좋아서 내내 힘들었다.난 하루라도 잠을 못 자면 몸과 마음이 굉장히 힘들다는 걸 확실히 알게 되었다. 난 직장생활을 하더라도 꼭 수면 시간을 지키며 야간 근무는 절대로 하지 말아야겠다고 생각했다. 캐니 에지1986년에 캐니는 지금도 가장 체계적인 에지 검출 이론이라고 인정받는 알고리즘을 제안한다. 최소 오류율과 위치 정확도, 한 두께라는 기준에 따라 목적 함수를 정의하고 에지 검출을 최적화 문제로 풀었다. 에지 검출에서는 가우시안에 1차 미분을 적용..
드디어 4장을 공부할 수 있는 시간이 왔다. 연습문제를 푸는데 많은 시간을 보내느라 오늘 4장 학습을 개념까지만 끝내는 것도 힘들 수 있겠다. 그래도 남은 시간 최선을 다해서 공부해 볼 것이다. 시작하기 전에에지 검출과 영역 분할은 컴퓨터 비전이 초창기부터 중요하게 다루어온 연구 주제다. 아래 그림은 캘리포니아 대학교의 버클리 팀에서 영역 분할 알고리즘을 개 발하고 평가하기 위해 2011년에 공개한 BSDS 데이터셋의 예제 영상이다. 그림 b는 사람이 정성을 들여 정교하게 분할한 영상이다. 컴퓨터 비전이 이 정도 수준으로 할 수 있을까? 에지는 물체의 경계에 있는 점이다. 에지를 완벽하게 검출해 물체의 경계를 폐곡선으로 따낼 수 있다면 분할 문제가 저절로 풀린다. 반대로 영역 분할 알고리즘이 완벽해 물..
이어서 남은 두 문제를 마저 풀고 저녁을 먹으려고 한다. 연습문제 풀기 네 번째 문제 9번프로그램 3-8은 보간 품질을 관찰할 위치를 미리 프로그램 안에 지정해 놓았다. 마우스를 이용해 관찰하고 싶은 곳을 직사각형으로 지정할 수 있게 확장하시오.◆ 힌트 : 프로그램 2-8을 이용한다. 보간을 이용해 영상의 기하 변환하는 예제 마우스 드래그로 직사각형 그리는 예제 이 두 개의 코드를 이용해서 문제를 풀어보면 될 것 같다. 문제 풀기여기서는 프로그램 3-8에 프로그램 2-8에서의 마우스 콜백 함수를 이용하여 사용자가 마우스를 드래그하여 원하는 영역을 직사각형으로 지정할 수 있게 확장해 보겠다. 사용자가 드래그한 영역을 patch 변수에 저장하여, 그 영역을 확대하여 표시할 수 있도록 수정할 것이..
이어서 연습문제를 풀어보겠다. 한 문제를 푸는데 최소 40분 이상 걸리는 매우 어려운 문제들이다. 그래도 이 책에 나온 모든 문제를 다 풀어본 후에 다음 학습으로 진행하기로 다짐했었다.문제를 풀며 개념과 이론을 더 확실하게 이해할 수 있었다. 연습문제 풀기 세 번째 문제 6번그림 3-18의 1차원과 2차원 가우시안 함수를 그리는 파이썬 프로그램을 작성하시오. 우선 가우시안에 대해서 이해해야 이 문제를 풀 수 있다. 공부할 때는 무슨 말인지 모르고 넘어갔던 이 내용을 다시 처음부터 학습해 보겠다. 가우시안 함수는 통계와 이미지 처리에서 중요한 함수로, 평균 주변에서 최대값을 갖고 멀어질수록 값이 0에 가까워지는 종 모양의 분포를 가지고 있다. 1차원 가우시안 함수1차원 가우시안 함수의 수식은 다..
점심식사 후에 놀고 싶어서 한참 쉬고 놀고 낮잠을 자다 4시 반에 일어나서 공부를 시작해 본다. 어제 오늘은 공부의 열정이 조금 떨어진 것 같다. 아마도 컴퓨터 비전 공부가 생각만큼 쉽지 않고 지루한 부분이 많아서 하기가 싫은 마음이 큰 것 같다. 그래도 한번 하기로 마음먹은 공부를 포기한 적은 없었으니 다음주 화요일까지는 학습을 진행할 것이다. 오늘 아무리 못해도 4장까지 다 공부하기로 했는데 진도가 많이 늦어졌다. 서둘러서 이제부터 쉬지 않고 공부를 하려고 한다. 지루하다고 영상을 틀어놓고 공부를 했더니 집중은 하나도 되지 않고 영상에만 푹 빠지거나 도리어 잠이 오게 된다. 이제 영상을 완전히 끄고 공부에만 집중할 것이다. 연습문제 풀기 두번째 문제 4번그림 3-16 b의 원래 영상 f에 다음 필..
이제 3장을 마무리하는 연습문제를 풀어보려고 한다. 이번 장도 10문제나 되어 3번에 나누어서 문제를 풀어볼 것이다. 3장부터는 정말 어려워서 절반도 이해하지 못했지만 문제를 풀면서 고민하며 감이 좀 잡힐 것 같다. 연습문제 풀기 문제 1번그림 3-5는 다양한 형태의 영상을 예시한다. 다음 영상이 차지하는 메모리 양을 바이트 단위로 제시하시오. (1)~(4)에서는 한 채널을 구성하는 화소 하나가 8비트(1바이트)로 표현된다고 가정한다.(1) 512 x 512 컬러 영상(2) 30초 분량의 256 x 256 컬러 동영상(30FPS를 가정)(3) 256 x 256 x 128 CT 영상(4) 512 x 512 크기의 8채널 다분광 영상(5) 20,000개 점으로 구성된 점 구름 영상(한 점은 x, y, ..
지금까지는 어떤 화소가 자기 자신 또는 이웃을 보고 값을 정하는 연산을 다루었는데 영상의 크기를 조절하거나 영상을 회전하려면 멀리 있는 화소에서 값을 가져올 수 있어야 한다. 기하 연산은 이런 경우를 다룬다. 기하 연산 1. 동차 좌표와 동차 행렬동차 좌표는 2차원 점의 위치 (x, y)에 1을 추가해 식 (3.10)처럼 3차원 벡터로 표현한다. 동차 좌표에서는 3개 요소에 같은 값을 곱하면 같은 좌표를 나타낸다. 표 3-1의 변환 행렬은 아무리 여러 개를 곱해소 직선은 직선으로 유지되고 평행인 선은 평행을 유지한다. 이런 성질은 동차 행렬의 3행이 (0 0 1)이기 때문이다. 이런 성질을 가진 변환을 그렇지 않은 변환과 구분하려고 어파인 변환이라 한다. 투영은 멀리 있는 물체가 작게 보이기 ..
조금 지루한 부분이 많지만 그래도 공부를 이어가 볼 것이다. 영역 연산은 이웃 화소를 같이 고려해 새로운 값을 결정한다. 영역 연산은 주로 컨볼루션을 통해 이루어진다. 컨볼루션컨볼루션은 입력 영상 f의 각 화소에 필터를 적용해 곱의 합을 구하는 연산이다. 아래 그림의 a는 1차원 영상을 1차원 필터 u로 컨볼루션 한 예다. 곱의 합은 해당하는 화소끼리 곱한 다음 결과를 더한다. 필터를 가장자리 화소에 씌우면 필터의 일부가 밖으로 나가기 때문에 적용할 수 없다. 컨볼루션은 연산 도중에 발생하는 값을 입력 영상 f 자체에 기록하는 제자리 연산으로 구현할 수 없다. 다양한 필터컨볼루션 자체는 특정한 목적이 없는 일반 연산이다. 필터가 정해지면 목적인 결정된다. 영상은 다양한 잡음이 있다. 밝은..
화소 입장에서 바라본 영상 처리 연산이란 화소가 새로운 값을 받는 과정이다. 새로운 값을 어디에서 받느냐에 따라 점 연산, 영역 연산, 기하 연산의 세 종류로 구분할 수 있다. 다음 그림은 세 종류의 연산을 설명한다. 점연산에서는 자기 자신으로부터 값을 받는다. 영역 연산에서는 이웃 화소의 값을 보고 새로운 값을 결정한다. 기하 연산에서는 기하학적 변환에 따라 다른 곳으로부터 값을 받는다.앞에서 공부한 오츄 이진화는 점 연산에 속하고, 모노폴리는 영역 연산에 속한다. 명암 조절식 (3.4)를 이용해 영상을 밝거나 어둡게 조정할 수 있다. 맨 위 식은 원래 영상에 양수 a를 더해 밝게 만드는데 화소가 가질 수 있는 최대값 L-1을 넘지 않게 min을 취한다. 가운데 식은 원래 영상에 양수 a를 빼..
이진 영상에 대해서 학습해 보려고 한다. 어제 낮잠을 정말 많이 자서 오늘은 철야를 하며 공부를 하기로 했다. 때로는 컬러 영상이나 명암 영상을 이진 영상으로 변환할 필요가 있다. 이진 영상은 화소가 0 또는 1인 영상이다. 따라서 화소당 1 비트면 정장할 수 있는데, 현재 컴퓨트를 메모리 용량이 크기 때문에 화소당 1바이트를 사용하여 메모리 효율보다 프로그래밍 편려성을 우선하는 경우가 많다. 컴퓨터비전에서는 에지를 검출한 후 에지만 1로 표현하거나 물체를 검출한 후 물체는 1, 배경을 0으로 표시하는 등의 일에 이진 영상을 활용한다. 이진화명암 영상을 이진화하려면 임계값 T보다 큰 화소는 1, 그렇지 않은 화소는 0으로 바뀌게 된다. 너무 낮게 또는 높게 설정하면 대부분 화소가 물체 또는 배경에 ..