[컴퓨터비전] 4. 지역 특징 검출
4.1 지역 특징 검출의 기초
지역 특징의 필요성
- •
대응점 찾기 문제 해결을 위한 핵심: 영상 간 매칭을 위한 ‘고유하고 반복 가능한’ 포인트 필요
- •
에지는 경계 정보는 제공하지만 반복성/구별성이 부족함
- •
지역 특징은 작고 국소적이며, 다른 영역과 구별 가능해야 하며, 다양한 환경(조명, 뷰포인트 등)에서도 강건성을 가져야 함
좋은 지역 특징 조건
- •
구별성(Discriminability): 다른 특징과 뚜렷하게 구별
- •
재현성(Repeatability): 다른 영상에서도 동일한 위치에서 검출
- •
정확한 위치성(Localization)
- •
불변성(Invariance): 회전, 이동, 스케일 변화에 강함
- •
풍부한 정보량(Information richness)
4.2 이동과 회전에 불변한 특징점 검출
1. 모라벡 알고리즘 (Moravec, 1977)
- •
기본 개념: 여러 방향으로 밝기 변화가 큰 지점을 코너로 간주
- •
방법:
- ◦
특정 윈도우 내에서 픽셀을 동서남북 방향으로 한 픽셀씩 이동하며, SSD(Sum of Squared Difference)를 계산
- ◦
그 중 최솟값을 해당 위치의 '특징 가능성'으로 사용
- •
문제점: 동서남북 4방향만 고려 → 회전 불변성 없음, 잡음에 민감
2. 해리스 코너 (Harris Corner, 1988)
- •
모라벡을 개선한 대표적인 코너 검출기
- •
가우시안 가중치를 적용하여 WSSD (Weighted SSD) 사용
- •
미분을 활용한 해석적 접근:
- ◦
테일러 전개로 미분 근사
- ◦
2차 모멘트 행렬 A 정의:
- •
특징 점수 계산:
- •
특징점은 C가 큰 지점 → 여러 방향으로 밝기 변화가 큰 점
3. 슈산
- •
미분 기반 방식과 달리, 밝기 유사성을 이용해 특징점을 찾는 대표적인 코너 검출기
- •
영상의 중심 픽셀과 주변 픽셀들 간의 밝기 유사성을 비교하여 USAN 영역을 정의
💡 특징 검출 방식
- •
중심 픽셀과 주변 픽셀들 간의 밝기 유사성 측정
- •
USAN 영역 (유사 밝기 영역) 계산:
- •
USAN 크기가 클수록 주변과 유사한 픽셀이 많음 → 평탄한 영역
🔍 특징 점수 계산
- •
: 마스크 내 전체 픽셀 수 (예: 37)
- •
t2t_2t2: 임계값 (보통 또는 )
- •
C가 클수록 특징 강도가 높음
🎯 특징점 판단 기준
- •
에지: USAN 영역이 마스크의 50% 이하
- •
코너: USAN 영역이 50%보다 더 작은 경우
- •
즉, 중심점과 밝기가 유사하지 않은 점들이 많으면 코너 가능성 ↑
4.3 비최대 억제
- •
특징 가능성 맵에서 지역 최대값(local maximum)만을 최종 특징점으로 선택
- •
즉, 해당 픽셀이 이웃 픽셀들보다 크면 → 특징점으로 판단
- •
이웃 기준: 4-연결 또는 8-연결 방식 사용
- •
비최대면 억제되어 후보에서 제외됨 → 이 과정을 비최대 억제이라 부름
주의할 점
- •
특징 가능성 값이 퍼진 경우, 중심이 모호할 수 있음
→ 가장 강한 지점 하나만 선택해야 함 (localization 필요)
- •
단순 최대값이 아닌 주변 대비 얼마나 두드러지는가를 기준으로 삼기도 함
→ Adaptive NMS 기법: 일정 비율 이상 커야 진짜 특징점으로 간주
알고리즘 요약 (의사코드)
1. 특징 가능성 맵 생성 (예: 해리스 응답 맵 C(x, y))
2. 모든 픽셀에 대해:
- 이웃보다 값이 크고
- 임계값보다 크면
→ 특징점으로 판단
회전/이동/스케일에 대한 민감도
- •
회전에 대해서는 일부 연산자는 불변성 있음
예: 동일 위치에서 특징이 검출됨
- •
스케일 변화에는 민감함
→ 고정된 크기의 연산자는 특정 스케일에서만 제대로 동작
→ 스케일 불변성 확보 필요
4.4 스케일에 불변한 특징점 검출
왜 스케일에 불변해야 하는가?
- •
물체의 크기는 거리나 시점에 따라 달라짐
- •
스케일이 다르면 동일한 물체도 영상 내에서 크기/해상도가 달라짐
- •
기존 고정된 연산자(필터)로는 스케일이 바뀐 물체를 안정적으로 검출하기 어려움
- •
이를 해결하기 위해 스케일 공간(Scale Space) 개념이 등장
스케일 공간
- •
영상에 다양한 크기의 가우시안 필터를 적용하여 여러 스케일의 영상을 생성
- •
각 스케일에서 특징점 검출 수행
- •
특징점이 여러 스케일에서 반복적으로 등장하면 진짜 특징일 가능성 ↑
수식 정의
- •
스케일 공간에서 영상 :
- •
여기서 GGG: 가우시안, : 스케일(표준편차), ∗: 컨볼루션
- •
여러 값을 통해 연속적 스케일을 다룸
3차원 극점 탐색 (x, y, σ 공간)
- •
각 스케일에서 정규 라플라시안 적용:
- •
또는 정규화된 라플라시안:
- •
(x, y, σ) 공간에서 극값 탐색 → 특징점 위치 + 스케일 정보 동시 확보
다중 스케일 영상 생성 방법
- 1
가우시안 스무딩 방식
- •
동일한 영상을 가우시안 필터로 다르게 흐리게 처리
- •
각 스케일의 이미지는 연속적으로 정의된 에 해당함
- 2
피라미드 방식 (Pyramid)
- •
해상도를 반복적으로 줄이면서 영상 크기 축소
- •
속도 빠르나 스케일 간 간격이 거침
- •
보통 DOG(Difference of Gaussian)과 함께 사용됨
해리스-라플라스 특징 검출
- •
영상 공간(x, y)에선 해리스 응답 함수 사용
- •
스케일 축(σ)에선 정규 라플라시안 사용
→ 영상 공간과 스케일 공간에서 서로 다른 연산자 사용
구분 이유
- •
해리스 응답은 스케일 축에서 극값을 잘 만들지 못함
→ 대신 스케일 축에서는 정규 라플라시안 사용
스케일 공간 해리스 응답 정의
- •
해리스 응답을 스케일 공간에 적용하려면, 스케일 공간의 2차 모멘트 행렬 정의:
- •
여기서 , 보통
해리스 응답 점수 계산
- •
이 점수는 기존 해리스 방식과 동일하게 작동
알고리즘 개요
- 1
여러 스케일로 가우시안 블러 처리
- 2
각 스케일에서 해리스 응답 계산
- 3
(x, y)에서 극값, (σ)에서 정규 라플라시안 극값 검출
- 4
극값 위치에서 최종 특징점 판단
SIFT 검출
- •
David Lowe가 제안한 지역 불변 특징 검출 알고리즘 (2004)
- •
스케일, 회전, 조명 변화에 강인
- •
반복성, 정확도, 효율성 모두 우수하여 현재까지도 널리 사용
스케일 공간 구성
- •
옥타브(Octave): 원본 영상에서 가우시안 블러 후 다운샘플링하여 구성
- •
한 옥타브는 여러 장의 이미지로 구성됨 (예: 4~5장의 블러된 이미지)
DOG (Difference of Gaussian)
- •
정규 라플라시안 대신 DOG 사용
→ 계산 효율성 높고 근사 정도 우수
- •
각 옥타브의 DOG들 사이에서 (x, y, σ) 극값 탐색 → 특징점 후보 검출
지역 극점 판단 방식
- •
DOG에서의 (x, y, σ) 위치가 주변 26개의 이웃보다 최대 or 최소일 때
→ 특징점으로 판단 (keypoint)
미세 조정 (Sub-pixel Localization)
- •
테일러 전개 기반 미분으로 극값 위치 정밀화
- •
(x, y, σ) → 실수 단위 보정하여 정확한 위치 + 스케일 계산
- •
여기서 : 옥타브 번호, : DOG 인덱스
SURF 검출
- •
SIFT보다 속도 개선을 목표로 한 알고리즘
- •
SURF (Speeded-Up Robust Features)는 가우시안 스무딩 없이 빠르게 특징 검출 가능
- •
예: 800×640 영상 기준
- ◦
SURF: 70ms
- ◦
SIFT: 400ms
- ◦
해리스-라플라스: 2100ms
핵심 아이디어
- •
가우시안 미분 연산자 대신 정수 필터 사용
- •
적분 영상 (Integral Image) 기반으로 계산 효율 대폭 향상
- •
반복 없이 빠른 연산을 통해 해시안 행렬 구성 및 응답 계산 가능
해시안 행렬 계산
SURF는 해시안 기반 특징 검출 방식으로, 행렬 요소는 다음과 같이 구성됨:
- •
이때 는 2차 미분 필터를 정수 형태로 근사하여 빠르게 계산
근사 필터 예시
- •
정수 필터 는 1×3, 3×5, 9×2 블록을 결합하여 구성
- •
필터 중심은 음수 가중치로, 좌우/상하 대비를 수행
- •
계산 결과는 기존 2차 미분과 유사한 효과를 냄
적분 영상 (Integral Image)
- •
블록 영역의 누적 합을 한 번의 계산으로 얻을 수 있는 영상 구조
- •
가우시안 대신 Haar-like 필터를 누적합 방식으로 빠르게 적용
- •
특정 영역의 합은 4개 점 연산으로 처리 가능 → 속도 매우 빠름
스케일 공간 처리 방식
- •
SIFT: 여러 크기의 이미지 생성 (옥타브) + DOG
- •
SURF: 원본 영상 그대로 사용, 대신 필터 크기만 확장하여 스케일 표현
예:
- ◦
9×9 → 15×15 → 21×21 → 27×27 필터로 확장
- ◦
원본 영상 하나에 대해 여러 스케일을 표현
- •
스케일 증가 시, 정수 근사된 필터를 확장하여 적용
특징점 검출 방식
- •
해시안 행렬의 응답값을 기반으로 극값 검출
- •
스케일 공간에서 (x, y, σ) 극점을 찾음
(예: 3×3×3 영역의 최대값 탐색)
- •
응답값이 가장 큰 지점을 특징점으로 선택
지역 특징 검출 알고리즘 특성 비교
대표 알고리즘
- •
해리스-라플라스: 정확하지만 느림
- •
SIFT: 정확도, 반복성, 변환 불변성 모두 우수
- •
SURF: 속도 빠르며 실시간 적용 가능
기타 알고리즘
- •
최근 등장한 알고리즘들: FAST, ORB, BRISK 등
- •
다양한 실험 환경(조명, 물체 위치, 기하 변화 등)에서 비교됨
성능 비교 기준
기준 | 설명 |
반복성 | 동일 특징이 다양한 영상에서도 일관되게 검출되는 정도 |
정확도 | 검출된 위치가 실제 특징점과 얼마나 근접한가 |
계산 효율 | 연산 속도와 메모리 사용량 등 자원 효율성 |
불변성 | 회전, 스케일, 조명 변화에 대해 강인한가 |
선택 가이드
- •
사용 목적, 환경, 처리 시간 제약 등을 고려하여 적절한 알고리즘 선택
- •
실제 데이터를 통한 실험 기반 선택이 가장 바람직