[컴퓨터비전] 6. 특징 기술
6.1 특징 기술자의 조건
- •
불변성 (Invariance)
- ◦
위치, 회전, 크기(스케일), 밝기 변화에 영향을 받지 않아야 함
- ◦
예) 면적은 회전에 불변, 크기 변화에는 공변(co-variant)
- •
분별력 (Discriminability)
- ◦
비슷한 객체는 가까운 값, 다른 객체는 멀리 떨어진 값을 갖도록
- •
재현성 (Repeatability)
- ◦
변환된 영상에서도 동일한 객체가 유사한 특징으로 표현되어야 함
6.2 관심점을 위한 기술자
SIFT, SURF 등과 같은 키포인트 기반 기술자
- •
특징점 주변의 명암 변화 방향(gradient orientation)을 추출해 벡터 기술자(descriptor) 생성
- •
SIFT
- ◦
4×4 서브영역 + 8방향 히스토그램 = 128차원
- ◦
회전·스케일·밝기 불변, 매우 강건
- ◦
속도 느림
- •
SURF
- ◦
적분 영상 이용, 계산 속도 ↑
- ◦
Hessian matrix로 특징점 검출
- •
BRIEF / ORB / BRISK
- ◦
이진 기술자 (binary descriptor), 해밍 거리 기반
- ◦
속도는 빠르지만 정확도는 상대적으로 낮음
6.3 영역 기술자
6.3.1 모멘트 기반 기술자
- •
영역의 면적, 중심, 분산 등을 수치로 표현
- •
일반 모멘트:
- •
중심 모멘트(이동 불변성 제공):
- •
정규화 모멘트:
- ◦
크기 불변 제공
- •
Hu 모멘트 (회전 불변): 7개의 불변 모멘트 값 계산 가능
6.3.2 모양 기반 기술자
- •
둘레, 중심, 주축, 둥근 정도 등 형태 자체를 기술
- ◦
둥근 정도:
- ◦
주축: 영역이 가장 길게 퍼진 방향
6.3.3 푸리에 기술자
- •
경계점을 1D 시계열로 표현 후 푸리에 변환
- •
저주파 성분 유지 → 압축 효과 + 회전 불변
- •
복잡한 경계의 표현 가능
6.4 텍스처
1. 전역 기술자
- •
영상 전체 또는 영역의 에지 정보를 기반으로 특징 벡터 구성
- ◦
에지 밀도, 방향 히스토그램
- ◦
에지 강도 히스토그램 등
2. 통계 기반 기술자
- •
명암 히스토그램의 통계량 추출
- ◦
부드러움(smooth), 치우침(skew), 균일도(uniformity), 엔트로피(entropy)
3. 동시 발생 행렬 (GLCM)
- •
픽셀 쌍의 명암값 조합 빈도 기반 행렬
- ◦
에너지, 대조도, 상관도 등 계산 가능
4. LBP (Local Binary Pattern)
- •
3×3 주변 픽셀의 명암을 기준 픽셀과 비교하여 이진 패턴 생성
- •
8비트 → 256차원 히스토그램
- •
회전 불변 확장 버전도 존재
6.5 주성분 분석 (PCA)
- •
고차원 데이터를 저차원으로 변환해 중요한 성분만 남기는 기법
- •
특징 벡터의 분산 최대 방향으로 투영
- •
공분산 행렬 → 고유값 분해 → 주요 성분 선택
수식 정리
- •
평균 벡터:
- •
공분산 행렬:
- •
고유벡터 u : 최대 분산 방향
6.6 얼굴인식: 고유 얼굴 (Eigenface)
고유 얼굴(Eigenface) 개념
- •
사람 얼굴 이미지를 PCA로 분석하여 주요 성분(고유 얼굴)만으로 표현
- •
고유 얼굴은 얼굴의 주된 형태를 압축하여 나타냄
알고리즘 요약
- 1
얼굴 이미지를 벡터화하여 평균 얼굴을 뺌
- 2
공분산 행렬 생성
- 3
고유벡터(고유 얼굴) 계산 → 주요 d개 선택
- 4
입력 영상도 같은 방식으로 투영해 특징 벡터 y 생성
- 5
기존 특징 벡터와 거리 계산 → 가장 가까운 것과 매칭
장점
- •
비교적 적은 차원으로 얼굴 표현 가능
- •
압축 및 인식 동시에 수행
한계
- •
조명, 포즈, 스케일 변화에 민감
- •
배경이나 얼굴 외부의 영향도 큼