[컴퓨터비전] 6. 특징 기술

2025-04-18
#컴퓨터비전

6.1 특징 기술자의 조건

  • 불변성 (Invariance)

    • 위치, 회전, 크기(스케일), 밝기 변화에 영향을 받지 않아야 함

    • 예) 면적은 회전에 불변, 크기 변화에는 공변(co-variant)

  • 분별력 (Discriminability)

    • 비슷한 객체는 가까운 값, 다른 객체는 멀리 떨어진 값을 갖도록

  • 재현성 (Repeatability)

    • 변환된 영상에서도 동일한 객체가 유사한 특징으로 표현되어야 함


6.2 관심점을 위한 기술자

SIFT, SURF 등과 같은 키포인트 기반 기술자

  • 특징점 주변의 명암 변화 방향(gradient orientation)을 추출해 벡터 기술자(descriptor) 생성

  • SIFT

    • 4×4 서브영역 + 8방향 히스토그램 = 128차원

    • 회전·스케일·밝기 불변, 매우 강건

    • 속도 느림

  • SURF

    • 적분 영상 이용, 계산 속도 ↑

    • Hessian matrix로 특징점 검출

  • BRIEF / ORB / BRISK

    • 이진 기술자 (binary descriptor), 해밍 거리 기반

    • 속도는 빠르지만 정확도는 상대적으로 낮음


6.3 영역 기술자

6.3.1 모멘트 기반 기술자

  • 영역의 면적, 중심, 분산 등을 수치로 표현

  • 일반 모멘트:

  • 중심 모멘트(이동 불변성 제공):

  • 정규화 모멘트:

    • 크기 불변 제공

  • Hu 모멘트 (회전 불변): 7개의 불변 모멘트 값 계산 가능


6.3.2 모양 기반 기술자

  • 둘레, 중심, 주축, 둥근 정도 등 형태 자체를 기술

    • 둥근 정도:

    • 주축: 영역이 가장 길게 퍼진 방향

6.3.3 푸리에 기술자

  • 경계점을 1D 시계열로 표현 후 푸리에 변환

  • 저주파 성분 유지 → 압축 효과 + 회전 불변

  • 복잡한 경계의 표현 가능


6.4 텍스처

1. 전역 기술자

  • 영상 전체 또는 영역의 에지 정보를 기반으로 특징 벡터 구성

    • 에지 밀도, 방향 히스토그램

    • 에지 강도 히스토그램 등

2. 통계 기반 기술자

  • 명암 히스토그램의 통계량 추출

    • 부드러움(smooth), 치우침(skew), 균일도(uniformity), 엔트로피(entropy)

3. 동시 발생 행렬 (GLCM)

  • 픽셀 쌍의 명암값 조합 빈도 기반 행렬

    • 에너지, 대조도, 상관도 등 계산 가능

4. LBP (Local Binary Pattern)

  • 3×3 주변 픽셀의 명암을 기준 픽셀과 비교하여 이진 패턴 생성

  • 8비트 → 256차원 히스토그램

  • 회전 불변 확장 버전도 존재


6.5 주성분 분석 (PCA)

  • 고차원 데이터를 저차원으로 변환해 중요한 성분만 남기는 기법

  • 특징 벡터의 분산 최대 방향으로 투영

  • 공분산 행렬 → 고유값 분해 → 주요 성분 선택

수식 정리

  • 평균 벡터:

  • 공분산 행렬:

  • 고유벡터 u : 최대 분산 방향


6.6 얼굴인식: 고유 얼굴 (Eigenface)

고유 얼굴(Eigenface) 개념

  • 사람 얼굴 이미지를 PCA로 분석하여 주요 성분(고유 얼굴)만으로 표현

  • 고유 얼굴은 얼굴의 주된 형태를 압축하여 나타냄

알고리즘 요약

  1. 1

    얼굴 이미지를 벡터화하여 평균 얼굴을 뺌

  1. 2

    공분산 행렬 생성

  1. 3

    고유벡터(고유 얼굴) 계산 → 주요 d개 선택

  1. 4

    입력 영상도 같은 방식으로 투영해 특징 벡터 y 생성

  1. 5

    기존 특징 벡터와 거리 계산 → 가장 가까운 것과 매칭

장점

  • 비교적 적은 차원으로 얼굴 표현 가능

  • 압축 및 인식 동시에 수행

한계

  • 조명, 포즈, 스케일 변화에 민감

  • 배경이나 얼굴 외부의 영향도 큼