[컴퓨터비전] 5. 영상 분할
5.1 영상분할의 원리
- •
영상 분할: 입력 영상 f(x,y)를 서로 겹치지 않는 영역 R1,R2,…,Rn으로 나누는 것.
- •
수학적 조건:
- ◦
각 영역 Ri는 동일한 속성을 가짐
- •
좋은 분할 조건:
- ◦
같은 물체는 한 영역에, 다른 물체는 다른 영역에
5.2 전통적 방법
1. 임계화를 이용한 영역 분할
- •
영상의 히스토그램을 기준으로 임계값 설정 후 이진화
- •
단일 임계값: 오츄 알고리즘
- •
다중 임계값: 여러 밝기 구간을 나누어 여러 객체 분리 (이중 임계값 오츄 알고리즘)
- •
한계: 복잡한 배경/조명 변화에 취약
2. 군집화를 이용한 영역 분할
- •
RGB 컬러공간에 화소를 3D 좌표로 매핑 → 군집화로 분할
- •
대표적 알고리즘: k-means
- ◦
k개의 중심점으로 초기화 → 반복 갱신
- ◦
거리 기반 클러스터링이므로 공간 정보(지리적 근접성) 무시 → 결과 품질 한계
- ▪
화소의 컬러값의 유사성만 고려하기 때문
- ◦
초기에 뽑은 임의의 k개의 데이터가 결과에 영향을 미침
3. 분할합병 (Split & Merge)
- •
4분 트리(quadtree) 구조로 영상 분할
- •
규칙 에 따라 균일하지 않으면 분할, 균일하면 단말 노드로 유지
- •
이후 비슷한 영역끼리 다시 합병
- •
장점: 구조가 간단하고 이해 쉬움
단점: 자연 영상에는 성능 미흡
5.3 그래프 방법
정규화 절단을 이용한 영상 분할
- •
영상 → 그래프 로 모델링
- 각 화소 또는 슈퍼픽셀을 노드로
- 인접 화소 간의 밝기/색 차이를 유사도 기반 가중치로 표현, 방향 없는 그래프 구성
Wu의 방법
- •
유사도 기반 거리 정의:
거리 대신 유사도를 사용. 예를 들어 거리 가 사이 값을 가지고 값이 2이면 유사도는 처럼 계산
- •
그래프 분할 기준 함수:
두 집합 간의 에지 가중치 합을 최소화
- •
문제점:
작은 영역 간의 연결을 과도하게 끊게 됨 → 집합의 크기 차이가 클 경우 함수 값이 작아져 왜곡된 분할 발생
→ 실제로는 성능이 떨어질 수 있음
Shi의 방법
- •
기존 cut 함수의 한계 인식:
cut 함수는 분할 크기 균형을 고려하지 않음 → 작은 집합을 과도하게 선호
- •
Normalized Cut (ncut) 함수 정의:
전체 그래프와의 연결성 대비 두 집합 간의 연결 정도를 측정
- •
장점:
작은 집합도 공정하게 취급, 분할 크기에 관계없이 적절한 경계를 찾을 수 있음
고유벡터 기반 수치적 해법
- •
고유값 문제로 변환:
유사도 행렬 , 대각 행렬 를 사용하여 고유값 문제로 변환
이를 표준 고유값 문제로 변형
- •
해석적 의미:
두 번째로 작은 고유값에 해당하는 고유 벡터는 최적 분할 기준을 포함
알고리즘 : 정규화 절단을 이용한 영상 분할
- •
입력: 영상 , ,
- •
출력: 분할 결과 // 는 연결요소
- 1
전체 노드 집합 를 하나의 연결요소 라고 간주
- 2
의 유사도 행렬 를 계산한다
- 3
고유벡터 계산을 위한 행렬 를 구성하고, 고유벡터를 구한다
- 4
두 번째 작은 고유값에 해당하는 고유 벡터를 이용하여 를 로 분할
- 5
각각에 대해 추가 분할이 필요한지 판단하고, 그렇다면 2~5를 반복
유사도 정의
- •
유사도 함수: 화소 간의 유사도는 특징값과 위치값을 함께 고려해 정의
- •
의미:
화소의 특징값(f: 명암도, 컬러, 텍스처 등)이 유사하고, 물리적 위치도 가까울수록 유사도가 높음
→ 유사도가 클수록 그래프에서 강하게 연결됨
결과 예시
- •
아기 얼굴 영상에 정규화 절단 적용
→ 얼굴과 배경이 자연스럽게 분리됨
→ 명암뿐만 아니라 텍스처, 위치 정보까지 고려한 결과
5.4 민시프트
- •
모드 탐색 기반 비모수적 클러스터링
- •
커널 밀도 추정 → 확률 밀도 함수의 최대 지점(모드) 탐색
- •
핵심: 반복적으로 데이터 중심을 평균 방향으로 이동
- •
장점:
- ◦
군집 수 자동 결정 (사전 설정된 필요 없음)
- ◦
특정 분포 가정 없이 사용 가능 (비모수적 방식)
- ◦
잡음에 강하고, 클러스터의 형태 제약이 없음
- •
영상 분할 방식:
- ◦
RGB + 위치 정보 → 5차원 특성 공간 (R, G, B, x, y) 구성
- ◦
고밀도 영역으로 수렴하는 픽셀을 동일 군집으로 분할
- ◦
차원 수가 많아질 경우, 계산량 증가와 함께 차원의 저주 문제 발생
- ◦
커널 함수 폭 , 를 조절하여 위치 정보와 색상 정보의 중요도를 각각 조절 가능
- •
수렴 조건:
- ◦
일 때 수렴
- ◦
반복적으로 밀집된 방향으로 이동하여 모드에 수렴
- ◦
최종적으로 수렴된 위치들을 중심으로 군집화
- •
응용:
- ◦
영상 분할: 픽셀의 위치 + 색상을 기반으로 클러스터링
- ◦
에지 보존 스무딩: 동일 모드에 속하는 픽셀들로 색상 치환
- ◦
얼굴 인식, 객체 추적, 텍스트 탐지 등 다양한 영상 처리 문제에 활용 가능
5.5 워터셰드
- •
지형 지도를 모델로 한 분할 알고리즘
- •
각 픽셀을 고도(=에지 강도)로 생각 → 저지대(지역 최소점)부터 물 채우듯 확장
- •
유역(basin): 물이 모이는 영역 → 분할 단위
- •
워터셰드(watershed): 서로 다른 유역이 만나는 경계 → 객체 경계
- •
기본 알고리즘:
- 1
에지 강도 계산
- 2
지역 최소점 찾기 (시드)
- 3
BFS 기반으로 시드 확장, 번호 부여
- 4
번호 충돌 시 워터셰드 경계로 설정
- •
장점: 항상 폐곡선(닫힌 경계) 생성
단점: 잡음에 민감해 과분할 많음 → 후처리 필수
5.6 대화식 물체 분할
- •
사용자의 입력을 바탕으로 관심 있는 물체만 정확하게 분할하는 방식
- •
기존의 전체 영상 분할과 달리, 관심 대상의 명확한 분할에 초점을 맞춤
- •
물체/배경 분할에 활용됨
대표적 알고리즘
1. 스네이크 (Snake, 능동 외곽선)
- •
초기 곡선을 설정하고, 외곽선이 물체 경계에 수렴하도록 에너지를 최소화
- •
전체 에너지 구성:
- •
내부 에너지: 곡선의 매끄러움 유지
- •
영상 에너지: 엣지 강도 기반 경계 탐색
- •
제약 에너지: 외부 지식 기반 제약 조건 반영
- •
수식 기반의 연속적 곡선 표현 → 디지털 영상에선 근사적으로 계산 필요
2. 그래프 컷 (Graph Cut)
- •
영상을 그래프로 모델링하고 최소 컷(min-cut)을 통해 분할 수행
- •
각 화소를 노드로 표현하고, 이웃 화소 간 유사도(엣지 가중치)로 연결
- •
t-link: 물체/배경과의 연결 가중치
- •
n-link: 인접 화소 간의 유사도
- •
최적화 방식:
- ◦
에너지 최소화를 통해 가장 자연스러운 분할 수행
- ◦
사용자 지정된 seed (전경/배경) 기반 확률 모델 활용
- •
다양한 분할 문제에 일반적으로 사용됨
3. 지능 가위 (Intelligent Scissors)
- •
사용자가 마우스로 대략적인 경로를 지정하면 최단 경로 기반 실시간 경계 추적
- •
경계 강조된 에지 정보를 바탕으로 시각적 피드백 제공
- •
GIMP 등 오픈 소스 편집기에서 제공되는 기능
4. 레벨 셋 (Level Set)
- •
곡선을 명시적으로 표현하지 않고 암시적인 등고선 함수(ϕ)로 표현
- •
복잡한 형상의 경계 표현 가능 (예: 분리된 섬 형태, 다공성 구조)
- •
곡선의 위상 변화 자동 처리 (구멍, 분할, 병합 등)
- •
수학적 정밀도 높지만 계산 비용이 큼
5. GrabCut
- •
2004년 SIGGRAPH 논문에서 발표된 강력한 대화식 분할 방식
- •
초기 사각형 또는 루프를 입력 → GMM 기반의 그래프 컷 에너지 최적화
- •
반복적으로 GMM 업데이트와 최소 컷을 수행하여 경계를 정밀화
- •
OpenCV에서 함수로 제공되어 활용 쉬움
주요 응용
- •
이미지 편집: 배경 제거, 사진 합성
- •
의료 영상: 장기 분할, 병변 추출
- •
증강 현실(AR): 인물/사물 추출 및 실시간 합성
- •
객체 추적: 사용자의 초기 선택 후 자동 추적 기반 물체 인식
- •
텍스트 인식, 장면 해석 등 다양한 비전 문제에 활용
5.7 알고리즘 선택
- •
영상 성격, 응용 목적, 계산 자원에 따라 적절한 알고리즘 선택 필요
알고리즘 | 장점 | 단점 | 적합한 경우 |
임계화 | 빠름, 간단 | 조명 변화에 취약 | 단순 구조 영상 |
k-means | 다채널 가능 | 공간 정보 미반영 | 색 중심 군집화 |
그래프 방법 | 지역+전역 판단 가능 | 복잡한 구현 | 자연 영상 |
민시프트 | 자동 군집 수, 비모수 | 느림, 고차원에 취약 | 비정형 군집 |
워터셰드 | 폐곡선 생성 | 과분할 문제 | 형태 보존 필요 |
대화식 | 정확도 높음, 사용자 조정 가능 | 수작업 필요 | 편집/의료 |