본문 바로가기
패턴인식(Pattern Recognition)

패턴인식 1장 정리

by Candy Lee 2021. 1. 22.

본 포스팅은 패턴인식(오일석 저자)을 기반으로 작성되었으며

개인 공부 기록 남기기 목적임을 밝힙니다.

 

 

[1장 정리]

도입)

패턴 인식은 컴퓨터가 문제를 인식하고 이를 처리하는 분야를 다룬 것을 지칭한다.

 

 

패턴 인식의 과정)

패턴 => 특징 => 분류 => 부류(classes)

 

 

샘플이란?)

샘플=인식 시스템 구축을 위한 수집된 패턴 지칭

 

샘플의 종류에는 두 가지가 있다.

1. 훈련 집합(Training Dataset) : 어떠한 기능을 하는 모델 학습을 위한 기초가 된다.

2. 테스트 집합(Test Dataset) : 훈련 집합으로 훈련 완료시킨 모델의 성능을 측정할 때 사용된다.

 

=>즉, 이러한 데이터베이스(훈련집합+테스트집합)들은 다양한 패턴을 학습하기 위해 충분히 커야되고

    다양성을 갖추어야한다.

 

 

특징이란)

<Example>

특징의 개수=d(dimension)

화소를 특징으로 생각한다면 특징은 64개(64차원 벡터 , d=64)

차원이 64인 특징 벡터 x의 예시

즉, x를 특징 벡터라고 부른다.

 

그렇다면 서로 다른 부류를 잘 구별해 낼 수 있는 분별력을 높이기 위해서는

Q: 몇 개의 특징을 사용해야 하는가?

A: 적절한 양이 정답이다.

 

매우 모호한 정답이기도 하다. 

이유는 특징 벡터의 차원에 따라서 계산량 or 메모리 요구량이 폭발적으로 증가하는

차원의 저주 현상이 발생하기도 하기 때문이다.

 

그래서 적절한 특징만을 추출하기 위해서 주성분 분석(PCA)를 사용한다. 

해당 내용은 추후에 다룰 예정이다.

 

 

 

분류)

정의 : 어떤 패턴을 입력값으로 받았을 때, M개의 부류(classes)중 하나로 선정하는 작업

 

<분류의 단계>

1. 모델 선택 : 분류기를 표현하는 수학적 모델로 어떤 것을 쓸 것인지 결정하는 과정

Ex : 1차 직선, 2차 곡선 or 그 이상 차수의 곡선을 쓸 것인지?

 

분류기 설계(출처 : 구글 이미지 검색)

 

2. 분류기 학습

그림 1.7(a) : 분류기=>직선의 식 & 학습 과정=>기울기와 절편을 구하는 것

 

그림 1.7(a)의 직선:

결정직선이라고 한다(패턴인식에서는) 결정 직선은 특징 공간을 ω1(오메가 1)의 영역과 ω2(오메가2)의

영역으로 분할하는 역할을 한다.

 

#if 특징 공간이 다차원(2차,3차,4차...etc)인 경우#

=> 특징 공간을 두 개로 분할하는 평면을 결정 초평면(Decision Hyperplane)이라고 한다.

따라서 결정 초평면을 사용하는 분류기를 선형 분류기(Linear Classifier)라고 한다.

 

 

 

 

그림 1.7(b) & 1.7(c)는 현재 결정 곡선을 보여준다. 

이러한 경우 2차 이상의 다항식으로 이들은 표현되며

비선형 분류기(Non-linear Classifier)라고 부른다.

#Based on Python Syntax

if d==2:

   경계 : 결정 곡선

 

elif d==3:

   경계 : 결정 곡면

 

else: #4차원 이상인 경우

   경계 : 결정 초곡면

 

 

[성능 평가]

 

성능평가의 기준 :

테스트 집합(Test dataset)에 대해서 얼마나 높은 성능을 내는지 평가(일반화가 잘 되었는지 확인)

 

 

 

 

 

 

이상 패턴인식 1장 정리 포스팅을 마치도록 하겠습니다.

 

오늘도 감사합니다.

 

 

반응형

댓글