Home 컴퓨터 비전의 기초와 pixel
Post
Cancel

컴퓨터 비전의 기초와 pixel

컴퓨터 비전의 기초

1) Computer Vision

컴퓨터 비전(Computer Vision) : 컴퓨터를 이용하여 Image 또는 Video 로부터 의미있는 정보를 추출하는 방법을 연구하는 학문.

쉽게 이야기하면, 사람이 눈으로 보고 인식하는 과정을 컴퓨터가 할 수있도록 해주는 것이다.

사람이 눈으로 사과가 반사된 빛을 받아들이고, 뇌에서 이것을 인식하여 ‘사과’라는 객체를 인식하는 과정을 컴퓨터에서 이루어지게 한다고 생각하면 된다. 사람의 눈은 ‘카메라’가 뇌는 ‘알고리즘’ 등으로 컴퓨터에서는 대체되어 이러한 과정을 진행한다.

컴퓨터 비전에서는 주로 밝기, 색상, 모양 등의 영상정보를 활용하고, 이러한 정보들을 여러 알고리즘들에 적용하여 사물을 인식한다.

컴퓨터 비전과 흔히 혼용되어 많이 사용되는 용어로 영상 처리(Image Processing)이 있다.

영상 처리는 말 그대로 영상을 입력받고, 입력받은 영상에 잡음 처리, 화질 개선, 마스킹 등의 여러 처리를 한 뒤에 영상을 출력하는 과정이다. 그렇기에 객체 등을 인식하는 컴퓨터 비전 과정의 전처리 과정으로 볼 수 있다.

2) Pixel

픽셀(Pixel) : 영상을 구성하는 최소 단위

픽셀이란, 영상을 구성하는 최소 단위이다.

Picture + Element 이며, ‘화소’ 라고도 부른다. 흔히, 카메라나 TV 광고에서 나오는 몇 화소~ 의 그 화소이다.

컴퓨터에서는 영상을 이 픽셀의 배열로 표현한다. 예를 들어 가로 w, 세로 h 크기의 영상은 아래와 같이 표현된다.

slide1

이렇게, 이미지를 나타내면 특정 픽셀을 2차원 상의 특정 좌표로 표현할 수 있다.

즉, 픽셀 좌표를 (x,y)로 나타낼 수 있다는 뜻이다.

( x의 정의역은 0 ~ (w-1) , y의 정의역은 0 ~ (h-1) ) 이미지는 픽셀의 배열이고, 이 픽셀은 (x,y)의 좌표로 나타낼 수 있기 때문에 영상을 수식으로 표현할 때는 보통 함수의 형태를 사용한다.

(입력) x좌표, y좌표 -> (출력) 픽셀값

즉, 우리가 영상을 f라고 표기하면, 특정 픽셀값을 f(x,y)로 표현한다는 의미이다.

3) 행렬 표현

이러한 픽셀의 2차원 배열은 xy좌표계 외에도 표현할 수 있는 방법이 1가지 더 있는데, 바로 행렬이다.

컴퓨터 비전에서는 영상을 2차원 배열뿐 아니라 행렬로도 많이 표현하는데, 이러한 행렬로 표현할 경우 영상을 처리하는 알고리즘을 행렬 이론을 적용하여 구현하는 등 수학적으로 표현하고 계산하기 편리하기 때문이다.

slide2

위의 행렬식과 같이 가로 : N , 세로 : M의 영상을 형렬로 표현할 수 있다. aj,i 는 j 번째 행, i 번째 열에 위치한 원소를 의미한다.

행렬 A가 영상을 나타내는 경우라면 aj,i는 (i,j)좌표에 위치한 픽셀을 의미한다.

행렬과 좌표의 표현에서 x,y 혹은 행,열 의 순서는 서로 반대이다.

즉, 행은 y좌표를 열은 x좌표를 의미한다.

참조:https://jinrona.tistory.com/3

This post is licensed under CC BY 4.0 by the author.