본문 바로가기
생활 정보

데이터라벨링이란 (객체검출 예시)

by 유노이아8589 2023. 1. 7.

요즘에 직장인들 사이에서 N잡러가 유명한 건 다들 알고 계시죠? 본업 말고 부업을 다양하게 늘려나가면서 수익원을 창출하려는 분들이 많이 계십니다. 사실 이러한 사회현상이 달갑지만 않은 건 사실입니다. 본업만으러는 여유롭게 생활할 수 없기에 부업에 대한 고민을 끊임없이 하게 되는 현실이네요.

 

오늘은 온라인 부업으로 인기가 있다는 데이터라벨링에 대해서 여러분과 함께 알아보고자 합니다. 데이터라벨링이란 인공지능이 스스로 학습할 수 있도록 데이터를 수집, 가공해주는 일련의 작업을 말합니다. 스마트폰과 컴퓨터만 있으면 시간과 장소에 구애받지 않고 할 수 있다고 하네요. 오늘은 데이터 라벨링이 무엇이고 그 중 객체검출 업무에 대해 설명을 드리도록 하겠습니다.

 

 

썸네일

재택부업 디지털 라벨링 썸네일
재택부업 디지털 라벨링


데이터라벨링이란

인공지능이라는 말이 어느새 우리 일상으로 깊숙이 파고 들어왔습니다. 다양한 산업분야에서 빅데이터와 인공지능을 기반으로 미래 먹거리를 찾고 있죠. 인공지능에서 가장 중요한 것은 반복적으로 학습하며 고도화를 해야 하는데, 이를 위해서는 인공지능에게 새로운 것을 학습을 시켜야 합니다.

 

사람은 인지능력이 있어서 강아지라는 것을 알게 되면 다양한 종의 강아지를 보더라도 강아지라는 것을 분별할 수 있지만, 인공지능에게는 다양한 종의 강아지 사진을 보여주면서 이 모든 것들이 강아지라는 걸 계속 학습을 시켜줘야 합니다. 이러한 일련의 활동이 바로 데이터라벨링 업무로 인공지능이 스스로 학습할 수 있는 환경을 만들어주는 것입니다.


데이터라벨링 업무  종류

데이터라벨링은 크게 데이터 수집업무와 데이터 가공업무로 나뉘게 됩니다. 수집업무는 영상이나 음성, 이미지 같은 데이터를 수집하는 업무이고, 가공업무는 수집된 자료를 가공하는 업무로 음성은 받아쓰고, 영상이나 이미지는 특정 물체를 표시해주거나 설명해주는 업무 등이 있습니다. 

 

오늘은 수집업무 중 객체검출에 대해서 소개해드리고자 합니다. 객체 검출은 영상이나 이미지에서 특정 사물을 찾아 표시해주는 작업으로 바운딩박스, 폴리곤, 포인트, 키포인트 등의 업무가 있습니다. 얼마나 사물을 정교하게 식별하고 표시해주느냐에 따라 구분이 되는 것입니다. 말보다는 아래와 같이 실제 예시를 보시면 더욱 쉽게 이해하실 수 있습니다.

 


객체검출

1. 바운딩박스

바운딩 박스는 객체를 찾아 사각형으로 표시를 해주는 작업입니다. 아래 예시는 테이블 위에 있는 접시와 컵케이크, 포크에 대해서 바운딩박스 작업을 하는 것이죠. 이와 같이 바운딩박스 작업을 하게 되면 인공지능이 다양한 종류의 객체를 인식하고 식별할 수 있게 됩니다.

 

객체인식 중 바운딩박스는 가장 기초적이고 기본적인 방식으로, 마우스를 드래그하여 손쉽고 빠르게 객체를 표시할 수 있습니다. 하지만 직사각형으로 표시를 하기 때문에 객체를 외에 다른 불필요한 픽셀들이 다수 포함이 될 수 있기에 정확도는 다소 떨어지게 됩니다.

 

데이터라벨링 객체검출 - 바운딩박스 (출처: humansintheloop.org)

 


2. 폴리곤 (Polygon)

폴리곤은 객체를 다각형을 이용하여 표시하는 방식으로 바운딩박스보다 더욱 정교하게 객체를 식별할 수 있는 방식입니다. 아래와 같이 도넛을 탐지해야 할 때 직사각형으로 식벽하는 것보단 다각형을 이용하여 표시를 하게 된다면 불필요한 픽셀이 포함되지 않아 더욱 정교한 데이터를 뽑아낼 수 있습니다. 하지만 그만큼 시간과 노력이 많이 들어가게끔 되겠죠.

 

데이터라벨링 객체검출 - 다각형 Polygon (출처: humansintheloop.org)

 


3. 포인트 (Point)

포인트는 객체에 점을 찍어 표시하는 방식으로 객체의 수를 셀 때 유용한 방식입니다. 단순하게 점을 찍으면서 표시하는 방법이기 때문에 쉽고 빠르게 작업할 수 있는 방식입니다. 

 

데이터라벨링 객체검출 - 포인트 (출처: humansintheloop.org)

 


4. 키포인트 (Key point)

 

특정 객체의 모양을 알기 위해서 외곽선을 따줄 때 주로 사용하는 방식입니다. 순서가 매겨진 키포인트를 객체의 모양에 맞게 조정을 하여 객체를 식별하게끔 합니다. 아래는 나무 위에 올려져 있는 배의 외곽선을 키포인트 방식으로 구별해주는 예시입니다.

데이터라벨링 객체검출 - 키포인트 (출처: humansintheloop.org)

 


5. 폴리라인 (Polyline)

폴리라인 방식은  선을 그어 표시하는 방식으로 일직선으로 뻗어있는 도로에서 많이 사용되는 방식입니다. 폴리라인 방식으로 인식된 도로는 ADAS 기능에서 차선을 인식하여 자율주행을 보조하는 역할을 하게 됩니다. 항상 차선과 같이 직선인 객체에만 사용되는 것은 아니고 아래와 같이 곡선 형태로도 사용될 수 있습니다.

 

데이터라벨링 객체검출 - 폴리라인 Polyline (출처: humansintheloop.org)


6. 원 또는 타원

물체가 원형모양이거나 타원모양일 때는 다각형보다는 원과 타원으로 표시하는 것이 더 효율적으로 객체를 표현할 수 있습니다. 아래와 같이 원형이나 타원의 객체는 다각형으로 표시하는 것보다 보다 빠르게 작업이 가능합니다.

 

데이터라벨링 객체검출 - 원과 타원 (출처: humansintheloop.org)


오늘은 데이터라벨링 업무 중 객체검출 방식에 대해서 알아보았습니다. 본 포스팅을 통해 데이터라벨링과 객체검출이라는 개념에 친숙해지셨으면 좋겠습니다. 부업으로 데이터라벨링 객체검출을 한번 해보시는 건 어떠실까요?

 

댓글