본문 바로가기

잡학다식 "통"

재택부업 데이터 라벨링 경험 후기

반응형

데이터 라벨링이 뭘까요? 인공지능이 특정 데이터를 스스로 학습할 수 있도록 알맞게 수집 및 가공을 하는 작업을 말합니다. 이미지, 영상, 텍스트 등의 데이터에 사람이 가공 도구를 활용하여 다양한 정보를 목적에 맞게 입력하는 것을 의미합니다. 기법도 다양화, 고도화되어 가고 있습니다.

인공지증 로봇
음식 조리용 인공지능 로봇

 

데이터 라벨링 공정의 이해

획득 및 수집된 원시데이터를 정제 도구를 활용 원천 데이터가 만들어집니다. 그리고 이다음이 데이터 라벨링 작업 단계가 됩니다. 원천 데이터에 레이블, 태그 또는 주석을 추가하여, 머신러닝 알고리즘이 학습하고 정확한 예측을 할 수 있도록 하는 작업입니다.

 

작업 유형

Image : 추출하고자 하는 대상을 도구를 이용하여 표시하고 태깅하는 작업입니다. 기법에는 대표적인 바운딩, 태깅, 감정 분석, 키포인트, 얼굴 랜드마크, OCR, 폴리곤, 폴리 라인이 있습니다.

Video : 이미지와 영상 라벨링은 중복되는 부분이 많습니다. 왜냐하면 이미지 한 면에 나오는 대상물을 추출하게 되고 영상도 정지된 상태의 한 컷에 나오는 대상물을 작업을 하게 됩니다. 주로 이상행동 탐지, 동작분석, 감정 인식 등에 활용됩니다. 기법은 바운딩, 스켈레톤 추출, 특정 구간 추출, 시맨틱 세그먼테이션이 있습니다.

Text : 문자, 문장으로 구성되어 있는 데이터로 언어 모델이라고 부릅니다. 인터넷 자동 완성 기능, 연관 검색어 등이 있습니다. 문장 의미 비교, 감정 태깅, 키워드 찾기, 문장 요약 등이 주 작업 영역이 됩니다.

Voice : 주어진 음성 파일의 목소리를 듣고 대화의 주체를 구분 및 태깅하는 것과 음성 벋어 쓰기 형태로 진행됩니다. 주로 인공지능 음성인식 서비스, 자동번역, 영상 자막 등과 같은 다양한 영역에 활용됩니다.

3D : 자율 주행 자동차, 로봇 등에 쓰이는 기법으로 라벨링 대상을 육면체의 입체적인 박스를 만들어서 바운딩 작업을 합니다.

멀티 모달 : 영상, 음성, 텍스트 등이 복합적으로 이루어진 작업입니다.

 

정부 지원 무료 교육과 민간 자격증

직업훈련 포털 HRD-Net 홈페이지에 가셔서 회원가입하고 국민 내일 배움 카드 신청 및 발급을 받으시면 됩니다. 그리고 데이터 라벨링으로 검색해 보시고 무료로 수강신청할 수 있는 학원이나 교육업체들이 있으니 잘 선택해서 교육받으면 됩니다. 참고로 저는 크라우드웍스라는 곳에서 입문과 작업 마스터 과정까지 교육 이수했습니다. 한국인공지능 협회 주관하는 AIDE 1급, AIDE 2급 자격증 시험에 대한 유료 교육도 받을 수 있습니다.

 

주의사항과 재택부업 가능한 회사

특히 주의해야 될 사항은 사진이나 영상에서 추출 작업 시 사람 얼굴, 자동차 번호판 등 개인의 정보에 대한 것은 노출이 되면 안됩니다. 크라우드웍스, 에이아이웍스, 라벨온, 캐시미션, 에이모, 레이블러, 숨고, 크몽 등 다양한 회사가 있으며, 알바몬, 알바천국에서도 찾아보길 바랍니다. 어떤 사이트는 메일이나 메시지로 일에 대한 정보를 알려주기도 합니다.

 

데이터 라벨링 공정, 유형과 무료 교육을 받을 수 있는 방법을 알려드렸습니다.
앞으로 여러 유형의 모델을 접하다 보면 본인에게 알맞은 
기법이나 유형을 찾을 수 
있을 거라 생각합니다.
반응형