데이터 라벨링이 뭘까요? 인공지능이 특정 데이터를 스스로 학습할 수 있도록 알맞게 수집 및 가공을 하는 작업을 말합니다. 이미지, 영상, 텍스트 등의 데이터에 사람이 가공 도구를 활용하여 다양한 정보를 목적에 맞게 입력하는 것을 의미합니다. 기법도 다양화, 고도화되어 가고 있습니다.
데이터 라벨링 공정의 이해
획득 및 수집된 원시데이터를 정제 도구를 활용 원천 데이터가 만들어집니다. 그리고 이다음이 데이터 라벨링 작업 단계가 됩니다. 원천 데이터에 레이블, 태그 또는 주석을 추가하여, 머신러닝 알고리즘이 학습하고 정확한 예측을 할 수 있도록 하는 작업입니다.
작업 유형
Image : 추출하고자 하는 대상을 도구를 이용하여 표시하고 태깅하는 작업입니다. 기법에는 대표적인 바운딩, 태깅, 감정 분석, 키포인트, 얼굴 랜드마크, OCR, 폴리곤, 폴리 라인이 있습니다.
Video : 이미지와 영상 라벨링은 중복되는 부분이 많습니다. 왜냐하면 이미지 한 면에 나오는 대상물을 추출하게 되고 영상도 정지된 상태의 한 컷에 나오는 대상물을 작업을 하게 됩니다. 주로 이상행동 탐지, 동작분석, 감정 인식 등에 활용됩니다. 기법은 바운딩, 스켈레톤 추출, 특정 구간 추출, 시맨틱 세그먼테이션이 있습니다.
Text : 문자, 문장으로 구성되어 있는 데이터로 언어 모델이라고 부릅니다. 인터넷 자동 완성 기능, 연관 검색어 등이 있습니다. 문장 의미 비교, 감정 태깅, 키워드 찾기, 문장 요약 등이 주 작업 영역이 됩니다.
Voice : 주어진 음성 파일의 목소리를 듣고 대화의 주체를 구분 및 태깅하는 것과 음성 벋어 쓰기 형태로 진행됩니다. 주로 인공지능 음성인식 서비스, 자동번역, 영상 자막 등과 같은 다양한 영역에 활용됩니다.
3D : 자율 주행 자동차, 로봇 등에 쓰이는 기법으로 라벨링 대상을 육면체의 입체적인 박스를 만들어서 바운딩 작업을 합니다.
멀티 모달 : 영상, 음성, 텍스트 등이 복합적으로 이루어진 작업입니다.
정부 지원 무료 교육과 민간 자격증
직업훈련 포털 HRD-Net 홈페이지에 가셔서 회원가입하고 국민 내일 배움 카드 신청 및 발급을 받으시면 됩니다. 그리고 데이터 라벨링으로 검색해 보시고 무료로 수강신청할 수 있는 학원이나 교육업체들이 있으니 잘 선택해서 교육받으면 됩니다. 참고로 저는 크라우드웍스라는 곳에서 입문과 작업 마스터 과정까지 교육 이수했습니다. 한국인공지능 협회 주관하는 AIDE 1급, AIDE 2급 자격증 시험에 대한 유료 교육도 받을 수 있습니다.
주의사항과 재택부업 가능한 회사
특히 주의해야 될 사항은 사진이나 영상에서 추출 작업 시 사람 얼굴, 자동차 번호판 등 개인의 정보에 대한 것은 노출이 되면 안됩니다. 크라우드웍스, 에이아이웍스, 라벨온, 캐시미션, 에이모, 레이블러, 숨고, 크몽 등 다양한 회사가 있으며, 알바몬, 알바천국에서도 찾아보길 바랍니다. 어떤 사이트는 메일이나 메시지로 일에 대한 정보를 알려주기도 합니다.
데이터 라벨링 공정, 유형과 무료 교육을 받을 수 있는 방법을 알려드렸습니다.
앞으로 여러 유형의 모델을 접하다 보면 본인에게 알맞은
기법이나 유형을 찾을 수 있을 거라 생각합니다.
'잡학다식 "통"' 카테고리의 다른 글
우리 집 해충 처리반! 거미 10종 (1) | 2023.11.01 |
---|---|
집에서 출몰하는 액취를 풍기는 벌레 6종 (0) | 2023.10.27 |
울음소리로 계절을 알리는 전령들 (1) | 2023.10.25 |
원치 않은 불청객 "집개미 5종" (2) | 2023.10.23 |
한국 독사 4종과 무독성 뱀 4종 "독사, 구렁이, 무자치, 누룩뱀, 실뱀" (1) | 2023.10.19 |