본문 바로가기
life

데이터 라벨링

by joypek 2023. 11. 17.
728x90

데이터 라벨링 용어 정리와'플랫폼 종사자'를 위한 사용 설명서

데이터 라벨링 강의 듣고 정리해 보았습니다.

 

💕데이터 라벨링 용어 정리💕

■크라우드소싱:대중과 아웃소싱의 합성어 일부 과정에서 일반대중을 참여시키는 것을 의미
■크라우드워커:일반인이 기업의 업무 용역을 대행 수행하고 일정 대가를 받는 경우를 의미
■데이터라벨러:데이터를 수집에서 가공에 이르기까지 인공지능 학습에 필요한 형태의 데이터를 만드는 사람
■인공지능 학습용 데이터:인공지능이 학습을 통해 성능을 향상하는 데 활용되는 데이터
■인공지능 학습용 데이터 구축:임무 정의 획득 정제 라벨링 등 인공지능 학습용 데이터를 구축하는 일련의 활동
■데이터 수집(획득):인공지능의 기계학습에 필요한 데이터를 현실 세계에서 직접 수집 또는 생성하는 등 다양한 종류의 데이터를 모으는 작업
■데이터 정제:기계학습에 필요한 형식으로 맞추거나 불필요한 중복을 제거하며 개인정보를 식별화하여 처리하는 등 인공지능 학습에 적합한 형태로 바꿔주는 작업
■데이터 라벨링:인공지능 알고리즘 고도화를 위해 AI가 스스로 학습할 수 있는 형태로 데이터를 가공하는 작업
■데이터 검수:데이터 라벨링이 올바르게 되었는지 확인하는 작업
■라벨(레이블):인공지능 학습을 위해 데이터에 부착하는 것으로 해당 대상에 대한 명칭뿐 아니라 데이터 인식에 필요한 설명이나 정답과 같은 의미
■챗봇:문자 또는 음성으로 대화하는 기능이 있는 컴퓨터 프로그램 또는 인공지능
■바운딩:이미지에서 추출하고자 하는 대상을 네모난 박스로 표시하는 라벨링 기법으로 데이터 라벨링 작업에서 가장 일반적으로 사용되는 유형
■태깅:이미지나 파일 등에 이름을 붙이는 것으로 대표할 수 있는 키워드를 달아줌으로써 대상을 분류하는 작업
■전사:이미지나 영상 속의 문자를 텍스트로 옮겨 적는 작업
■감정분석:이미지나 영상 속 사람의 표정을 보고 어떤 감정 상태인지를 추론하는 라벨링 기법
■키포인트:작업 대상의 특정 지점에 마우스를 클릭하여 점을 찍어주는 라벨링 기법
■얼굴 랜드마크:얼굴의 중요 부위에 마우스로 클릭하여 점을 찍어주는 라벨링 기법
■다각형:객체의 불규칙한 경계를 따라 점을 찍는 라벨링 기법
■폴리 라인:여러 개의 점을 연속적으로 그리는 라벨링 기법
■의미 세그멘테이션:다각형 등을 사용하여 경계를 분할함으로써 이미지 내의 모든 대상의 위치 및 모양 등을 영역으로 분류해 내는 라벨링 기법
■OCR (광학문자인식):영상 텍스트를 기계가 읽을 수 있는 문자로 변화하는 라벨링 기법
■스켈레톤:대상의 특정 부위에 점을 찍는 라벨링 기법
■특정 구간 추출: 작업 대상이 사전에 제시된 기준에 해당하는 말이나 행동 등을 할 때의 구간을 선택해 추출하는 라벨링 기법
■3D라벨링 기법:육면체의 입체적 박스를 생성하여 바운딩하는 것과 같이 2차원 라벨링의 한계를 넘어 3차원의 입체적 표현을 가능케 하는 라벨링 기법
■복합 라벨링:여러 개의 라벨링 기법을 복합적으로 사용하는 라벨링 기법
■문장 의미 비교:주어진 문장들의 의미가 같은 것인지 태킹 하는 라벨링 기법
■감정 태깅:제시된 글을 읽었을 때 느껴지는 감정을 선택하는 라벨링 기법
■키워드 찾기:대화 내용 속에서 핵심이 되는 키워드를 찾는 라벨링 기법
■문장 요약:글을 읽고 핵심이 되는 내용을 요약하는 라벨링 기법
■화자 구분:제시된 음성을 모두 듣고 동일한 사람의 목소리인지를 판단해서 태깅하는 라벨링 기법
■음성 받아쓰기:주어진 음성을 듣고 받아쓰는 라벨링 기법
■일반 전사:사람이 말한 그대로 문자화하여 전사하는 방법
■이중 전사:한글 맞춤법 표기에 따른 발음과 차이가 있는 경우'와' 철자 전사'를 병행하여 작성하는 방법

인공지능 학습용 데이터 구축 과정
1. 데이터 수집
2. 데이터 정제
3. 데이터 라벨링
4. 데이터 검수

 

🤍'플랫폼 종사자'를 위한 사용 설명서 Key Point🤍

■디지털 시대의 플랫폼:스마트폰 등을 활용해 새로운 아이디어를 실현하고 경제활동에 나설 수 있는 디지털 공간
■온라인 매개 노동:디지털 플랫폼을 기반으로 이루어지는 노동
■O2O 노동:온라인 플랫폼을 통해 실제 오프라인에서 일어나는 활동
■온라인 매개 노동 현황:2021년 국내 플랫폼 종사자 그중 약 220만 명
   지역 기반 온라인 매개 노동-배달과 같이 플랫폼을 통해 일감만을 전달받고 실제 서비스는 정해진 특정 지역에서 대면으로 제공
   웹 기반 온라인 매개 노동-번역 작업과 같이 플랫폼을 통해 특정 작업이 생성되면 일을 부여받은 사람이 장소와 관계없이 온라인상에서 작업을 진행
■웹 기반 온라인 매개 노동의 특징:비대면 업무처리 가능 유연 자율성 높음
■마이크로 작업:단순하고 업무나 작게 세분된 형태의 업무 데이터 리 별러가 이에 해당
■웹 기반 온라인 매개 노동의 종류
  전문서비스-법률 출판 등
   IT-소프트웨어 개발 지원 등
   마이크로 작업-문서작업 입력 수집 가공 검수 등
   창작-웹툰 등
■업무 수행 장소:재택 업체 사무실 중계 업체 파견 장소
■작업 도구:노트북 51.1% 사무실 컴퓨터 29.0% 19.2%, 기타 0.7%
■선호 작업: OCR [16.5%] 바운딩 [19.9%] 이미지 수집 [10.9%] 대화 셋 만들기 [12.4% ] 음성녹음 [30.1%] 음성 전사 [5.7%] 기타 [ 4.5%]
■Q.' 데이터 라벨러'로 활동을 하고 싶은데 일을 구할 수 있나요?
   A. 채용 정보 사이트와 공공기관의 취업센터 등을 통해 데이터 라벨로에 대한 정보를 찾거나 관련 교육을 받을 수 있습니다.
  Q. 현재 다른 일을 하고 있어도 '데이터 라벨러'로 활동할 수 있나요?
  A. 공무원이나 공공기관 임직원은 국가공무원 복무규정 제4장 제25조 '영리 업무의 금지'에 따라 부업이 금지되어 있습니다. 그러나 일반 사기업 근로자는 원칙적으로 겸직이 가능합니다.
다만 겸업을 금지하고 있는 예가 있어서 근로자로서 플랫폼 근로를 하게 되는 경우에는 이 부분에 대한 확인도 필요합니다.
  Q.' 데이터 라벨러'로 활동할 때 주의해야 할 점이 있나요?
  A. 부정한 방법으로 작업을 진행할 경우 플랫폼에서 일을 할 수 없거나 법적인 처벌과 같은 불이익을 받을 수 있으니 주의해야 합니다.
[부정행위의 예]
-단시간에 많은 양의 작업을 진행하기 위해 컴퓨터 프로그램 등을 이용하는 경우
-작업해야 하는 내용을 제대로 확인하지 않고 무관한 내용들로 작업을 제출하는 경우
-작업 도중 개인정보를 캡처하거나 사진으로 찍어 유출할 경우
-제삼자의' 저작권'이나'을 침해한 행위
  Q. 오랜 기간 '데이터 라벨로'로 활동했는데 왜 근로자가 아닌가요?
  A. 데이터 라벨러는 개인사업자(자영업자).
['플랫폼 종사자'의 근로자 인정 여부 - 사업장에 임금을 목적으로 사용 종속적인 관계에서 사용자에게 근로를 제공하느냐에 따라 근로자 여부가 결정됨]
 Q. 온라인 매개 노동으로 받게 될 수입이 많지도 않은데 왜 신분증 사본과 통장 사본까지 제출해야 하나요:
  A. 대부분의 플랫폼 종사자는 사업등록이 되어 있지 않은 개인의 지위를 갖기 때문에 '원천납세의무자'에 해당하고 종사자에게 수입 금액을 지급하는 플랫폼 기업은' 원천징수의무자'가 됩니다.
이에 따라 플랫폼 기업은 원천징수와 함께 세금 신고 납부 및 지급명세서 제출의 의무 또한 가지고 있어 필요한 통장 신분증 사본과 같은 자료를 플랫폼 종사자에게 요청할 수 있습니다.

반응형

'life' 카테고리의 다른 글

탈무드 명언 탈무드 이야기  (2) 2023.11.18
손자병법-싸우지 않고 이기는 것이 최선 2  (0) 2023.11.18
손자병법-싸우지 않고 이기는 것이 최선 1  (1) 2023.11.18
손자병법  (0) 2023.11.18
국민 내일배움카드  (0) 2023.11.16