AIDE 레벨 1 인증 시험 이론 요약

AIDE 레벨 1 인증 시험 이론 요약


AIDE 1학년 과거 예측 이론 요약 - 데이터 라벨링 인증 시험 준비

인공지능(AI) 시대에 인공지능이 보다 정확하고 숙련된 기술을 학습할 수 있도록 하기 위해서는 ‘데이터 레이블‘이 작업은 정말 중요합니다.

데이터 레이블의 중요성이 커짐에 따라 “데이터 라벨링”에 대한 전문성또한 점점 더 중요해지고 있습니다.

인공 지능 데이터 전문가(AIDE)이러한 직업을 증명하는 자격증입니다.

일급 비서인공지능의 고도화된 이론과 검증 능력을 증명하는 자격이다.

AI 데이터 전문가 1급‘. AIDE 레벨 1 인증을 위한 과거 시험 이론을 정리한다.

이론을 정리하고 나니 이 시대를 살아가는 데 필요한 기본 정보를 얻게 되어 기쁩니다.

AIDE 자격증은 따로 소개할 예정인데, 이번 글에서는 이전 시험 이론만 공부하고 정리해보도록 하겠습니다.

● 인공지능 방법론

1. 4차 산업혁명 : 지능 ( 인공 지능 )그리고 정보 ( 빅 데이터 ) 산업 혁명은 다음을 통해 발전했습니다.

  • 4차 산업혁명: 21C 초.인공지능, 빅데이터, 사물인터넷, 3D프린팅, 로봇, 공유경제, 드론
  • 19~20C 초반: 전기 에너지, 대량 생산 혁명
  • 3차 산업혁명: 20세기 후반 컴퓨터, 인터넷, 지식정보혁명

2. AI 서비스 개발 4단계

  • ⓵ 데이터 수집( ⓶데이터 처리(전처리) ) ⓷ 모델 생성 ⓸ 서비스 개발(API 개발)

3. 기계 대 기계

  • M2M(Machine To Machine)은 사물 인터넷(스마트) 통신을 의미합니다.

    기계 간 통신 및 사람이 조작하는 장비와 기계 간 통신.사람의 개입이 없는 무인 지능형 서비스
  • AI 서비스 개발 단계( 데이터 수집 )에 해당

4. 데이터 가공(전처리)

  • 수집된 데이터 AI가 학습할 수 있는 형태의 데이터로 변환생산 과정
  • 데이터 처리 작업: ⓵ 데이터 라벨링, ⓶ 분류/정렬, ⓷ 형식 변환, ⓸ 조합/변환
  • AI가 학습할 수 있는 형태로 데이터를 생성하는 작업( 데이터 레이블 )가 호출됩니다.

  • 데이터를 처리하는 작업( 데이터 레이블 ) 및 데이터 데이터 분류 및 선택 데이터 형식을 변경하는 프로세스 결합, 변형 등의 과정을 통해 데이터 조작

5. AI 모델 생성 과정

  • ⓵모델 개발 ⓶데이터 입력 ⓷데이터 학습 ⓸ 모델 수정
  • 데이터 레이블에 해당하는 모델을 만듭니다.

    데이터 입력 + 데이터 학습
  • ( 데이터 레이블 )는 인공지능의 성능을 결정하는 중요한 요소이다.

6. 기계 학습

  • 지능형 에이전트, 행동 협업 지능, 추론적 지식 표현, 상황별 감정 이해, 시각 언어 및 청각 기능을 활용한 모델

7. 인공지능(AI)

  • 인간의 뇌를 모방하다 인공 신경망 ) 및 다양한 ( 기계 학습 ) 알고리즘을 통해

8. 실시간 서비스(API 개발)

  • AI 모델 생성은 예측 가능한 수치 정보를 파악하는 형태로만 이루어지며 사용자가 쉽게 접근할 수 없는 결과가 아니므로 스마트폰 애플리케이션이나 홈페이지 등 사용자가 볼 수 있는 서비스로 개발된다.

9. 퍼셉트론

  • 인간의 뉴런 구조컴퓨터를 그대로 구현하여 만든 컴퓨터 프로그램
  • 1957년( 로젠블라트 ) 알고리즘 디자이너
  • 딥 러닝의 기원(신경망)결정할 알고리즘
  • 퍼셉트론 구성: 입력값, 중량/총입력/활성화기능/출력값

10. 인공신경망 (인공 신경망: 인공 신경망)

  • 생물학의 신경망영감을 얻은 학습 알고리즘
  • 신경망은 인공 지능의 가장 기본적인 형태입니다.

  • 입력층, 은닉층, 출력층작곡
입력 레이어 데이터를 학습하고 입력하는 레이어
히든 레이어 여러 단계에서 입력 데이터를 처리하는 계층
출력 레이어 처리 결과를 출력하는 레이어

11. 인공지능 방법론

  • 범위별로 정렬: 일체 포함() > 기계 학습 > 딥러닝(작은)
  • 머신러닝과 딥러닝의 차이점은 무엇인가요? 기계가 스스로 학습합니까?
인공지능(AI) – 인간지능을 컴퓨터로 구현하는 단계(최종목표)
기계 학습 (기계 학습) – 자율 학습AI 성능을 향상시키는 기술
(지정과제 자율학습)
– 데이터의 다양한 특성을 사람이 직접 분석/판단
– 특정 부품 수동 개입 필요
딥 러닝(DL) – 인간의 뉴런과 유사 인공 신경망배운 기술
– 머신러닝의 한계를 뛰어넘는 기술
– 자동 기계 학습데이터에서 특징을 추출합니다.


– 사람들 개입 필요X (데이터를 제공한 사람)
– 딥 러닝은 예측과 회귀에 널리 사용됩니다.


– 기계 학습 방법 중 하나
– 기계 학습을 위한 최고의 성능놀다

12. 기계 학습을 위한 학습 방법

지도공부하다
(감독 학습)
질문, 정답 및 답변을 알리고 배웁니다.


(예측, 분류, 회귀)
레인 맵공부하다
(비지도 학습)
답을 주지 않고 배우다
(연관 규칙, 클러스터링)
구현하다공부하다
(강화 학습)
보상을 통해 학습하는 방법
(보상)

※ 머신러닝의 3가지 학습 방법 중, 딥 러닝어디에 해당합니까? 지도공부하다

13. 지도학습(감독 학습)

  • 질문과 정답을 말하고 다음을 배우십시오. 딥 러닝
  • 뛰어난 성능이지만 단점은 질문과 답변을 많이 해야 한다는 것입니다.

  • 비지도 학습보다 간단합니다.

    공통 마커 데이터로 주석 달기
  • 지도 학습은 분류 및 회귀를 위한 AI 학습 방법입니다.

  • 예) 그림 카드

● 빅데이터

14. 빅데이터 배경

  • 인터넷과 모바일 시대, SNS와 스마트폰의 대중화로 빅데이터 시대로 접어들었습니다.

  • 기존의 정형 외과데이터에서 대량의 비정형 데이터데이터 생성
  • 대량의 정형 및 비정형 데이터에서 가치 추출그것을 하기 위한 요령: 빅 데이터
  • 컴퓨터의 발달로 데이터의 양과 형태가 달라졌다

15. 빅데이터 3V

  • 용량 : 데이터 양의 증가, 수십조, 기록, 트랜잭션
  • 속도(베로도시) : 실시간 처리, 실시간 분석, 스트리밍
  • 유형 : 데이터 다양성, 정형 데이터, 비정형 데이터, 반정형 데이터

※ 빅 데이터 4V

  • 용량
  • 속도
  • 유형
  • + 정확도 (베라도시)

※ 빅 데이터 5V

  • 용량
  • 속도
  • 유형
  • 확실성
  • + 가치

17. 데이터 유형

정형 외과(구조) 데이터 구조화된 데이터, 고정 필드에 저장된 데이터
전임자) 데이터베이스, Excel, CSV, 정량화 가능한 데이터
반구조화된(반구조화된) 데이터 고정 필드는 아니지만 스키마를 포함하고 있어 조작할 수 없습니다.


전임자) XML, HTML, JSON 등
전형적인 아닌(비정형) 데이터 데이터는 고정되지 않고 계산할 수 없으며 무형입니다.


전임자) 소셜 데이터, 비디오, 오디오, 이미지

18. 빅데이터의 특징

  • 의 모든 데이터
  • 데이터 가치 및 결과 분석 기술
  • 빅데이터 플랫폼의 등장(하드웨어, 소프트웨어, 애플리케이션의 등장)
  • 대규모 데이터 관리 기술
  • 인공 지능: 학습을 위한 좋은 데이터( 라벨을 붙이다 ) 필수
  • 빅 데이터: AI 학습을 위한 처리( 전처리 ) 필수

19. 빅데이터 처리 흐름(총 6단계)

⓵ 데이터 소스 ⓶ 수집 ⓷ 저장 ( 프로세스 ) ⓹ 분석 ⓺ 익스프레스

20. 데이터 레이블 구축을 위한 5단계

사명 정당성 안내 얻다 안내 태블릿(출처데이터) 데이터 라벨을 붙이다 (마크 데이터) 데이터 공부하다

21. 데이터 얻다

  • 루이데이터: 기계 학습을 위한 획득 단계에서 수집/생성된 음성, 이미지, 동영상, 텍스트 등
  • 다양한 교통수단을 구별하는 AI

22. 데이터 정제

  • 원천데이터: 원하는 형식이나 크기에 맞게 변환합니다.

    데이터 중복 제거. ex) 수집된 교통번호판을 숨기는 개인정보 비식별검색 형태의 데이터
  • 데이터 레이블 : AI가 학습에 사용할 수 있도록 레이블이 지정된 작업

23. 데이터 라벨

  • AI 모델이 학습할 수 있도록 데이터를 기계가 사용할 수 있는 형식으로 처리
  • 데이터 세트): AI 학습에 필요한 데이터 진심으로 세트,
  • (원천 데이터) 및 (라벨을 붙이다 데이터 세트)
  • 주석 유형: PASCAL VOC, YOLO, CreateML 등

24. 크롤링

  • 인터넷 방대한 데이터우리를 어디 쉽게 분석하고 사용할 수 있는 데이터 수집하는 행위
  • 크롤러 – 크롤링하는 프로그램
  • 크롤러를 통해 네트워크 정보를 분석하고 수집합니다.

25. API (응용 프로그래밍 인터페이스)

다른 사람이 만든 프로그램을 쉽게 사용할 수 있도록 설계된 프로그램

각 개인이 보유한 데이터 프로그램에 대한 권한( 인증키 ) 사용

인공 지능 및 빅 데이터에서 일반적으로 사용

사용자는 종종 API를 사용하여 빅 데이터를 검색합니다.

● 인공지능 알고리즘

26. 인공 지능 객체 감지 방법

  • 단일 개체와 여러 개체를 식별하는 방법이 다릅니다.

하나의 목적 : 1 개체 많은 목적 : 1개 이상(복수) 객체
  • 감지할 물체 1개
  • 분류 + 지역 표시
  • 감지할 여러 개체
  • 객체 감지 + 시맨틱 분할
분류

  • 배움으로 물건 찾기
  • 데이터셋(데이터, 정답 레이블)을 함께 학습하는 AI 이를 바탕으로 새로운 이미지가 식별됩니다.

    하는 과정
  • 수강하지 않은 과목은 인정하지 않음
물체 감지

  • 인식된 객체의 영역을 경계 상자와 색상으로 학습하고 표시하여 여러 객체를 인식하는 과정


현지화

  • 쉽게 볼 수 있도록 분류 감지를 통해 객체 정보의 위치를 ​​상자 형태로 지정
시맨틱 분할(인스턴스 분할)

  • 객체 인식에서 이미지를 의미 있는 단위로 분할하는 작업
  • 복잡한 AI 구현을 위해 이미지의 각 영역에 의미를 부여하는 데 사용되는 방법

27. 딥 러닝 작동 방식

딥 러닝많은 양의 교육 데이터 및 학습이 필요합니다.

공부하다데이터 기차(기차) 데이터(80%)+ 평가하다(테스트) 데이터(20%)로 분류하여 사용
트레이닝 세트 반복 학습(epoch)을 통해 손실을 줄이고 정확도를 높입니다.

평가 세트 테스트 세트를 사용하여 학습이 성공했는지 여부를 예측합니다.

28. AI 프로그램 개발 과정 5단계

  • 도서관 읽다
  • ⓶ 데이터 읽기 전처리하다
  • 신경망 하다
  • ⓸ 모델 생성(공부하다하다)
  • ⓹ 적용모델(예언하다)

29. 심층 신경망: 신경망

심층 신경망: 입력 계층 중간층 출력 레이어

퍼셉트론 구성: 입력값, 중량/총입력/활성화기능/출력값

30. 딥러닝의 구조

입력 레이어(node1 + weight1) 숨겨진 계층(숨겨진 계층, 활성화 함수) 출력 레이어

노드와 가중치의 합을 출력하기 위해 활성화 함수를 사용하여 출력을 출력 신호로 변경합니다.

31. ~할 수 있게 하다기능

  • 입력 데이터의 가중치 합 출력 신호로 변환행동
  • 활성화 함수 유형: ⓵ 시그모이드 함수, ⓶ 쌍곡선 함수(Tanh), ⓷ relu 함수
S결장
(S결장)
기능
S자형과 유사한 완만한 S자형 곡선을 나타냅니다.


모든 실제 입력 값 0보다 크고 1보다 작음 미분 가능으로 변환
로지스틱 분류와 같은 분류 문제 가정 및 비용 함수에 널리 사용됩니다.

쌍곡선
(탕헤르)
기능
하이퍼볼릭 탄젠트라고도 함
함수 값 -1과 1 사이실제 수량에 한함
기울기 하강법을 사용하는 경우 시그모이드 함수에서 발생하는 편향 편이가 발생하지 않습니다.


기울기는 양수 또는 음수가 될 수 있으므로 시그모이드 함수보다 낫습니다.

능률이것은 훌륭하다
레일로
(게로우)
기능
히든 레이어자주 사용하는 기능
선형 함수라고 함
차단 – 흐름 +/- 반복 신호
Gradient Loss 문제가 없어 널리 사용

손실 함수 : 이로 인해 손실 함수의 값이 최소화됩니다( 무게 )그리고( 편견 ) 찾는 법을 배우십시오

경사 하강법 : 최적화 방법 중 하나.함수의 기울기 찾기 더 낮은 경사로 이동(경사의 절대값)그리고 극한에 도달할 때까지 반복

32. 옵티마이저 함수의 최소값 찾는 방법

  • 기세
  • 아다그라드
  • RMSProp
  • 에이다 델타
  • Adam (현재 가장 많이 사용되는 옵티마이저)

● 딥러닝 알고리즘 : CNN, RNN, GAN(목적에 따라 사용하는 알고리즘 다름)

33. 합성제품 신경망 – CNN(컨볼루션 신경망)

  • 이미지 및 비디오 인식과 같은 사진 및 비디오 필드하게되다
  • 사진을 통해 사진의 특징을 찾는 컨볼루션 필터의 과정
  • 컨볼루션은 인간의 뇌가 시각을 받아들이는 과정입니다.

    “시각 피질”의 구조를 모방그것을하는 방법
  • 데이터의 특성 분석을 통한 패턴 구조 파악
  • CNN(Convolutional Neural Network)은 데이터의 특성을 분석하여 패턴을 인식하는 구조입니다.

    ( 회선 )수업( 풀링 풀링 ) 프로세스를 계속합니다.

  • 입력 영상에 필터를 통과시켜 영상의 특징을 찾는 방법으로( 컨볼루션 컨볼루션 ) 과정에서 이미지의 크기가 줄어들고 고유한 정보 값이 보존됩니다.

회선 : 많은 필터~처럼 이미지 세부 특징 추출함으로써 배우다어떻게

풀링 : 컨볼루션을 통과한 데이터 사이즈 축소의 역할 다시하다

  • 컬러 이미지는 RGB(빨간색, 녹색, 파란색)세 개의 채널을 인식했습니다.

    흑백은 하나의 채널로 인식
  • RGB 값 채널)~로 알려진

합성곱 신경망(CNN)은 입력 값을 RGB 채널로 분리하고 분리된 데이터를 사용하여 특징점을 찾습니다.

특징을 찾는 과정 회선 그것은 말한다.

컨볼루션을 통과한 데이터는 다운스케일링을 위해 다시 사용됩니다.

풀링과정을 반복하여

  • CNN의 전체 흐름도: 입력 RGB 기능 맵 풀링 분류자

34. 주기 신경망 – 순환 신경망(반복 신경망)

  • 음성 및 언어 처리에 사용
  • 순환 출력 계층이 있는 신경망

35. 생성 적의 신경망 – GAN(생성적 적대 신경망)

  • 이미지 생성, 이미지 복원모션모방, 신약개발, 음성생성, 편집, 변환 등
  • 생성자와 구분자 대립및 데이터 생성할 모델
  • 발전기 : 초상화 만들기
  • 판별기 : 생성된 초상화 평가
  • 생성자와 구분자 반대하다점차적으로 서로의 성능 학습 방법을 개선
  • 가짜 데이터 대량 생산으로 데이터 부족 보완
  • 진짜 가짜 데이터를 무한대로 생성할 수 있습니다.

  • 이안 굿펠로우가 발명한

● 데이터 검토

36. 검사 순서

  1. 검사 가이드 및 작업 가이드를 숙지하십시오.
  2. 집중된 환경 만들기
  3. 진행 상황 확인
  4. 작업 데이터 자세히 살펴보기
  5. 거절 사유를 구체적이고 명확하게 기재
  6. 문제 발생 시 데이터 PM과 소통

37. 검사 전 준비

  1. 가이드를 숙지하십시오: 재확인 검사 가이드 및 작업 가이드
  2. 업무 환경: 집중할 수 있는 환경 조성
  3. 거절된 경우 거절 사유를 구체적이고 명확하게 작성하여 제출해 주시기 바랍니다.

  4. 사증이 거절된 경우에는 구체적인 거절사유와 처리내용을 기재하여 주시기 바랍니다.