AIDE 레벨 1 인증 시험 이론 요약

쉬운 목차

AIDE 레벨 1 인증 시험 이론 요약

인공지능(AI) 시대에 인공지능이 보다 정확하고 숙련된 기술을 학습할 수 있도록 하기 위해서는 ‘데이터 레이블‘이 작업은 정말 중요합니다.

데이터 레이블의 중요성이 커짐에 따라 “데이터 라벨링”에 대한 전문성또한 점점 더 중요해지고 있습니다. 인공 지능 데이터 전문가(AIDE)이러한 직업을 증명하는 자격증입니다. 일급 비서인공지능의 고도화된 이론과 검증 능력을 증명하는 자격이다.AI 데이터 전문가 1급‘. AIDE 레벨 1 인증을 위한 과거 시험 이론을 정리한다.

이론을 정리하고 나니 이 시대를 살아가는 데 필요한 기본 정보를 얻게 되어 기쁩니다.

AIDE 자격증은 따로 소개할 예정인데, 이번 글에서는 이전 시험 이론만 공부하고 정리해보도록 하겠습니다.

● 인공지능 방법론

1. 4차 산업혁명 : 지능 ( 인공 지능 )그리고 정보 ( 빅 데이터 ) 산업 혁명은 다음을 통해 발전했습니다.

4차 산업혁명: 21C 초.인공지능, 빅데이터, 사물인터넷, 3D프린팅, 로봇, 공유경제, 드론
19~20C 초반: 전기 에너지, 대량 생산 혁명
3차 산업혁명: 20세기 후반 컴퓨터, 인터넷, 지식정보혁명

2. AI 서비스 개발 4단계

⓵ 데이터 수집( ⓶데이터 처리(전처리) ) ⓷ 모델 생성 ⓸ 서비스 개발(API 개발)

3. 기계 대 기계

M2M(Machine To Machine)은 사물 인터넷(스마트) 통신을 의미합니다. 기계 간 통신 및 사람이 조작하는 장비와 기계 간 통신.사람의 개입이 없는 무인 지능형 서비스
AI 서비스 개발 단계( 데이터 수집 )에 해당

4. 데이터 가공(전처리)

수집된 데이터 AI가 학습할 수 있는 형태의 데이터로 변환생산 과정
데이터 처리 작업: ⓵ 데이터 라벨링, ⓶ 분류/정렬, ⓷ 형식 변환, ⓸ 조합/변환
AI가 학습할 수 있는 형태로 데이터를 생성하는 작업( 데이터 레이블 )가 호출됩니다.
데이터를 처리하는 작업( ⓵데이터 레이블 ) 및 데이터 ⓶데이터 분류 및 선택 ⓷데이터 형식을 변경하는 프로세스 ⓸결합, 변형 등의 과정을 통해 데이터 조작

5. AI 모델 생성 과정

⓵모델 개발 ⓶데이터 입력 ⓷데이터 학습 ⓸ 모델 수정
데이터 레이블에 해당하는 모델을 만듭니다. 데이터 입력 + 데이터 학습
( 데이터 레이블 )는 인공지능의 성능을 결정하는 중요한 요소이다.

6. 기계 학습

지능형 에이전트, 행동 협업 지능, 추론적 지식 표현, 상황별 감정 이해, 시각 언어 및 청각 기능을 활용한 모델

7. 인공지능(AI)

인간의 뇌를 모방하다 인공 신경망 ) 및 다양한 ( 기계 학습 ) 알고리즘을 통해

8. 실시간 서비스(API 개발)

AI 모델 생성은 예측 가능한 수치 정보를 파악하는 형태로만 이루어지며 사용자가 쉽게 접근할 수 없는 결과가 아니므로 스마트폰 애플리케이션이나 홈페이지 등 사용자가 볼 수 있는 서비스로 개발된다.

9. 퍼셉트론

인간의 뉴런 구조컴퓨터를 그대로 구현하여 만든 컴퓨터 프로그램
1957년( 로젠블라트 ) 알고리즘 디자이너
딥 러닝의 기원(신경망)결정할 알고리즘
퍼셉트론 구성: 입력값, 중량/총입력/활성화기능/출력값

10. 인공신경망 (인공 신경망: 인공 신경망)

생물학의 신경망영감을 얻은 학습 알고리즘
신경망은 인공 지능의 가장 기본적인 형태입니다.
입력층, 은닉층, 출력층작곡

입력 레이어	데이터를 학습하고 입력하는 레이어
히든 레이어	여러 단계에서 입력 데이터를 처리하는 계층
출력 레이어	처리 결과를 출력하는 레이어

11. 인공지능 방법론

범위별로 정렬: 일체 포함(큰) > 기계 학습 > 딥러닝(작은)
머신러닝과 딥러닝의 차이점은 무엇인가요? 기계가 스스로 학습합니까?

인공지능(AI)	– 인간지능을 컴퓨터로 구현하는 단계(최종목표)
기계 학습 (기계 학습)	– 자율 학습AI 성능을 향상시키는 기술 (지정과제 자율학습) – 데이터의 다양한 특성을 사람이 직접 분석/판단 – 특정 부품 수동 개입 필요
딥 러닝(DL)	– 인간의 뉴런과 유사 인공 신경망배운 기술 – 머신러닝의 한계를 뛰어넘는 기술 – 자동 기계 학습데이터에서 특징을 추출합니다. – 사람들 개입 필요X (데이터를 제공한 사람) – 딥 러닝은 예측과 회귀에 널리 사용됩니다. – 기계 학습 방법 중 하나 – 기계 학습을 위한 최고의 성능놀다

12. 기계 학습을 위한 학습 방법

지도공부하다 (감독 학습)	질문, 정답 및 답변을 알리고 배웁니다. (예측, 분류, 회귀)
레인 맵공부하다 (비지도 학습)	답을 주지 않고 배우다 (연관 규칙, 클러스터링)
구현하다공부하다 (강화 학습)	보상을 통해 학습하는 방법 (보상)

※ 머신러닝의 3가지 학습 방법 중, 딥 러닝어디에 해당합니까? 지도공부하다

13. 지도학습(감독 학습)

질문과 정답을 말하고 다음을 배우십시오. 딥 러닝
뛰어난 성능이지만 단점은 질문과 답변을 많이 해야 한다는 것입니다.
비지도 학습보다 간단합니다.공통 마커 데이터로 주석 달기
지도 학습은 분류 및 회귀를 위한 AI 학습 방법입니다.
예) 그림 카드

● 빅데이터

14. 빅데이터 배경

인터넷과 모바일 시대, SNS와 스마트폰의 대중화로 빅데이터 시대로 접어들었습니다.
기존의 정형 외과데이터에서 대량의 비정형 데이터데이터 생성
대량의 정형 및 비정형 데이터에서 가치 추출그것을 하기 위한 요령: 빅 데이터
컴퓨터의 발달로 데이터의 양과 형태가 달라졌다

15. 빅데이터 3V

용량 : 데이터 양의 증가, 수십조, 기록, 트랜잭션
속도(베로도시) : 실시간 처리, 실시간 분석, 스트리밍
유형 : 데이터 다양성, 정형 데이터, 비정형 데이터, 반정형 데이터

※ 빅 데이터 4V

용량
속도
유형
+ 정확도 (베라도시)

※ 빅 데이터 5V

용량
속도
유형
확실성
+ 가치

17. 데이터 유형

정형 외과(구조) 데이터	구조화된 데이터, 고정 필드에 저장된 데이터 전임자) 데이터베이스, Excel, CSV, 정량화 가능한 데이터
반구조화된(반구조화된) 데이터	고정 필드는 아니지만 스키마를 포함하고 있어 조작할 수 없습니다. 전임자) XML, HTML, JSON 등
전형적인 아닌(비정형) 데이터	데이터는 고정되지 않고 계산할 수 없으며 무형입니다. 전임자) 소셜 데이터, 비디오, 오디오, 이미지

18. 빅데이터의 특징

잼의 모든 데이터
데이터 가치 및 결과 분석 기술
빅데이터 플랫폼의 등장(하드웨어, 소프트웨어, 애플리케이션의 등장)
대규모 데이터 관리 기술
인공 지능: 학습을 위한 좋은 데이터( 라벨을 붙이다 ) 필수
빅 데이터: AI 학습을 위한 처리( 전처리 ) 필수

19. 빅데이터 처리 흐름(총 6단계)

⓵ 데이터 소스 ⓶ 수집 ⓷ 저장 ( ⓸프로세스 ) ⓹ 분석 ⓺ 익스프레스

20. 데이터 레이블 구축을 위한 5단계

사명 정당성 안내 얻다 안내 태블릿(출처데이터) 데이터 라벨을 붙이다 (마크 데이터) 데이터 공부하다

21. 데이터 얻다

루이데이터: 기계 학습을 위한 획득 단계에서 수집/생성된 음성, 이미지, 동영상, 텍스트 등
다양한 교통수단을 구별하는 AI

22. 데이터 정제

원천데이터: 원하는 형식이나 크기에 맞게 변환합니다. 데이터 중복 제거. ex) 수집된 교통번호판을 숨기는 개인정보 비식별검색 형태의 데이터
데이터 레이블 : AI가 학습에 사용할 수 있도록 레이블이 지정된 작업

23. 데이터 라벨

AI 모델이 학습할 수 있도록 데이터를 기계가 사용할 수 있는 형식으로 처리
데이터 세트): AI 학습에 필요한 데이터 진심으로 세트,
(원천 데이터) 및 (라벨을 붙이다 데이터 세트)
주석 유형: PASCAL VOC, YOLO, CreateML 등

24. 크롤링

인터넷 방대한 데이터우리를 어디 쉽게 분석하고 사용할 수 있는 데이터 수집하는 행위
크롤러 – 크롤링하는 프로그램
크롤러를 통해 네트워크 정보를 분석하고 수집합니다.

25. API (응용 프로그래밍 인터페이스)

다른 사람이 만든 프로그램을 쉽게 사용할 수 있도록 설계된 프로그램

각 개인이 보유한 데이터 프로그램에 대한 권한( 인증키 ) 사용

인공 지능 및 빅 데이터에서 일반적으로 사용

사용자는 종종 API를 사용하여 빅 데이터를 검색합니다.

● 인공지능 알고리즘

26. 인공 지능 객체 감지 방법

단일 개체와 여러 개체를 식별하는 방법이 다릅니다.

하나의 목적 : 1 개체	많은 목적 : 1개 이상(복수) 객체
감지할 물체 1개 분류 + 지역 표시	감지할 여러 개체 객체 감지 + 시맨틱 분할
분류 배움으로 물건 찾기 데이터셋(데이터, 정답 레이블)을 함께 학습하는 AI 이를 바탕으로 새로운 이미지가 식별됩니다.하는 과정 수강하지 않은 과목은 인정하지 않음	물체 감지 인식된 객체의 영역을 경계 상자와 색상으로 학습하고 표시하여 여러 객체를 인식하는 과정
현지화 쉽게 볼 수 있도록 분류 감지를 통해 객체 정보의 위치를 상자 형태로 지정	시맨틱 분할(인스턴스 분할) 객체 인식에서 이미지를 의미 있는 단위로 분할하는 작업 복잡한 AI 구현을 위해 이미지의 각 영역에 의미를 부여하는 데 사용되는 방법

27. 딥 러닝 작동 방식

딥 러닝많은 양의 교육 데이터 및 학습이 필요합니다.

공부하다데이터	기차(기차) 데이터(80%)+ 평가하다(테스트) 데이터(20%)로 분류하여 사용
트레이닝 세트	반복 학습(epoch)을 통해 손실을 줄이고 정확도를 높입니다.
평가 세트	테스트 세트를 사용하여 학습이 성공했는지 여부를 예측합니다.

28. AI 프로그램 개발 과정 5단계

⓵도서관 읽다
⓶ 데이터 읽기 전처리하다
⓷신경망 하다
⓸ 모델 생성(공부하다하다)
⓹ 적용모델(예언하다)

29. 심층 신경망: 신경망

심층 신경망: 입력 계층 중간층 출력 레이어

퍼셉트론 구성: 입력값, 중량/총입력/활성화기능/출력값

30. 딥러닝의 구조

입력 레이어(node1 + weight1) 숨겨진 계층(숨겨진 계층, 활성화 함수) 출력 레이어

노드와 가중치의 합을 출력하기 위해 활성화 함수를 사용하여 출력을 출력 신호로 변경합니다.

31. ~할 수 있게 하다기능

입력 데이터의 가중치 합 출력 신호로 변환행동
활성화 함수 유형: ⓵ 시그모이드 함수, ⓶ 쌍곡선 함수(Tanh), ⓷ relu 함수

S결장 (S결장) 기능	S자형과 유사한 완만한 S자형 곡선을 나타냅니다. 모든 실제 입력 값 0보다 크고 1보다 작음 미분 가능으로 변환 로지스틱 분류와 같은 분류 문제 가정 및 비용 함수에 널리 사용됩니다.
쌍곡선 (탕헤르) 기능	하이퍼볼릭 탄젠트라고도 함 함수 값 -1과 1 사이실제 수량에 한함 기울기 하강법을 사용하는 경우 시그모이드 함수에서 발생하는 편향 편이가 발생하지 않습니다. 기울기는 양수 또는 음수가 될 수 있으므로 시그모이드 함수보다 낫습니다. 능률이것은 훌륭하다
레일로 (게로우) 기능	히든 레이어자주 사용하는 기능 선형 함수라고 함 차단 – 흐름 +/- 반복 신호 Gradient Loss 문제가 없어 널리 사용

※손실 함수 : 이로 인해 손실 함수의 값이 최소화됩니다( 무게 )그리고( 편견 ) 찾는 법을 배우십시오

※경사 하강법 : 최적화 방법 중 하나.함수의 기울기 찾기 더 낮은 경사로 이동(경사의 절대값)그리고 극한에 도달할 때까지 반복

32. 옵티마이저 함수의 최소값 찾는 방법

기세
아다그라드
RMSProp
에이다 델타
Adam (현재 가장 많이 사용되는 옵티마이저)

● 딥러닝 알고리즘 : CNN, RNN, GAN(목적에 따라 사용하는 알고리즘 다름)

33. 합성제품 신경망 – CNN(컨볼루션 신경망)

이미지 및 비디오 인식과 같은 사진 및 비디오 필드하게되다
사진을 통해 사진의 특징을 찾는 컨볼루션 필터의 과정
컨볼루션은 인간의 뇌가 시각을 받아들이는 과정입니다. “시각 피질”의 구조를 모방그것을하는 방법
데이터의 특성 분석을 통한 패턴 구조 파악
CNN(Convolutional Neural Network)은 데이터의 특성을 분석하여 패턴을 인식하는 구조입니다. ( 회선 )수업( 풀링 풀링 ) 프로세스를 계속합니다.
입력 영상에 필터를 통과시켜 영상의 특징을 찾는 방법으로( 컨볼루션 컨볼루션 ) 과정에서 이미지의 크기가 줄어들고 고유한 정보 값이 보존됩니다.

※회선 : 많은 필터~처럼 이미지 세부 특징 추출함으로써 배우다어떻게

※풀링 : 컨볼루션을 통과한 데이터 사이즈 축소의 역할 다시하다

컬러 이미지는 RGB(빨간색, 녹색, 파란색)세 개의 채널을 인식했습니다.흑백은 하나의 채널로 인식
RGB 값 채널)~로 알려진

합성곱 신경망(CNN)은 입력 값을 RGB 채널로 분리하고 분리된 데이터를 사용하여 특징점을 찾습니다.

특징을 찾는 과정 회선 그것은 말한다. 컨볼루션을 통과한 데이터는 다운스케일링을 위해 다시 사용됩니다. 풀링과정을 반복하여

CNN의 전체 흐름도: 입력 RGB 기능 맵 풀링 분류자

34. 주기 신경망 – 순환 신경망(반복 신경망)

음성 및 언어 처리에 사용
순환 출력 계층이 있는 신경망

35. 생성 적의 신경망 – GAN(생성적 적대 신경망)

이미지 생성, 이미지 복원모션모방, 신약개발, 음성생성, 편집, 변환 등
생성자와 구분자 대립및 데이터 생성할 모델
발전기 : 초상화 만들기
판별기 : 생성된 초상화 평가
생성자와 구분자 반대하다점차적으로 서로의 성능 학습 방법을 개선
가짜 데이터 대량 생산으로 데이터 부족 보완
진짜 가짜 데이터를 무한대로 생성할 수 있습니다.
이안 굿펠로우가 발명한

● 데이터 검토

36. 검사 순서

검사 가이드 및 작업 가이드를 숙지하십시오.
집중된 환경 만들기
진행 상황 확인
작업 데이터 자세히 살펴보기
거절 사유를 구체적이고 명확하게 기재
문제 발생 시 데이터 PM과 소통

37. 검사 전 준비

가이드를 숙지하십시오: 재확인 검사 가이드 및 작업 가이드
업무 환경: 집중할 수 있는 환경 조성
거절된 경우 거절 사유를 구체적이고 명확하게 작성하여 제출해 주시기 바랍니다.
사증이 거절된 경우에는 구체적인 거절사유와 처리내용을 기재하여 주시기 바랍니다.