AI, 머신러닝, 딥러닝 기초
본문 바로가기
PYTHON/기본 문법

AI, 머신러닝, 딥러닝 기초

by 공돌이삼촌 2023. 6. 1.
반응형

 

AI, 머신러닝, 딥러닝 정의와 차이점

인공지능(AI)

사람의 지적 능력과 기술을 프로그래밍을 통해 구현하는 기술

 

머신러닝(ML)

데이터를 기반으로 알고리즘(모델)을 학습하여, 해당 분야의 문제들을 추론하는 기술

 

딥러닝(Deep Learning)

인경 신망(ANN, artificial neural network)을 활용한 머신러닝의 일종

 

인공신경망(ANN, artificial neural network) 특징을 살펴보면,

  • 기계학습과 인지과학에서 생물학의 신경망(동물의 중추신경계 중 특히 뇌)에서 영감을 얻은 통계학적 학습 알고리즘
  • 인공신경망은 많은 입력들에 의존하면서 일반적으로 베일에 싸인 함수를 추측하고 근사치를 낼 경우 사용
  • 일반적으로 입력으로부터 값을 계산하는 뉴런 시스템의 상호연결로 표현되고 적응성이 있어 패턴인식과 같은 기계학습을 수행

 

즉 머신러닝에서 인간의 뇌를 모방한 인공신경망에 네트워크를 더한것으로, 

인간의 두뇌가 수많은 데이터 속에서 패턴을 발견한 뒤 

사물을 구분하는 정보처리 방식을 딥러닝(Deep Learning)이라고 한다.

 딥(Deep)은 깊이 배운다는 의미가 아니고 연속된 층으로 표현을 학습한다는 의미다.

 

 

 

이러한 인공신경망이라는 단어를 딥러닝으로 바꾸어 사용하게 된 계기는

AI의 역사를 보면 알 수 있는데

AI 침체기때 이러한 인공신경망이라는 단어를 사용시에

논문이 accept되기 어려웠기 때문이다.

 

 

딥러닝의 알고리즘 역사

 

Shallow(2011)

AlexNet(2012)

ZFNet(2013)

VGG(2014)

ResNet(2015)

- 이때부터 사람의 추론능력을 이기기 시작했고

대표적으로 알파고가 있다.

GoogLeNet-V4(2016)

SENet(2017)

 

판단모델/생성모델

 

판단모델은

학습을 통해 패턴을 찾아내서

문제에 적용시키는 것

 

학습을 위해 데이터가 필요함.

AI 모델을 통해 패턴을 찾아내고

 

머신러닝의 분류

크게 세 가지 종류로 나눌 수 있습니다.

지도 학습(supervised learning), 비지도 학습(unsupervised learning), 강화 학습(reinforcement learning)

 

지도 학습(supervised learning)

학습을 위해 데이터가 필요하다고 앞에서 말했고

이렇게 정답이 있는 데이터를 활용해 데이터를 학습시키는 방법을 지도학습이라고 말합니다.

대표적인 것으로 분류(Classification), 회귀(Regression)가 있습니다.

 

 비지도 학습(unsupervised learning)

정답이 없는 데이터를 군집화하여 새로운 데이터에 대한 결과를 예측하는 방법을 말합니다.

대표적으로 클러스터링, k-means가 있습니다.

 

강화 학습(reinforcement learning)

주어진 환경에서 어떤 행동을 취하고 이로부터 어떤 보상을 얻으면서 학습을 진행

 

생성모델은

최근에 매우 핫합니다

Chat GPT 역시 이러한 생성모델의 딥러닝 산출물입니다

 

생성모델은 다음과 같은 특징이 있습니다.

 

거대한 모델

엄청난 수의 데이터셋 

Prompt Engineering - AI에 잘 명령하는 방법

예를 들면, Chat GPT에서 어떻게 명령하느냐에 따라서 나치를 찬양하는 대답을 할 수 있고

이러한 부분을 막기위해서

Prompt Engineer들은

어떤 명령을 했을때 어떻게 활성화 되는지

관련 업무를 하고 있다.

 

 

- NovelAI 사용자들에서 소설을 써주는 회사

최근에 이미지도 생성해주는데 Danbooru에서 불펌으로 이미지를 학습하여 만들어

많은 이슈를 불러왔었다.

AI는 이처럼 윤리적인 문제가 있는데

아직은 회색지대로

불법으로 판결된 사례가 아직 없다.

 

 

서비스 기획 => 데이터 기획 => 데이터 수집 =>

데이터 레이블링 => AI 학습 => AI 추론 => 서비스 런칭 =>

데이터 축척 및 고객 피드백

기획 수정/ 추가 개발

데이터 curation

 

AI가 똑똑하게 학습할 수 있도록

양질의 데이터를 확보하는게 중요함

 

데이터 분석가

데이터 사이언티스트

데이터 엔지니어

 

양질의 데이터를 활용하여

AI 모델을 개발하여 예측을 수행해야함

 

AI 연구원

 

새로운 서비스 개발한다고 했을때

시장조사, 레퍼런스 경쟁사 분석, 비즈니스 모델 검토

후 타당성이 검토된다면

MVP 개발 => 유저 테스트 => 추가 개발 후

AI 러칭

 

데이터 흭득

CIFAR 10, IMAGENET,대회(kaggle AIhub등),직접 수집등으로 확보할 수 있다.

데이터가 부족하다면,

Data 증강-이동, 색깔 변화, 회전 등 픽셀의 변화가 있기 때문에 AI입장에서 새로운 데이터

합성데이터- 자연어 분야에서 매우 활발하게 사용되고 있다.

 

 AI 모델 개발

 

라이브러리 사용 - 덴서플로우, 파이토치를 이용

논문저자가 공개한 코드 사용

만약 논문저자가 공개한 코드가 없거나 적합한 모델이 없다면

직접 만들어서 사용해야한다.

 

모델 경량화

AI 모델을 유저가 사용할 수 있는 방법 - 클라우드/AI 모델을 고객 디바이스에 설치

 

AI 모델 학습

Pre-trained 모델 사용여부 결정

성능평가 -하이퍼 파라미터 튜닝 및 실험

 

모델 배포

추가 수집 및 재 레이블 및 학습

 

요즘 AI는 생성모델의 전성기입니다.

소설을 작성해주는 Novel AI

이미지를 생성하는 midjourney

목소리를 생성해주는 llElevenLabs

Gawr Gura 등 유튜브에서 가상 인물로 수익을 추구하는 사업아이템도 생각해 볼 수 있다.

 

fine-Tuning 시 2000만원짜리 엔비디아 gpu 10000장을 쓸정도로

heavy하기 때문에 이를 위해 

LoRA

등 해결하고 있다.

 

대표적으로 Chat GPT4는 기존 3.5보다 8배 성능 뛰어나지만 

기존에 윤리의식 문제 해결하기 위해서 성능저하가 살짝 발생했음

단점도 가지고 있는데

hallucination(환각)증상이 있음

없는 것을 있는 것처럼 그럴싸하게 만들고 있음.

 

반응형

댓글