OWL Magazine Korea

코세라 “구글 인공지능 입문(Introduction to Generative AI)”

최근들어서 “생성형 인공지능(Generative AI)“에 관한 관심이 높아지고 있다. “Ghat GPT”가 세상에 모습을 드러내면서, 업무 환경을 완전히 변화시킬 정도의 혁명을 가지고 오고 있는 것이 현실이다. 빅테크 기업으로 손꼽히는 애플, 마이크로소프트, 구글, 메타와 같은 기업에서도 “AI” 기술 개발에 박차를 가하고 있다. “AI”가 언급이 되는 것만으로도 주가가 치솟기도 하고, AI에서 뒤쳐지는 것만으로도 주가가 하락하기도 한다.

한동안 혁신의 아이콘으로 손꼽혔던 애플이 대표적인 예라고 할 수 있다. 맥, 아이폰, 아이패드 등의 제품과 클라우드 등으로 애플 생태계를 구축하면서 혁신을 거듭했다. 하지만, 최근 구글이나 마이크로소프트에 비해서 AI 기술 분야에서 뒤쳐진다는 이미지를 갖게 되었고, 애플이 10년 이상 계획하고 준비해오던 애플카를 결국 포기하는 모습을 보이면서, 주가가 크게 하락하고 말았다.

최근 곳곳에서 “생성형 AI”에서 이야기를 나누고 있다보니, 자연스럽게 “AI”에 관심이 생기게 되었다. “AI”라는 용어를 일상에서도 들어볼 수 있을 정도로 이제는 대중화된 용어가 되었지만, 정작 AI가 무엇인지, 어떤 원리로 작동하는 것인지에 대해서는 알수가 없어서 아쉬움이 남았다.

하지만, 다행히도 코세라(Coursera)라는 플랫폼에서 구글에서 ”생성형 인공지능 입문(Introduction to Generative AI)”라는 20분 분량의 영상을 올려준 것을 확인할 수 있었다. 분량이 그리 많지 않았기에 가볍게 접해볼 수 있는 수준이지만, 초심자에게 전달하는 내용은 상당히 많은 편이다. 20분이라는 짧은 시간에 “생성형 인공지능”에 대해서 빠르고, 방대한 내용을 효과적으로 전달하는 분위기다. 해당 글은 코세라에 무료로 올라온 글을 바탕으로 복습차원에서 정리해보는 글이다.

“Coursera : Introduction to Generative AI”

현재 인공지능은 많은 분야에서 쓰인다. “Chat GPT”가 그 중의 대표적인 예시이다. 문구를 입력하면, 문구에 해당하는 무언가를 생성해내는 인공지능이다. 하지만, 이제는 이 기술이 단순한 텍스트를 넘어서, 이미지, 영상, 음성까지도 생성이 가능한 단계로 진화했다. 물론, 아직까지는 조금씩 아쉬움이 남는 부분이 있긴 하지만, 시간이 지날수록 점점 더 정교해지고 있는 추세이다.

해당 과정에서 다루게 될 내용은 아래와 같은 4가지이다.

  1. 생성형 인공지능 정의 (Define Generative AI)
  2. 생성형 인공지능 작동 방식 설명 (Explain How Generative AI Works)
  3. 생성형 인공지능 모델 유형 설명 (Describe Generative AI Model Types)
  4. 생성형 인공지능 응용 프로그램 설명 (Describe Generative Applications)

“생성형 인공지능은 무엇인가?”

생성형 인공지능(Generative AI)은 텍스트, 이미지, 오디오, 그리고 합성 데이터와 같은 다양한 유형의 콘텐츠를 생성할 수 있는 인공지능 기술이다. (Generative AI is a type of artificial intelligence technology that can produce various types of content- including text, imagery, audio and synthetic data.)

“인공지능과 머신러닝의 차이점”

인공지능(AI)은 머신러닝(ML)을 포함하는 개념으로, 딥러닝(Deep Learning)은 ML의 하위 개념에 해당되며, 머신러닝의 한 방법으로서 “Deep Learning”이 있다.

  • AI
    • ML
      • Unsupervised Learning
      • Supervised Learning
      • Reinforcement Learning
      • Deep Learning

“Supervised ML Learning VS Unsupervised ML Learning”

  1. Unsupervised ML Models: 비지도 학습 문제는 원시 데이터를 조사하여 데이터가 자연스럽게 그룹으로 형성되는지 살펴본다. (Unsupervised problems are all about discovery, about looking at the raw data, and seeing if it naturally falls into groups.)
  2. Supervised ML Models: 모델은 과거의 예를 기반으로 미래 값을 예측한다. 데이터 태그가 필요하다 (데이터 태그 – 이름, 유형, 번호 등) (The model learns from past examples to predict future values. Label이 필요함 (Data Tag – Name, Type, Number, etc)

“Deep Learning”

기계 학습은 여러 가지 다양한 기술을 포괄하는 넓은 범주이지만, 딥 러닝은 기계 학습의 한 유형으로서 인공 신경망을 사용하여 기존의 기계 학습보다 더 복잡한 패턴을 처리할 수 있다. 인공 신경망은 인간의 뇌를 모방한 것이다.

우리의 뇌와 마찬가지로, 이들은 많은 상호 연결된 노드 또는 뉴런으로 구성되어 있다. 이 뉴런들은 데이터를 처리하고 예측을 수행함으로써 작업을 수행할 수 있도록 학습할 수 있다. 딥 러닝 모델은 일반적으로 많은 층의 뉴런을 가지고 있어 기존의 기계 학습 모델보다 더 복잡한 패턴을 학습할 수 있다. 신경망은 레이블이 지정된 데이터와 레이블이 지정되지 않은 데이터를 모두 사용할 수 있다.

레이블이 지정된 데이터는 신경망이 작업의 기본 개념을 학습하는 데 도움이 되며, 레이블이 지정되지 않은 데이터는 신경망이 새로운 예제에 일반화하는 데 도움이 된다.

“Generative AI”

Gen AI는 딥러닝의 하위 범주로, 인공 신경망을 사용하여 레이블이 지정된 및 지정되지 않은 데이터 모두를 처리할 수 있다. LLMs도 딥러닝의 하위 범주이다.

LLMs도 딥러닝의 하위 범주이다. 딥러닝 모델(또는 머신러닝 모델 전반)은 생성형과 판별형 두 가지 유형으로 나뉜다.

  1. 판별형 모델 (Discriminative Model)
  2. 생성형 모델 (Generative Model)

“판별형 모델 (Discriminative Model)”

판별형 모델은 데이터 포인트의 레이블을 분류하거나 예측하는 모델이다. 판별형 모델은 일반적으로 레이블이 지정된 데이터 포인트 집합으로 훈련되며, 데이터 포인트의 특성과 레이블 간의 관계를 학습한다. 판별형 모델이 훈련되면 새로운 데이터 포인트의 레이블을 예측하는 데 사용할 수 있다.

“생성형 모델 (Generative Model)“

생성형 모델은 기존 데이터의 학습된 확률 분포를 기반으로 새로운 데이터 인스턴스를 생성한다. 생성형 모델은 새로운 콘텐츠를 생성한다.

요약하면 생성형 모델은 새로운 데이터 인스턴스를 생성하고, 판별형 모델은 서로 다른 종류의 데이터 인스턴스를 구별한다.

“Generative AI: 구성”

생성형 인공지능 프로세스는 훈련 코드, 레이블이 지정된 데이터, 그리고 모든 유형의 지정되지 않은 데이터를 사용하여 “기반 모델”을 구축할 수 있다. 기반 모델은 새로운 콘텐츠를 생성할 수 있다. 텍스트, 코드, 이미지, 오디오, 비디오 등을 생성할 수 있다.

전통적인 프로그래밍에서는 “고양이”를 정의하고, “신경망의 파동(Wave of Neural Network)”에서는 “고양이”, “개”의 사진을 통해 해결했지만, “생성형 인공지능”에서는 사용자가 직접 콘텐츠를 생성할 수 있다.

“Generative AI에 대한 새로운 정의“

Gen AI는 기존 콘텐츠에서 학습한 내용을 기반으로 새로운 콘텐츠를 생성하는 인공지능 유형이다. 기존 콘텐츠에서의 학습 과정을 훈련이라고 하며, 이는 통계 모델의 생성으로 이어진다. 프롬프트를 제공하면 Gen AI는 이 통계 모델을 사용하여 예상되는 응답을 예측하고 이를 통해 새로운 콘텐츠를 생성한다.

Generative AI의 힘은 트랜스포머(Transformer)에서 나온다. 트랜스포머는 2018년 자연어 처리의 혁명을 일으켰다. 트랜스포머 모델은 인코더와 디코더로 구성된다. 인코더는 입력 시퀀스를 인코딩하고, 디코더는 관련 작업을 위해 표현을 디코딩하는 방법을 학습한다.

“환각(Hallucinations)”

트랜스포머에서 가끔 환각이 발생한다. 환각이란 모델이 생성한 의미 없거나 문법적으로 잘못된 단어나 구를 말한다.

환각은 데이터 학습이 충분하지 않을 때, 노이즈나 오염된 데이터로 훈련될 때, 충분한 문맥이 제공되지 않았을 때, 제약이 충분하지 않았을 때 발생할 수 있다.

“프롬프트 (Prompt)”

프롬프트는 LLM에게 입력으로 주어지는 짧은 텍스트로서, 모델의 출력을 다양한 방식으로 제어하는 데 사용될 수 있다. 프롬프트 디자인은 대규모 언어 모델(LLM)에서 원하는 출력을 생성하기 위해 프롬프트를 생성하는 과정이다.

Generative AI는 피드한 훈련 데이터에 많이 의존한다. 입력 데이터의 패턴과 구조를 분석하여 “학습”한다.

“모델 유형”

  1. 텍스트에서 텍스트로 (Text to Text)
  2. 텍스트에서 이미지로 (Text to Image)
  3. 텍스트에서 비디오, 3D로 (Text to Video, Text to 3D)
  4. 텍스트에서 태스크로 (Text to Task)
  5. 기반 모델 (Foundation Model)

“기반 모델 (Foundation Model)”

기반 모델은 다양한 다운스트림 태스크에 쉽게 적용할 수 있는 대규모 AI 모델로, 감정 분석, 이미지 캡션, 객체 인식 등 다양한 분야에 적용할 수 있다. 기반 모델은 헬스케어, 금융, 고객 서비스 등 다양한 산업을 혁신할 수 있는 잠재력을 갖추고 있다. 이를 통해 사기 탐지 및 개인화된 고객 지원에도 사용될 수 있다.

“Vertex AI”

Vertex AI는 Foundation Models을 포함하는 Model Garden을 제공한다. 언어 Foundation Models에는 채팅 및 텍스트용 PaLM API가 포함되어 있다. Vision Foundation 모델에는 안정적인 확산이 포함되어 있으며, 이는 텍스트 설명에서 고품질 이미지를 생성하는 데 효과적임이 입증되었다.

Vertex AI Studio는 다양한 도구와 리소스를 제공하여 개발자가 생성형 AI 모델을 만들고 배포할 수 있도록 돕는다. 미리 훈련된 모델 라이브러리, 모델 파인튜닝 도구, 프로덕션 배포 도구, 개발자들이 아이디어를 공유하고 협력할 수 있는 커뮤니티 포럼 등이 제공된다.

“PaLM API”

PaLM API를 사용하면 Google의 대규모 언어 모델 및 Gen AI 도구를 테스트하고 실험할 수 있다. 프로토타이핑을 빠르고 쉽게 하기 위해 개발자는 MakerSuite와 PaLM API를 통합할 수 있으며, 이를 통해 그래픽 사용자 인터페이스를 통해 API에 액세스할 수 있다. 이 스위트에는 모델 훈련 도구, 모델 배포 도구, 모델 모니터링 도구 등 다양한 도구가 포함되어 있다.

“제미나이(Gemini)”

제미나이(Gemini)는 다중 모달 AI 모델로서, 전통적인 언어 모델에 국한되지 않는다. 이미지를 분석하고 오디오의 뉘앙스를 이해하며 프로그래밍 코드를 해석할 수 있다. 이는 제미나이(Gemini)가 이전에는 불가능했던 복잡한 작업을 수행할 수 있도록 한다. 고급 구조 덕분에 제미나이(Gemini)는 매우 유연하고 확장 가능하며, 다양한 응용 프로그램에 적합하다. Model Garden은 지속적으로 새로운 모델을 포함하여 업데이트된다.

해당 과정은 약 20분 정도의 짧은 강의로 구성이 되어 있으며, 생성형 인공지능(AI)가 무엇인지에 대해서 간략하게 다루고 있으며, 사용자가 직접 체험해볼 수 있는 ”생성형 인공지능“까지도 소개하고 있다. 인공지능의 원리 등에 대해서는 직접적으로 다루고 있지 않기에 ”입문용“으로 참고하기에 좋은 영상이다.

해당 영상에서 소개한 생성형 인공지능과 함께 현재 대중적으로 많이 쓰이는 ”생성형 인공지능“을 아래와 같이 정리해 볼 수 있다. 생성형 인공지능을 통해서 코드 수정이 가능하기도 하고, 스토리를 만들어 낼 수 있기도 하며, 번역을 할 수 있기도 하다.

여기까지 “코세라”에서 무료로 제공하고 있는 인공지능 입문 강의 “Introduction to Generative AI”에 대해서 정리해보았다. 해당 강의는 구글에서 제공하고 있으며, 현재도 ”코세라“ 사이트에서 무료로 수강할 수 있다.

“Introduction to Generative AI”