2024.10.30 AI 필수 용어 11가지

SMALL

AI 필수 용어 11가지

 

1. 대형 언어 모델(LLM, Large Language Model)

 - 광범위한 양의 텍스트 데이터를 학습한 모델

 

 

2. GPT(Generative Pre-trained Transformer)

  •  - 대형 언어 모델이 인간처럼 말하기 위해서는 전문적인 훈련이 필요한데, 이를 잘 수행한 모델이 미국의 인공지능 연구소 OpenAI에서 만든 ChatGPT이다.
  •  - GPT는 '트랜스포머(Transformer)'라는 아키텍처를 기반으로 하며, 이는 인간의 언어 처리 방식을 모방한 자연어 처리 분야의 심층 신경망 구조를 말한다.

 

3. 매개변수(Parameter)

ChatGPT와 같은 서비스의 핵심 경쟁력은 사용자가 원하는 최적의 답을 제공하는 데에 있는데,

이를 위해서는 정밀하게 설계된 함수가 필요하다. 이 함수는 결과값에 영향을 미치는 '매개변수'로 이루어져 있다.

매개변수 = 요리의 레시피라고 생각하면 이해하기 쉽다.

답변의 정확도를 높이기 위해서는 각 변수의 가중치를 적절히 조정해야 한다.

어떤 변수들은 입력 데이터에 의존하지 않고 고정된 값을 가지도록 편향시키기도 한다.

일반적으로 매개변수의 양이 많을 수록 정답에 가까운 답을 도출할 수 있지만, 너무 많으면 과적합(Overfitting) 문제가 발생할 수 있다.

 

 

4. 프롬프트 엔지니어링(Prompt Engineering)

AI에 주어지는 입력, 질문이나 명령을 프롬프트(Prompt)라 부른다.

어떻게 질문을 하느냐에 따라 결과가 크게 달라질 수 있는데 이를 효과적으로 활용하여 업무생산성을 높이기 위해 프롬프트 엔지니어라는 직업이 탄생했다. 

프롬프트 엔지니어는 최적의 결과값을 얻어낼 수 있도록 효과적인 프롬프트 값을 입력하는 업무를 담당하며, 이 과정에서 사용되는 기술을 '프롬프트 엔지니어링'이라고 부른다.

 

  예시)

    - 효과적이지 못한 질문 : 이탈리아 여행 계획을 세워주세요

    - 효과적인 질문 : 이탈리아 여행을 위한 7일 일정 계획을 세워주세요. 저는 로마, 피렌체, 베니스를 꼭 방문하고 싶으며, 역사적인 장소와 현지 음식을 경험하고 싶습니다. 게획표는 표 형태로 작성해주세요.

 

 

5. 토큰

토큰은 대형 언어 모델의 핵심 구성 요소 중 하나로 데이터를 처리하는 기본 단위를 말한다.

단어, 문자, 문장의 일부를 포함한다. 

반드시 명확한 의미를 내포하지 않을 수 있다는 점에서 형태소의 개념과는 다르다.

토큰 구분 방식은 모델의 설계와 목적에 따라 달라지기 때문에 명확한 기준을 알기 어렵다.

 

ChatGPT의 API를 사용할 때 토큰을 기준으로 사용량을 측정한다. 

이때 같은 의미의 내용을 영어로 작성할 때보다 한글로 작성할 때 더 많은 토큰이 사용된다.

이것은 한글로 입/출력을 할 때 더 많은 비용이 발생할 수 있다는 것을 의미한다.

 

 

6. 플러그인(Plugins)

기존의 소프트웨어나 시스템에 추가적인 기능을 제공하는 소프트웨어 컴포넌트를 말한다.

예시로 웹 브라우저를 할 때 설치하는 확장 프로그램이 있다.

ChatGPT의 플러그인 개수는 약 940여개에 달하고 계속 증가하고 있다.

 

  ▼  OpenAI에서 대표적으로 설명하는 플러그인

  • 익스피디아(Expedia) : 익스피디아 데이터 기반 숙박시설, 관광명소 등의 여행 관련 정보 제공
  • 웹 브라우저(Web Browser) : 해당 플러그인을 통해 학습된 날짜 이후의 정보에 대해 인터넷 검색이 가능하다.
  • 코드 인터프리터(Code Interpreter) :  ChatGPT에 파이썬 코딩 기능을 추가한다. 파일 업로드 및 다운로드를 지원하며, 실행된 코드는 보안이 강화된 환경에서 처리된다. 이를 통해 ChatGPT는 수학 문제 해결, 데이터 분석 및 시각화, 파일 형식 변환과 같은 다양한 코딩 작업을 수행할 수 있다.

 

7. GPU(Graphics processing unit)

AI기업에서 모델을 학습시키는 데에 복잡한 수학적 연산과 데이터를 빠르게 처리할 수 있는 기술이 필요하기 때문에 GPU가 필요하다. GPU의 강점은 '병렬 처리 능력'이다.

CPU는 강력한 연산능력을 가지고 있지만, 한번에 하나의 작업을 처리하는 데에 최적화되어 있다. 

GPU는 수백, 수천 개의 작은 코어를 가지고 있어 많은 양의 연산을 동시에 처리할 수 있다.

 

예시) 1+2+3+4+5+6+7+8+9

CPU : 1+2를 하고 3, 그다음 4, ~ 9까지 순차적으로 더한다. 총 8번의 연산 후 최종 결과 도출

GPU : (1+2+3) (4+5+6) (7+8+9)의 연산을 동시 수행 후 세 결과를 더한다. 2단계에 걸쳐 최종 결과 도출

 

 

8. 환각(Hallucinate)

실제 데이터나 사실을 반영하지 않고, 비현실적이거나 오류를 포함한 내용을 만들어내는 경우를 환각, 할루시네이션이라고 한다.

예시)

 - 비현실적인 내용 : 사과의 씨를 심으면 배가 자란다.

 - 정보의 오류 : 세종대왕은 맥북을 활용하여 한글을 창제했다.

 - 상황의 오류 : 여행계획을 짜달라고 요청했을 때, 여행은 참 좋은 것입니다.라는 답변을 생성하는 경우

이러한 현상은 생성형 AI의 치명적 결함으로 꼽히고, 아직까지 해결책이 묘연한 상황이다.

 

 

9. 일반 인공 지능(Artificial General Intelligence, AGI)

현재 널리 사용되는 AI는 좁은 의미의 인공지능을 말한다.

일반 인공 지능은 특정 분야에만 특화되어 있는 것이 아닌, 인간과 유사한 지능 수준을 가진 인공 지능을 말한다.

슈퍼 인공 지능 (Artificial Super Intelligence, ASI)은 일반 인공 지능보다 한 단계 발전한 개념으로 인간보다 똑똑한 인공지능을 말한다.

 

 

10. 멀티 모달(Multi-Modality)

텍스트, 음성, 이미지 등을 모달리티라 부르며, 다양한 형태의 모달리티를 입력 및 출력에 제한 없이 활용하는 방식을 멀티 모달(리티)라고 한다.

STT(Speech To Text) : 음성을 텍스트로 변환해주는 기술

TTS(Text To Speech) : 텍스트를 음성으로 변환해주는 기술

 

 

11. 인간 피드백 기반 강화학습(Reinforcement Learning from Human Feedback, RLHF)

강화학습이란 AI모델이 특정 환경에서 시행착오를 통해 최적의 행동방식을 학습하는 과정을 말한다.

인간 피드백 기반 강화학습은 AI가 특정 작업을 수행한 후, 인간 평가자로부터 직접적인 피드백을 받아 인간의 판단과 가치관을 반영하여 보다 정교하고 인간적인 반응을 학습할 수 있게 된다.

 

 

[오늘의 소감]

국민취업지원제도 서류 제출을 위해 채용 사이트를 찾아보니까 내가 사는 지역에서 데이터 분석가를 채용하는 기업이 거의 없었다. 구인을 하더라도 경력자만 구인중인 것을 보고 주말동안 많은 고민을 했다.

나는 이번 부트캠프로 진로를 바꿀 계획이었는데 채용공고가 적은 것은 치명적인 단점으로 보였다.

그래서 동일한 개강날짜에 다른 수업을 찾아보니 AI 개발자 트랙이 있었고, 해당 직군은 신입 구인도 보이고 채용공고가 상대적으로 많았다.

 

결국, 주말이 끝나고 스파트라팀과 고용센터에 문의하여 데이터 분석가 트랙에서 AI 서비스 개발자 트랙으로 변경 요청을 하게 되었다. 데이터분석가 트랙으로 사전캠프를 일주일 정도 진행했었는데, AI 개발자 사전캠프는 11.4부터 참가하기로 했다. 어쩌다보니 다른분들보다 2주 늦게 시작하게 되어 걱정이 태산이다.

그래서 혼자서 스파르타에서 제공한 AI를 이해하기 위한 필수용어 11가지를 보고 혼자 정리하는 시간을 가졌다.

 

 

LIST

'Today I learned' 카테고리의 다른 글

2024.11.07 TIL 4(AI_9기)  (3) 2024.11.07
2024.11.06 TIL 3(AI_9기)  (0) 2024.11.06
2024.11.05 TIL 2(AI_9기)  (2) 2024.11.05
2024.11.04 TIL 1(AI_9기)  (9) 2024.11.04
2024.10.31 파이썬과 파이참을 설치하다  (0) 2024.10.31