본문 바로가기

Python/NLP&LLM15

LLM 주요용어 : In-context learning 1. Zero-Shot : 프롬프트에 추가적인 설명예제없이 바로 문제를 해결하려는 세팅 2. One-Shot : 프롬프트에 추가적인 설명 예제 1개와 함께 문제를 해결하려는 세팅 3. Few-Shot : 프롬프트에 추가적인 설명예제 n개와 함께 문제를 해결하려는 세팅 4. 추가적인 Fine-Tuning 없이도 In-Context Learning 만으로 원하는 결과를 얻는 것이 가능해짐. 어떻게 프롬프트를 작성하면 LLM에게서 더 효과적으로 정보를 얻어내는 프롬프트를 작성할 수 있는지를 연구하는 프롬프트 엔지니어링(Prompt-Engineering) 기법이 활발히 연구되기 시작함. 2024. 4. 28.
LLM 주요용어 : 토큰(Token) 1. 텍스트를 구성하는 개별 단위 의미. ex) 나는 학교에 간다 → 나는, 학교에, 간다 토큰으로 나눌 수 있음.2. 토큰화(Tokenization) : 주어진 텍스트를 개별 토큰들로 분리하는 과정을 의미. 토큰화 기준은 주로 공백, 구두점, 특수문자등을 기준으로 함. 한국어에서는 현태소 분석을 통해 토큰화 수행.3. 토큰 종류    (1) 단어 토큰    (2) 문장 토큰    (3) 문단 토큰    (4) 형태소 토큰 : 언어의 의미를 가진 가장 작은 단위. 한국어의 경우 "가다"를 "가"와 "다"로 분리. 4. 토큰화의 중요성 : 대부분의 NLP 작업에서 원시 텍스트를 직접 다루기보다는 텍스트를 토큰화하여 각 토큰을 기반으로 처리. 이는 문장이나 텍스트의 구조와 의미를 파악하는 데 도움을 줌. 또.. 2024. 4. 28.
LLM : 편향(Bias)와 할루시네이션(Hallucination) 1. LLM은 다양한 문제와 과제들을 처리할 수 있지만, 편향과 할루시네이션과 같은 문제가 있음 2. 편향(Bias) : 잘못된 상식을 가질 수 있는 것.  (1) 데이터로부터의 편향 : LLM은 대규모 데이터 셋에서 훈련되기때문에 그 데이터 셋에 내재된 사회적, 문화적 편향을 학습할 수 있음 → 성별, 인종, 지역등에 대한 편견 반영가능성이 높음 ex) 간호사 라는 단어로 여자라고 판단   (2) 확인편향(Confirmation Bias) : 사용자의 의견이나 선입견을 더 깊게 뿌리 내릴 수 있음. 예를 들어 모델에게 특정 주제에 대한 의견을 물으면 사용자가 원하는 대답을 하려고 하는 경향이 있음   (3) 편향의 증폭 : 모델이 특정 집단이나 개념에 대한 더 극단적인 또는 편향된 정보를 생성하거나 전.. 2024. 4. 28.
LLM(Large Language Model) 1. 대규모 데이터 세트에서 훈련된 인공지능 언어 2. 자연어처리(NLP : Natural Language Processing ) : 텍스트 생성, 분류, 번역, 질문응답, 감정 분석 등 수백만개 이상의 매개변수를 가지고있음 3. LLM을 위해 대규모 텍스트 데이터와 대규모 컴퓨팅 리소스가 필요함 4. 대부분의 LLM 은 트랜스포머(Transformer) 딥러닝 모델을 사용함 5. LLM 학습 기본원리 : 언어모델(Language Model)은 다음에 올 단어가 무엇인지 예측하는 것임. 6. 파운데이션 모델(Foundatation Model) : OpenAI(GPT-1~4), META/FaceBook(Llama1~2), Google(PaLM) 7. 우발상황 및 문제 발언/논란이 발생하지 않도록 Reuin.. 2024. 4. 28.
LangChain 이란 □ LLM 기반 애플리케이션을 쉽게 개발 가능한 프레임워크 □ 언어모델, 데이터 파이프라인 등 가양한 도구를 통합지원(각 도구를 chain 으로 연결) □ LCEL( LangChain Expression Language )구성 : 사용자 입력(프롬프트)를 받아 대규모 언어 모델(LLM)을 통해 적절한 응답 생성 입력 모델 출력 Prompt LLM(Large Language Model) Output #라이브러리 import os #가상환경 라이브러리 from dotenv import load_dotenv #가상환경 라이브러리 from langchain_core.prompts import ChatPromptTemplate #prompt 라이브러리 from langchain_openai import ChatO.. 2024. 4. 11.
Chat_gpt API 연동방법 □ https://openai.com/product 접속 □ API>Overview 클릭 ※ 계정이없다면 계정생성 후 로그인할 것 □ API>Overview 클릭 □ 기본적으로 처음 계정생성 후 로그인하면 3개월간 이용할수 있는 $5 가량의 크레딧을 준다고함. 따라서 로그인 후 아래 이미지와 같이 참고하여 잔여크레딧 확인. (작성자의 경우에는 3개월 뒤 크레딧이 소멸되어 $5 충전함) → 최소 충전금액 $5이며, 충전금액만큼 API를 활용할 수 있음 □ API 키 발급 □ API연동관련 코딩 및 ChatGpt 기능구현 #라이브러리 from openai import OpenAI #API키 입력 client = OpenAI( api_key="개인발급키" ) #대화가 끊기지 않도록 while True 사용 w.. 2024. 3. 10.