LLM 모델 정의

LLM(Large Language Model)
• 대규모 언어 모델의 약자임
• 인공지능 분야에서 사용되는 기술임
• 대량의 텍스트 데이터를 학습하여 자연어 처리 작업을 수행할 수 있음
• 텍스트 생성, 기계 번역, 감정 분석, 질문에 대한 답변 제공 등 다양한 언어 관련 작업 처리 가능
• 언어의 구조와 문맥을 이해하고, 새로운 텍스트를 생성하거나 관련 정보를 추출하는 능력 보유
• 주로 딥러닝 기법인 트랜스포머(Transformer) 아키텍처를 사용하여 구축됨
• GPT(Generative Pre-trained Transformer) 시리즈, BERT(Bidirectional Encoder Representations from Transformers) 등
유명 모델 포함
• 인공지능이 인간의 언어를 이해하고 사용하는 방식에 혁신적인 발전을 가져옴
• 다양한 산업과 분야에서 응용 가능성이 크게 확장됨

Encoder와 Decoder로 이루어진 Transformer https://jalammar.github.io/illustrated-transformer/

The Illustrated Transformer

Discussions: Hacker News (65 points, 4 comments), Reddit r/MachineLearning (29 points, 3 comments) Translations: Arabic, Chinese (Simplified) 1, Chinese (Simplified) 2, French 1, French 2, Italian, Japanese, Korean, Persian, Russian, Spanish 1, Spanish 2,

jalammar.github.io

Instruction following(tuning)

Machine Learning Researcher vs Engineers – What's the Difference?(valohai)

'IT TechStory' 카테고리의 다른 글

java 1.5에서 1.8로 업그레이드 (2)	2024.10.08
파이썬 PIP 경로 오류 발생 시 조치 방법 (0)	2024.07.19
SaaS란 무엇인가 (0)	2024.05.07
Flutter Setting (0)	2024.04.24
OCPP1.6 extend ISO_15118 and PNC (0)	2024.04.03

OTIT Tech & Economy Blog

LLM 모델 정의

'IT TechStory' 카테고리의 다른 글

티스토리툴바

LLM 모델 정의

'IT TechStory' 카테고리의 다른 글

'IT TechStory' Related Articles

티스토리툴바