1. LLM
νΈλμ€ν¬λ¨Έ
2017λ Google Brainνμμ λ€μν μμ°μ΄ μ²λ¦¬(NLP) μμ μ λ€λ£¨λ AI λ₯λ¬λ λͺ¨λΈμ μκ°νμλ€. μ΄λ μΆν BERTλ₯Ό μ΄μ©ν΄ μ μ μ 쿼리λ₯Ό μ’ λ μ μ΄ν΄νλ λ°©ν₯μΌλ‘ κ²μ μμ§μ ν₯μμμΌ°μΌλ©° μ°λ¦¬κ° μμ° μ€μ λ§μ΄ μ¬μ©νμμ κ²μ΄λ€.
μ΄λ¬ν νΈλμ€ν¬λ¨Έλ OpenAiμ Microsoftκ° νλ ₯νμ¬ κΉνλΈμ Copilotκ³Ό κ°μ μ ν리μΌμ΄μ μμλ λ¨μν μ£Όμ, μ½λ μ‘°κ°μΌλ‘λ§ μμ ν μμ€μ½λλ₯Ό μμ±νλ λ°©ν₯μΌλ‘ λ°μ ν΄λκ°κΈ°λ νμλ€.
```
from transformers import pipeline
def classify_text(email):
"""
Use Facebook's BERT model to classify an email into "spam" or "not spam"
Args:
email(str) : The email to classify
Returns:
str: The classification of the email
"""
# COPILOT μμ : μ΄ μ£Όμ μ΄μ μ λͺ¨λ κ²μ COPILOTμ μν μ
λ ₯
classifier = pipeline(
'zero-shot-classification', model='facebook/bart-large-mnli'
labels = ['spam', 'not spam']
hypothesis_template = 'This email is {}.'
results = classifier(
email, labels, hypothesis_template=hypothesis_template
)
return results['labels'][0]
)
# COPILOT λ
```
μμ 1-1 : Metaμ BART LLMμμ κ²°κ³Όλ₯Ό μ»κΈ° μν΄ Copilot LLM μ¬μ©
ν΄λΉ μμ λ₯Ό μ μ΄ν΄λ³΄λ©΄ Copilotμ νμ΄μ¬ ν¨μ μ μμ λͺλͺ μ£Όμλ§ μμ±ν ν λͺ¨λ μ½λλ Copilotμ΄ μμ±νμλ€. μ΄λ κ² LLMμ΄ μ°λ¦¬ μ£Όμμμ νΈμν μΆ, κ°λ°μ μ 곡ν΄μ£Όλλ° μ΄λ₯Ό μ νμ©νκΈ° μν΄μ LLMμ λ΄λΆμ λν΄ μ νν μ νμκ° λ μλ€.
1.1 LLMμ΄λ?
λκ·λͺ¨ μΈμ΄λͺ¨λΈμ νΈλμ€ν¬λ¨Έ μν€ν μ²μμ νμλ AI λͺ¨λΈλ‘, μ¬λμ μΈμ΄, μ½λ λ±μ μ΄ν΄νκ³ μμ±νκΈ° μν΄ μ€κ³λμλ€. ν΄λΉ λͺ¨λΈλ€μ λ°©λν μμ ν μ€νΈ λ°μ΄ν°λ‘ νμ΅νλ©°, μ¬λ μΈμ΄μ 볡μ‘μ±, λμμ€ λ±μ ν¬μ°©κ°λ₯νλ€.
μ€μ ν μ μλ μμ μ ν μ€νΈ λΆλ₯λΆν° μμ±κΉμ΄ μΈμ΄ κ΄λ ¨ μμ μ λμ λ²μμμ μνν μ μλ€.
κ° μ°μ μμλ λ€μκ³Ό κ°μ λ°©μμΌλ‘λ νμ©λλ€.
- μλ£: μ μ μ무 κΈ°λ‘ μ²λ¦¬, μμμν λ§€μΉ, μ μ½ λ°κ²¬
- κΈμ΅ : μ¬κΈ° νμ§, κΈμ΅ λ΄μ€μ κ°μ λΆμ, νΈλ μ΄λ© μ λ΅
- μ±λ΄, κ°μ μ΄μμ€ν΄νΈ
ν΄λΉ κ·Έλ¦Όμ NLPμμμ λ°μ λ€μ λν κ°μλ‘ λͺ¨λ κ²μ κ²°κ΅ νΈλμ€ν¬λ¨Έμ λ°λͺ
μΌλ‘ μ΄μ΄μ§λ κ²μ΄λΌκ³ μ΄ν΄νλ©΄ λλ€.
2017λ μ΄νλΆν° νλμ νΈλμ€ν¬λ¨Έ μν€ν μ²λ μ΄μ NLP λͺ¨λΈλ‘λ κ°λ₯νμ§ μμλ ν° λ°μ΄ν°μ μ λν νλ ¨ μκ°μ μ§μν μ μμλ€. ν΄λΉ κ³Όμ μμ λ¨μ΄ κ°μ μ’ μμ±, λ¬Έλ§₯ κ΄κ³λ₯Ό ν¬μ°©ν μ μκ² νλ μ ν μ΄ν μ μ μ¬μ©νμ¬ μνμ€ λ΄ κ° λ¨μ΄κ° λ€λ₯Έ λͺ¨λ λ¨μ΄μ μ£Όμλ₯Ό κΈ°μΈμ΄κ² νλλ‘ νμλ€. (λ¬Έλ§₯μ μ°Ύλλ‘!)
μ΄λ¬ν νΈλμ€ν¬λ¨Έ μν€ν μ²μ λ±μ₯μ λΌμ΄λΈλ¬λ¦¬μ ν¨ν€μ§λ€μ΄ λ°°ν¬λλ©° μ΄λ¬ν λͺ¨λΈλ€μ μ λ¬Έκ°λ€μ΄ μ§μ μ¬μ©, νλ ¨, 곡μ λ₯Ό κ°λ₯νκ² νμ¬ λ°μ μ κ°μν μμΌ°λ€. μ€μ λ‘ Hugging Faceμ κ°μ μΈκΈ° μλ LLM μ μ₯μμ λ±μ₯μΌλ‘ κ°λ ₯ν μ€ν μμ€ λͺ¨λΈμ λν μ κ·Όμ μ 곡νλ€.
1.1.1 LLM μ μ
LLMκ³Ό νΈλμ€ν¬λ¨Έκ° ν΄κ²°νκ³ μλ ꡬ체μ μΈ NLP μμ μ λ€μν μμ μ ν΄κ²°ν μ μλ κΈ°λ°μ μ 곡νλ€.
μΈμ΄ λͺ¨λΈλ§ μμ
NLPμ νμ λΆμΌλ‘, μ§μ λ μ΄ν λ΄μ ν ν° μνμ€ κ°λ₯μ±μ μμΈ‘νκΈ° μν ν΅κ³/λ₯λ¬λ λͺ¨λΈμ μμ±μ ν¬ν¨νλ€. λ€μμ λ μ’ λ₯μ μΈμ΄ λͺ¨λΈλ§ μμ μ΄ μλ€.
μκΈ°νκ· μΈμ΄ λͺ¨λΈ
μλ €μ§ μ΄νμμ μ£Όμ΄μ§ λ¬Έμ₯μ λ°λ‘ λ€μμ κ°μ₯ κ°λ₯μ± μλ ν ν°μ μμ±νλλ‘ νλ κ²μΌλ‘ μ΄μ ν ν°λ§μ κΈ°λ°μΌλ‘ λ€μ ν ν°μ μμΈ‘νλλ‘ νλ ¨νλ€.
- νΈλμ€ν¬λ¨Έ λͺ¨λΈμ λμ½λ λΆλΆ
- μ΄ν μ ν€λκ° μμ μ¨ ν ν°λ§ λ³Ό μ μλλ‘ μ 체 λ¬Έμ₯μ λ§μ€ν¬ μ μ©
- ν μ€νΈ μμ±μ μ΄μμ
- μ : GPT
μλ μΈμ½λ© μΈμ΄ λͺ¨λΈ
μλ €μ§ μ΄νμμ λ¬Έμ₯μ μ΄λ λΆλΆμ΄λ λλ½λλ λ¨μ΄λ₯Ό μ±μ°λλ‘ λͺ¨λΈμ μμ²νλ κ²μΌλ‘ μμλ λ²μ μ μ λ ₯ λ΄μ©μΌλ‘λΆν° κΈ°μ‘΄ λ¬Έμ₯μ μ¬κ΅¬μ±νλλ‘ νλ ¨νλ€.
- μ 체 λ¬Έμ₯μ μλ°©ν₯ ννμ μμ±νλ€.
- λ€μν μμ μ νμΈνλλ μ μμ§λ§ μ£Όλ‘ λ¬Έμ₯ λΆλ₯, ν ν° λΆλ₯μ μ¬μ©λλ€.
- μ : BERT
μμ½
LLMμ κ²°κ΅ μκΈ°νκ·, μλ μΈμ½λ© λλ μ΄ λκ°μ§μ μ‘°ν©μ΄ λλ μΈμ΄ λͺ¨λΈμ΄λ€. LLMμ μ μμ νΉμ§μ ν° ν¬κΈ°μ κ΄λ²μν νμ΅ λ°μ΄ν°μ μΌλ‘, μ΄λ₯Ό ν΅ν΄ ν μ€νΈ μμ±, λΆλ₯μ κ°μ 볡μ‘ν μΈμ΄ μμ μ νμΈνλμμ΄ λμ μ νλλ‘ μνν μ μλ€.
[!μΈκΈ° μλ LLMμ λΉκ΅] >
1.1.2 LLM μ£Όμ νΉμ§
κΈ°μ‘΄μ νΈλμ€ν¬λ¨Έ μν€ν μ²λ 2017λ μ κ³ μλ μνμ€-ν¬-μνμ€ λͺ¨λΈμ΄λ©°λ€μ λ κ°μ§ κ΅¬μ± μμλ‘ μ΄λ£¨μ΄μ Έ μλ€.
- μΈμ½λ : raw textλ₯Ό λ°μλ€μ¬ ν΅μ¬ κ΅¬μ± μμλ‘ λΆλ¦¬νκ³ , ν΄λΉ κ΅¬μ± μμλ₯Ό 벑ν°λ‘ λ³ννλ μ 무λ₯Ό λ΄λΉνλ©°, μ΄ν μ μ ν΅ν ν μ€νΈμ λ§₯λ½μ μ΄ν΄νλ€.
- λμ½λ : μμ λ νμμ μ΄ν μ μ μ¬μ©ν΄ λ€μμ μ¬ μ΅μ μ ν ν°μ μμΈ‘νμ¬ ν μ€νΈ μμ±μ λ°μ΄λ μ±λ₯μ 보μΈλ€.

μ κ·Έλ¦Όκ³Ό κ°μ΄ νΈλμ€ν¬λ¨Έλ λ λΉ λ₯Έ νλ ¨, μΌλ°ν λ° λ λμ μ±λ₯μ μν κΈ°ν νμ κ΅¬μ± μμλ€μ΄ μ‘΄μ¬νλ€. μ€λλ μ LLMμ λλΆλΆ κΈ°μ‘΄ νΈλμ€ν¬λ¨Έμ λ²νμΌλ‘ μ‘΄μ¬νλ€. BERTμ GPTμ κ°μ λͺ¨λΈλ€μ νΈλμ€ν¬λ¨Έλ₯Ό μΈμ½λ, λμ½λλ‘ κ°κ° λΆν΄νκ³ μ΄ν΄νμ¬ μμ±ν¨μΌλ‘ λ°μ΄λ λͺ¨λΈμ ꡬμΆνκ³ μλ€.
μΈμ½λμ λμ½λλ₯Ό ν¨κ» μ¬μ©ν μ 체 λͺ¨λΈμ μνμ€-ν¬-μνμ€ λͺ¨λΈμ΄ λλ€.
μΌλ°μ μΈ LLM μ£Όμ μΉ΄ν κ³ λ¦¬
μμμ λ§ν LLMμ μ£Όμ μΉ΄ν κ³ λ¦¬λ₯Ό λ€μ μ 리νμλ©΄ λ€μκ³Ό κ°λ€.
- μκΈ°νκ· λͺ¨λΈ : μ΄μ ν ν°μ κΈ°λ°μΌλ‘ λ¬Έμ₯μ λ€μ ν ν°μ μμΈ‘νλ€. μ£Όμ΄μ§ λ§₯γ·λ½μ λ°λΌμ μΌκ΄μ± μλ ν μ€νΈ μμ±μ ν¨κ³Όμ μ΄λ€. μ£Όλ‘ GPTμ κ°μ λͺ¨λΈμ΄λ€.
- μλ μΈμ½λ© λͺ¨λΈ : μ λ ₯ ν ν° μ€ μΌλΆλ₯Ό κ°λ¦¬κ³ λ¨μμλ ν ν°μΌλ‘λΆν° μμΈ‘νμ¬ λ¬Έλ§₯μ μλ°©ν₯μΌλ‘ μ΄ν΄νμ¬ ννμ ꡬμΆνλ€. ν ν° κ°μ λ§₯λ½μ κ΄κ³λ₯Ό λΉ λ₯΄κ³ λκ·λͺ¨λ‘ ν¬μ°©νλ λ° λ₯μνλ©° μ£Όλ‘ ν μ€νΈ λΆλ₯ μμ μ μ¬μ©λλ€.
- μκΈ°νκ·μ μλ μΈμ½λ©μ μ‘°ν© : λ€μνκ³ μ μ°ν ν
μ€νΈλ₯Ό μμ±νκΈ° μν΄ μΈμ½λμ λμ½λλ₯Ό ν¨κ» μ¬μ©ν λͺ¨λΈμ΄λ€. μΈμ½λλ₯Ό ν΅ν μΆκ° λ§₯λ½ ν¬μ°© λ₯λ ₯λλΆμ λμ½λ κΈ°λ°μ μκΈ°νκ· λͺ¨λΈλ³΄λ€ μ¬λ¬ λ¬Έλ§₯μμ λ λ€μνκ³ μ°½μμ μΈ ν
μ€νΈλ₯Ό μμ±νλ€. κ·Έ μμλ‘ μλ κ·Έλ¦Όμ T5κ° μ‘΄μ¬νλ€.

λ λ§μ λ¬Έλ§₯μ νμ
LLMμ ꡬμ±, νΈλμ€ν¬λ¨Έμ κΈ°λ₯ μ¬μ©κ³Ό κ΄κ³ μμ΄ λͺ¨λ LLMμ λ¬Έλ§₯μ μ μ¬μ©νλ λͺ©νλ₯Ό κ°μ§λ€. μ¦, μ
λ ₯ ν
μ€νΈμ λ€λ₯Έ ν ν°κ³Ό κ΄λ ¨ν΄ κ° ν ν°μ μ΄ν΄νλ κ²μ΄λ€.

μ΄λ¬ν λͺ©νλ₯Ό μ μννκΈ° μν΄ λ¨μ΄μ μ μμ λ¬Έλ§₯μ κ²°ν©ν΄ κ°λ₯ν κ°μ₯ μλ―Έ μλ ν ν° μλ² λ©μ λ§λ€κΈ° μν΄ λ Έλ ₯νλλ° μ΄ κ³Όμ μμ μκΈ΄ κ³μ°μ΄ μ΄ν μ κ³μ°μ΄λ€. μ΄ν μ κ³μ° λλΆμ λ λ§μ λ¬Έλ§₯μ νμ ν΄ μλ―Έ μλ λ¨μ΄λ₯Ό μ¬μ©ν μ μκ² λμλ€.
1.1.3 LLM μλμ리
LLMμ μ¬μ νλ ¨, νμΈνλ μ λμ λ°λΌ μ±λ₯μ΄ μ²μ°¨λ§λ³μ΄λ€. μ¬μ νλ ¨μ ν΄μΌνλ μ΄μ λ LLMμ΄ μ΄λ€ κ²μ μνκ³ , λͺ»νκ³ , λ§μΆ€ λ°μ΄ν°λ‘ μ λ°μ΄νΈν νμμ±μ μ΄ν΄νκΈ° μν΄ μ‘΄μ¬νλ€.
μ¬μ νλ ¨
μ΄λ¦μ΄ λΆμ¬μ§ κ±°μ λͺ¨λ LLMμ λλμ ν μ€νΈ λ°μ΄ν°λ‘ νΉμ μΈμ΄ λͺ¨λΈλ§ κ΄λ ¨ μμ μ λν΄ μ¬μ νλ ¨λ κ²μ΄λ€. μ΄λ¬ν μ¬μ νλ ¨λλΆμ LLMμ μΌλ°μ μΈ μΈμ΄μ λ¨μ΄ κ°μ κ΄κ³λ₯Ό λ°°μ°κ³ μ΄ν΄νλ€.
μ¦, λͺ¨λ LLMμ μλ‘ λ€λ₯Έ λ§λμΉμ μλ‘ λ€λ₯Έ μμ μ λν΄ νλ ¨λλ κ²μ΄λ€.
μλ₯Ό λ€μ΄ BERTμ κ²½μ° λ κ°μ 곡κ°μ μΌλ‘ μ¬μ© κ°λ₯ν ν μ€νΈ λ§λμΉμΈ μμ΄ μν€λ°±κ³Ό, BookCorpusμμ μ¬μ νλ ¨λμλ€.
- μμ΄ μν€ λ°±κ³Ό : μμ΄ λ²μ μ μν€λ°±κ³Όλ‘ μμ§λ κΈ°μ¬λ€ λͺ¨μμΌλ‘ λ€μν μ£Όμ , μ°κΈ° μ€νμΌμ ν¬ν¨ν΄ μμ΄ ν μ€νΈμ μνμ΄ λλ€.
- BookCorpus : λλμ μμ€, λΉμμ€ μ± λ€μ λͺ¨μμΌλ‘ λ€μν μ₯λ₯΄μ μ± κ³Ό ν¨κ» μ΅μ 2000λ¨μ΄μ κΈΈμ΄λ€μ΄ μ‘΄μ¬νλ€.
μ΄λ¬ν μνλ€μ μ΄μ©ν΄ BERTλ λ κ°μ§ νΉμ ν μΈμ΄ λͺ¨λΈλ§ μμ μμ μ¬μ νλ ¨λμλ€.
- λ§μ€ν¬λ μΈμ΄ λͺ¨λΈλ§ (MLM, μλ μΈμ½λ© μμ ) : BERTκ° νλμ λ¬Έμ₯ μμμ ν ν°μ μνΈμμ©μ μΈμνλλ‘ λμ΄λ€.
- λ€μ λ¬Έμ₯ μμΈ‘ (NSP) : BERTκ° λ¬Έμ₯λ€ μ¬μ΄μμ ν ν°μ΄ μλ‘ μ΄λ»κ² μνΈμμ©νλμ§λ₯Ό μ΄ν΄νλλ‘ λμμ€λ€.

μ΄λ¬ν μ¬μ νλ ¨μΌλ‘ LLMλ€μ΄ μλ‘ κ΅¬λ³μ΄ λμ΄ μ κ³΅μ΄ λλ©° μ°λ¦¬μκ²λ μ μ΄νμ΅μ μ μ©μ΄λΌλ μ μ©ν λ°©μμ 곡μ ν΅ν΄ μ΅κ³ μμ€μ κ²°κ³Όλ₯Ό μ»μ μ μλ€.
μ μ΄νμ΅
λ¨Έμ λ¬λμμ ν μμ μμ μ»μ μ§μμ νμ©νμ¬ λ€λ₯Έ κ΄λ ¨ μμ μ μ±λ₯μ ν₯μμν€λ κΈ°μ
LLMμ λν μ μ΄νμ΅μ ν μ€νΈ λ°μ΄ν°μ ν λ§λμΉμμ μ¬μ νλ ¨λ LLMμ κ°μ Έμ¨λ€. λν, ν μ€νΈ λΆλ₯, μμ±κ³Ό κ°μ νΉμ ν βμ€μ β μμ μ μν΄ μμ νΉμ λ°μ΄ν°λ‘ λͺ¨λΈμ νλΌλ―Έν°λ₯Ό μ λ°μ΄ν°νμ¬ λͺ¨λΈμ νμΈνλνλ κ² λν μ΄μ ν¬ν¨λλ€.
κΈ°λ³Έ μμ΄λμ΄
μ¬μ νλ ¨λ λͺ¨λΈμ΄ μ΄λ―Έ νΉμ μΈμ΄μ μΈμ΄ λ΄ λ¨μ΄ κ°μ κ΄κ³μ λν λ§μ μ 보λ₯Ό νμ΅νκΈ°μ μ΄ μ 보λ₯Ό μλ‘μ΄ μμ μμμ μ±λ₯μ ν₯μμν€κΈ° μν μμμ μΌλ‘ μ¬μ©νλ κ²μ΄λ€. μ΄λ₯Ό μ΄μ©ν΄μ LLMμ μ²μλΆν° λͺ¨λΈμ νλ ¨μν€κΈ° λ³΄λ€ ν¨μ¬ μ μ μμ μμ μ μ°κ΄λ λ°μ΄ν°λ‘ νΉμ μμ μ λν΄μ νμΈνλν μ μλ€. μ΄λ₯Ό ν΅ν΄ LLMνλ ¨μ μν μκ°, μμμ ν¬κ² μ€μΌ μ μλ€.
λ€μ κ·Έλ¦ΌμΌλ‘ μμ½ν μ μλ€.

νμΈ νλ
μ¬μ νλ ¨λ LLMμ νΉμ μμ μ μν΄ νμΈνλν μ μλ€. μ¦, LLMμ μμ μ νΉνλ μλμ μΌλ‘ μμ λ°μ΄ν°μ μμ νλ ¨μμΌ, νΉμ μμ μ μν νλΌλ―Έν°λ₯Ό μ‘°μ νλ κ²μ μλ―Ένλ€. LLMμ μ¬μ νλ ¨λ μΈμ΄μ λν μ§μμ νμ©ν΄ νΉμ μμ μ μ νλλ₯Ό λμ΄λ κ²μ΄λ€.
μ΄λ¬ν λ°©μμ ν΅ν΄ νμΈνλμ΄ νΉμ λλ©μΈ, μμ μμμ μ±λ₯μ ν° ν₯μμ μ΄λ£¨μ΄ μ ν리μΌμ΄μ μ λΉ λ₯΄κ² νμ©λλ κ³κΈ°κ° λλ€.
μ€μ νμΈνλ κ³Όμ μ λ€μ κ·Έλ¦Όκ³Ό κ°κ³ κ³Όμ μ λλΆλΆ λμΌνλ€.

- νμΈνλνλ €λ λͺ¨λΈκ³Ό νμΈνλ νλΌλ―Έν°(νμ΅λ₯ )λ₯Ό κ²°μ νλ€.
- νλ ¨ λ°μ΄ν°λ₯Ό μμ§νλ€.
- μμ€(μ€λ₯μ νλ¨ κΈ°μ€)κ³Ό κΈ°μΈκΈ°(μ€λ₯λ₯Ό μ΅μννκΈ° μν΄ λͺ¨λΈμ μ΄λ»κ² λ³κ²½ν μ§μ λν μ 보)λ₯Ό κ³μ°νλ€.
- μ€λ₯λ₯Ό μ΅μννκΈ° μν΄ λͺ¨λΈ νλΌλ―Έν°λ₯Ό μ λ°μ΄ν°νλ μμ ν μκ³ λ¦¬μ¦μ ν΅ν΄ λͺ¨λΈμ μ λ°μ΄νΈνλ€.
μ΄ν μ
νΈλμ€ν¬λ¨Έλ§μ΄ μλλΌ λ€μν κ°μ€μΉλ₯Ό μ λ ₯μ λ€λ₯Έ λΆλΆμ ν λΉνλ λ₯λ¬λ λͺ¨λΈμμμ λ©μ»€λμ¦
μ΄λ¬ν κ³Όμ μ ν΅ν΄ λͺ¨λΈμ λ²μμ΄λ μμ½κ³Ό κ°μ μμ μν μμ κ°μ₯ μ€μν μ 보λ₯Ό μ°μ μ, κ°μ‘°ν μ μκ² λλ€. μ΄λ λ³Έμ§μ μΌλ‘ μ΄ν μ μ΄ λͺ¨λΈμ΄ λμ μΌλ‘ μ λ ₯μ λ€λ₯Έ λΆλΆμ μ§μ€ν μ μκ² νμ¬, μ±λ₯ ν₯μκ³Ό λ μ νν κ²°κ³Όλ₯Ό μ΄λμ΄λ΄λ κ²μ΄λ€.
[!μ΄ν μ μ μ‘΄μ¬ μ΄μ vs μ΄ν] > μ΄ν μ μ΄ μ‘΄μ¬νκΈ° μ΄μ μλ λλΆλΆμ μ κ²½λ§μ΄ λͺ¨λ μ λ ₯μ λλ±νκ² μ²λ¦¬νλ©°, λͺ¨λΈμ μμΈ‘μ μν΄ μ λ ₯μ κ³ μ λ ννμ μμ‘΄νλ€. νμ§λ§ νλμλ LLMμ΄ λμ μΌλ‘ μ λ ₯ μνμ€μ μ€μν λΆλΆμ μ§μ€ν μ μκ² λμ΄ μ£Όμ μ±λ₯ ν₯μμ ν° λμμ΄ λμλ€.
κ²°λ‘ μ μΌλ‘, LLMμ ν° λ§λμΉμμ μ¬μ νλ ¨λκ³ λλ‘λ νΉμ μμ μ μν΄ λ μμ λ°μ΄ν°μ μμ νμΈνλμ μννλ€. μ΄ κ³Όμ μμ νΈλμ€ν¬λ¨Έκ° μΈμ΄ λͺ¨λΈλ‘μ μ’μ μ±λ₯μ 보μ΄κΈ° μν΄μλ κ³ λμ λ³λ ¬ μ²λ¦¬λ₯Ό ν΅ν΄ λ λΉ λ₯Έ νλ ¨κ³Ό ν μ€νΈμ ν¨μ¨μ μΈ μ²λ¦¬λ₯Ό μνν΄μΌ νλ€.
λν, νΈλμ€ν¬λ¨Έκ° λ€λ₯Έ λ₯λ¬λ μν€ν μ²λ³΄λ€ μ°¨λ³νλλ μ μ ν ν° κ°μ μ₯거리 μμ‘΄μ±κ³Ό κ΄κ³λ₯Ό μ΄ν μ μ μ¬μ©νμ¬ ν¬μ°©ν μ μλ λ₯λ ₯μ΄λ€. μ¦, μ΄ν μ μ μ¬μ©νμ¬ νΈλμ€ν¬λ¨Έ κΈ°λ° LLMμ ν΅μ¬ ꡬμ±μμλ‘ μμ©νλ©°, νλ ¨ κ³Όμ κ³Ό λμ μμ μ¬μ΄μ μ 보λ₯Ό ν¨κ³Όμ μΌλ‘ μ μ§νλ©°(μ μ΄νμ΅) κΈ΄ ν μ€νΈ λΆλΆμ μ½κ² μ²λ¦¬νλ κ²μ΄λ€.
μ΄ν
μ
μ LLMμ΄ λ΄λΆ μΈκ³ λͺ¨λΈκ³Ό μ¬λμ΄ μλ³ν μ μλ κ·μΉμ νμ΅νλ λ° λμμ μ£Όλ κ°μ₯ μ£Όμν μΈ‘λ©΄μΌλ‘ κ°μ£Όλλ€.
μ€μ λ‘ 2019λ
μ€ν νΌλ λνμμ BERTμ νΉμ μ΄ν
μ
κ³μ°μ΄ μΈμ΄νμ μΈ κ΅¬λ¬Έκ³Ό λ¬Έλ² κ·μΉμ μΌμΉν¨μ 보μλ€. μ°κ΅¬μλ€μ BERTκ° λμ¬μ μ§μ λͺ©μ μ΄, λͺ
μ¬μ νμ μ¬ λ° μ μΉμ¬μ λͺ©μ μ΄λ₯Ό μ¬μ νλ ¨λ§μΌλ‘ μμ£Ό λμ μ νλλ‘ νμ
ν μ μμμ νμΈνλ€.

λ λ€λ₯Έ μ°κ΅¬μμλ μ¬μ νλ ¨κ³Ό νμΈνλμ ν΅ν΄ βκ·μΉβλ€μ λ¨μν νμ΅ν μ μλ μ§ νꡬνμλ€. νλ²λ λνμ μ°κ΅¬μλ€μ μ€λΈλ‘ κ²μκ³Ό κ°μ 볡ν©μ μΈ μμ μ λν΄ LLMμ΄ μ€μ λ‘ μ΄μ μ μ€νλ κ²μ λ°μ΄ν°μ λν νλ ¨λ§μΌλ‘ κ²μμ κ·μΉμ μ΄ν΄ν μ μμμ νμΈνμλ€.

μλ² λ©
μμ κ°μ΄ LLMμ΄ νμ΅ν μ μλλ‘ νκΈ° μν΄μ λ°μ΄ν°λ₯Ό κΈ°κ³κ° μ½μ μ μλ κ²μΌλ‘ λ³νν΄μΌνλ€. μ΄λ₯Ό μλ² λ© κ³Όμ μ ν΅ν΄ μ΄λ£¨μ΄μ§λ€.
μλ² λ©μ κ³ μ°¨μ 곡κ°μμμ λ¨μ΄, ꡬμ , ν ν°μ μνμ μΈ ννμ΄λ€.
μμ μλ² λ© μ μμμ λ λμκ° NLPμμμ μλ² λ©μ λ€λ₯Έ λ¨μ΄μμ μλ―Έ, κ΄κ³λ₯Ό ν¬μ°©νλ λ°©μμ΄λΌλ μλ―Έ λν ν¬ν¨νλ€.
μ¬λ¬ μ’ λ₯μ μλ² λ©μ΄ μ‘΄μ¬νλ©° λνμ μΌλ‘ λ€μ λ κ°μ§κ° μ‘΄μ¬νλ€.
- μμΉ μλ² λ© : λ¬Έμ₯μμ ν ν°μ μμΉλ₯Ό μΈμ½λ©
- ν ν° μλ² λ© : ν ν°μ μλ―Έλ₯Ό μΈμ½λ©

LLMμ μ¬μ νλ ¨μ κΈ°λ°μΌλ‘ νμ¬ ν ν°μ λν λ€μν μλ² λ©μ νμ΅νλ©°, νμΈ νλ μ€μ μ΄λ¬ν μλ² λ©μ λ€μ μ λ°μ΄νΈν μ μλ€.
ν ν°ν
ν μ€νΈλ₯Ό κ°μ₯ μμ μ΄ν΄ λ¨μμΈ ν ν°μΌλ‘ λΆν΄νλ κ³Όμ
ν ν°λ€μ μλ―Έλ₯Ό λ΄ν¬ν μ 보 μ‘°κ°μΌλ‘ μ΄ν μ κ³μ°μμμ μ λ ₯μΌλ‘ μ¬μ©λμ΄ LLMμ΄ μ€μ λ‘ νμ΅νκ³ μλνκ² λλ€. ν ν°μ΄ νμ μ 체 λ¨μ΄λ₯Ό λνλ΄λ κ²μ μλμ§λ§ LLMμ μ μ μ΄νλ₯Ό ꡬμ±νκΈ°λ νλ€. μλ₯Ό λ€μ΄ ν ν°μ ꡬλμ (.), κ°λ³ λ¬Έμ(νμ΄), LLMμ΄ μκΈ° μ΄λ €μ΄ λ¨μ΄μ νμ λ¨μ΄(γ γ γ΄γ γΉ)λ₯Ό λνλΌ μ μλ€.
κ±°μ λͺ¨λ LLMμ λͺ¨λΈμ νΉμ μλ―Έλ₯Ό κ°μ§ νΉλ³ν ν ν°μ΄ μ‘΄μ¬νλ€.
- BERT λͺ¨λΈ : [CLS]ν ν°μ΄ μμΌλ©°, BERTλ λͺ¨λ μ λ ₯μ 첫 λ²μ§Έ ν ν°μΌλ‘ μ΄λ₯Ό μλ μ½μ νλ€. μ΄λ μ 체 μΈλ ₯ μνμ€μ λν μΈμ½λ©λ μλ―Έλ₯Ό λνλ΄κΈ° μν¨μ΄λ€.
ν ν°ν κ³Όμ μμλ λμλ¬Έμ λ³νμ΄λΌλ μ μ²λ¦¬ λ¨κ³ λν ν¬ν¨λ μ μλ€. μ΄λ¬ν λμλ¬Έμ λ³νμ λ€μ λ νμ μ΄ μ‘΄μ¬νλ€.
- μλ¬Έμ ν ν°ν : λͺ¨λ ν ν°μ΄ μλ¬Έμμ΄λ©°, λλΆλΆμ μ μΌνΈλ κΈμμμ μ κ±°
- λμλ¬Έμ κ΅¬λΆ : ν ν°μ λλ¬Έμκ° μ μ§λκ³ μ΄ μ νμ΄ ν ν°μ μλ―Έμ μ€μν μ 보λ₯Ό μ 곡ν μ μμ΄ μ±λ₯μ μν₯μ λΌμΉ μ μλ€.

[!λμλ¬Έμμ νΈν₯μ± λ¬Έμ ] > λμλ¬Έμμ κ°λ μ‘°μ°¨ λͺ¨λΈμ λ°λΌ νΈν₯μ±μ λ¬Έμ λ₯Ό λ μ μλ€. ν μ€νΈλ₯Ό μλ¬Έμννκ±°λ μ μΌνΈλ₯Ό μ κ±°νλ κ²μ μΌλ°μ μΌλ‘ μꡬ μ€νμΌμ μ μ²λ¦¬μ΄λ€. κ·Έλ κΈ°μ λ€μν λ§λμΉλ‘ μΆ©λΆν νλ ¨λμ§ μμ μΈμ΄ λͺ¨λΈμ μ΄λ¬ν λ¬Έλ§₯μ μΌλΆλ₯Ό λΆμνκ³ νμ©νλ λ°μ ν° λ¬Έμ κ° μ‘΄μ¬ν μ μλ€. > μ΄λ¬ν μ μ²λ¦¬ νΈν₯μ λ€κ΅μ΄ λͺ¨λΈ(multilingual model)μμ νΉμ μΈμ΄(μ£Όλ‘ μμ΄)μλ μ μλνμ§λ§, λ€λ₯Έ μΈμ΄(νΉν μ μΌνΈ, λμλ¬Έμ ꡬλΆμ΄ μ€μν μΈμ΄)μμλ μ±λ₯ μ ν, μλ―Έ μ곑, λΆκ³΅μ ν κ²°κ³Ό λ±μΌλ‘ μ΄μ΄μ§ μ μμ΅λλ€
μ κ·Έλ¦Όμ ν ν°νμ ν μμ κ·Έλ¦ΌμΌλ‘ LLMμ΄ μ΄ν μ¬μ μ μλ ꡬ문μ μ΄λ»κ² μ²λ¦¬νλμ§μ λν΄ λνλ΄μ£Όκ³ μλ€. μ΄ κ³Όμ μμ μ€μ LLMμμ ν λ²μ μ
λ ₯ν μ μλ ν ν°μ μλ₯Ό μ ννκΈ°μ μ΄λ₯Ό μΌλνλ κ³Όμ μ΄ ν¬ν¨λμ΄ μλ€.
- Sin : μ΄λ¦μ 첫 λΆλΆ
- an : βanβμ΄λΌλ λ¨μ΄μλ λ³κ°μ λΆλΆ λ¨μ΄ ν ν°μΌλ‘ μλ €μ§μ§ μμ λ¨μ΄λ₯Ό λλκΈ° μν μλ¨μΌλ‘ μ¬μ©
μΈμ΄ λͺ¨λΈλ§μ λμ μ λ ¬ + RLHF
μ΅μ μ LLMμ λͺ¨λΈμ μ±λ₯μ λ μ’κ² λ§λ€κ³ , λ³΄λ€ μ€μνκ²λ AIκ° μ¬λμ κΈ°λμ λ°λΌ μλλλ€λ μλ―Έλ‘ μ λ ¬λκ² λ§λ λ€. μ¦, μ μ λ ¬ λ LLMμ μ¬λμ λͺ©νμ μΌμΉνλ λͺ©νλ₯Ό μ§λλ€.
μ΄λ¬ν μΈμ΄ λͺ¨λΈμμμ μ λ ¬μ λͺ¨λΈμ΄ μ¬μ©μμ κΈ°λμ λΆν©νλλ‘ μ λ ₯ ν둬ννΈμ μΌλ§λ μ λ΅λ³νλ μ§λ₯Ό λνλΈλ€. νμ€ μΈμ΄ λͺ¨λΈμ μμ λ§₯λ½μ κΈ°λ°μΌλ‘ λ€μ λ¨μ΄λ₯Ό μμΈ‘νμ§λ§ μ΄λ νΉμ μν©(μ§μ, ν둬ννΈ)μμ λ³λ‘ μ μ©νμ§ μμ μ μλ€. μ΄λ₯Ό μν΄ μ’ λ μλμ μΈμ΄ λͺ¨λΈμ μ λ ¬νλ μ’μ λ°©λ²μ΄ κ°λ°λκ³ μλλ° μ΄λ¬ν μΈμ΄ λͺ¨λΈ μ λ ¬μ μν ν¬κ΄μ μΈ λ°©λ² μ€ νλλ‘ κ°ννμ΅(RL) μ΄ νλ ¨ κ³Όμ μ ν¬ν¨λκ³ μλ€.
κ·Έ μ€μμλ μΈκ° νΌλλ°± κΈ°λ° κ°ννμ΅ (RLHF) μ μ¬μ νλ ¨λ LLMμ μ λ ¬νλ λ° μΈκΈ° μλ λ°©λ²μΌλ‘ λ μ€λ₯Έλ€. μ΄λ μ¬λμ νΌλλ°±μ μ¬μ©ν΄ μ±λ₯μ ν₯μνλ κ²μ΄λ€. LLMμ κ·Έ μ체μ μΆλ ₯μ μλμ μΌλ‘ μκ³ κ³ νμ§μ νΌλλ°± λ¨κ³(μ¬λ)μμ νμ΅νκ² νμ¬, μ ν΅μ μΈ μ§λ νμ΅μ μΌλΆ νκ³λ₯Ό 극볡νκ² νλ€. μ€μ λ‘ RLHFλ ChatGPTμ κ°μ μ΅μ LLMμμ μ€μν κ°μ μ 보μ¬μ€λ€. μ΄ μΈμλ κ·μ½ AIλ₯Ό νμ©νμ¬ AI νΌλλ°±μ ν¬ν¨νλ RLκ³Ό κ°μ μ κ·Όλ² λν λ±μ₯νλ€.
1.2 νμ¬ λ§μ΄ μ¬μ©λλ LLM
BERT, GPT, T5 λ±μ΄ μΈκΈ° μλ LLMμΌλ‘ μ리 μ‘μλλ° μ΄λ€μ νΈλμ€ν¬λ¨ΈλΌλ 곡ν΅μ μ‘°μμ 곡μ νλ©° μν€ν μ² μΈ‘λ©΄μμ μλΉν μ°¨μ΄μ μ μ§λλ€. μ΄λ¬ν νΈλμ€ν¬λ¨Έ κ³μ΄μμμ λ리 μ¬μ©λλ λ²νμΌλ‘λ RoBERTa, BART, ELECTRAκ° μ‘΄μ¬νλ€.
1.2.1 BERT
λ¬Έμ₯μ μλ°©ν₯ ννμ ꡬμ±νκΈ° μν΄ μ΄ν μ λ©μ»€λμ¦μ μ¬μ©νλ μλ μΈμ½λ© λͺ¨λΈμ΄λ€.
ν΄λΉνλ λͺ¨λΈμ λ¬Έμ₯ λΆλ₯, ν ν° λΆλ₯ μμ μ λ°μ΄λ μ±λ₯μ 보μ¬μ€λ€.
BERTλ νΈλμ€ν¬λ¨Έμ μΈμ½λλ§ μ¬μ©νκ³ λμ½λλ₯Ό 무μνκΈ°μ μμ²λκ² λ§μ μμ ν
μ€νΈλ₯Ό λ§€μ° λΉ λ₯΄κ² μ²λ¦¬ν μ μλ€. κ·Έλ κΈ°μ BERT κΈ°λ°μ μν€ν
μ²λ μ°λ¦¬κ° μμ λ‘μ΄ ν
μ€νΈλ₯Ό μμ±ν νμκ° μλ κ²½μ°, λλμ λ§λμΉλ₯Ό λΉ λ₯΄κ² μμ
, λΆμνλ κ²½μ°μ μ ν©νλ€.
BERTμ체μμ ν μ€νΈ λΆλ₯, λ¬Έμ μμ½μ μ§ννμ§ μμ§λ§ νμ NLP μμ μ μν μ¬μ νλ ¨λ λͺ¨λΈλ‘ μμ£Ό μ¬μ©λλ€.
1.2.2 GPT-4μ ChatGPT
μ΄ν μ λ©μ»€λμ¦μ μ¬μ©νμ¬ μ΄μ ν ν°μ κΈ°λ°μΌλ‘ μνμ€μμ λ€μ ν ν°μ μμΈ‘νλ μκΈ°νκ· λͺ¨λΈμ΄λ€.
GPTλ μ£Όλ‘ μμ°μ€λ¬μ΄ ν μ€νΈ μμ±μ μ¬μ©λλ€.
GPTλ νΈλμ€ν¬λ¨Έμ λμ½λ λΆλΆμ μμ‘΄νκ³ μΈμ½λλ₯Ό 무μνλ―λ‘, ν λ²μ νλμ ν ν°μ μμ±νλ λ° λ°μ΄λ μ±λ₯μ 보μΈλ€. μ΄λ° λͺ¨λΈμ μλΉν ν° λ¬Έλ§₯ μλμ°λ₯Ό μ£Όμμ λ ν
μ€νΈλ₯Ό μμ±νλ λ°μ μ ν©νλ€. μ¦, μμ λ‘κ² ν
μ€νΈλ₯Ό μμ±ν μ μλ λ₯λ ₯μ΄ νμν κ²½μ°μ μ¬μ©λλ€.
1.2.3 T5
ν μ€νΈ λΆλ₯λΆν° μμ½ λ° μμ±μ μ΄λ₯΄κΈ°κΉμ§ μ¬λ¬ NLP μμ μ μννκΈ° μν΄ μ€κ³λ μμ μΈμ½λ/λμ½λ νΈλμ€ν¬λ¨Έ λͺ¨λΈμ΄λ€.
T5λͺ¨λΈ λ±μ₯ μ΄μ μλ BERT, GPT-2μ κ°μ LLMμ νΉμ μμ
μν μ μ λ μ΄λΈμ΄ λΆμ°©λ λ°μ΄ν°λ₯Ό μ¬μ©ν΄ νμΈνλμ μννμ΄μΌ νλ€.

μ΄λ¬ν T5 λͺ¨λΈμ μΈμ½λλ₯Ό μ¬μ©ν΄ μ λ ₯ ν μ€νΈμ ννμ ꡬμΆ, λμ½λλ₯Ό μ¬μ©ν΄ ν μ€νΈλ₯Ό μμ±νκΈ°μ λΆλ₯, μμ±μ λ€μν NLP μμ μ μνν μ μμλ€. μ¦, ν μ€νΈλ₯Ό μ²λ¦¬νκ³ μ΄ν΄νλ λ₯λ ₯κ³Ό λλΆμ΄ μμ λ‘κ² ν μ€νΈλ₯Ό μμ±νλ λ₯λ ₯ λͺ¨λκ° νμν λ μ¬μ©νλ€.
μ΄λ¬ν T5λ νμΈνλ μμ΄λ μ¬λ¬ μμ μ μννκΈ°μ λ€μ¬λ€λ₯ν LLM κ°λ°μ μ΄μ§μ κ° λμλ€. μ€μ λ‘ GPT-3λ μ΄λ¬ν λ₯λ ₯μ μλνμλ€.
1.3 λλ©μΈ νΉν LLM
νΉμ λλ©μΈμμ νλ ¨λ LLMμ λλ©μΈ νΉν LLMμ΄λΌ λΆλ¦°λ€. μ£Όλ‘ μλ¬Όν, κΈμ΅κ³Ό κ°μ νΉμ μ£Όμ μμμμ νλ ¨λμλ€. μΌλ°μ μΈ λͺ©μ μ LLMκ³Ό λ€λ₯΄κ², νλ ¨λ°μ λλ©μΈ λ΄μμ μ¬μ©λλ νΉμ μΈμ΄, κ°λ μ μ΄ν΄νκΈ° μν΄ μ€κ³λλ€.
BioGPT
> ν΄λΉ λͺ¨λΈμ λλ©μΈ νΉν LLMμ ν μλ‘ AI μλ£ νμ¬μΈ Owkinκ³Ό Hugging Faceκ° νλ ₯νμ¬ κ°λ° λμλ€. 200λ§κ° μ΄μμ μλ¬Όμν μ°κ΅¬ λ
Όλ¬Έ λ°μ΄ν°μ
μμ νλ ¨λμμΌλ©° λͺ
λͺ
λ μν°ν° μΈμ, κ΄κ³ μΆμΆ, μ§λ¬Έ-λ΅λ³κ³Ό κ°μ λ€μν μλ¬Όμν NLP μμ
μ ν¨κ³Όμ μ΄λ€.
> ν΄λΉ GPtλ μλ¬Όμν μ§μκ³Ό λλ©μΈ νΉν μ΄νλ₯Ό LLMμ μΈμ½λ©ν μ¬μ νλ ¨μ λ°κ³ μμ λ°μ΄ν°μ
μμ νμΈνλμ΄ λ μ μλ€. κ²°κ΅ νΉμ μλ¬Όμν μμ
μ μ μ©ν μ μκ³ , λλμ λ μ΄λΈλ§λ λ°μ΄ν°μ νμμ±μ μ€μΌ μ μλ€.
> ![[Pasted image 20250510160551.png]]
μ₯μ
λλ©μΈ νΉν LLMμ μ₯μ μ νΉμ ν μ€νΈ μ§ν©μμμ νλ ¨μ μ‘΄μ¬νλ€. κΈ°μ‘΄μ LLM보λ€λ μλμ μΌλ‘ μ’μΌλ νΉνλ μ¬μ νλ ¨μΌλ‘ μΈν΄ ν΄λΉ λλ©μΈμμ μ¬μ©λλ μΈμ΄μ κ°λ μ λ μ μ΄ν΄ν μ μκΈ°μ ν΄λΉ λλ©μΈμμμ NLP μμ μμ λν μ νλ, μ μ°½μ±μ΄ ν₯μλλ€.
1.4 LLMμ μ΄μ©ν μ ν리μΌμ΄μ
λ€μν μμ© λΆμΌμμ μ¬μ©λμ§λ§ μΌλ°μ μΌλ‘ μΈ κ°μ§ λ°©μμΌλ‘ LLMμ μ¬μ©νλ€.
- μ¬μ νλ ¨λ LLMμ κΈ°λ³Έμ μΈ ν μ€νΈ μ²λ¦¬ λ° μμ± λ₯λ ₯μ ν° μλν μ²μ μΌλΆλ‘ μΆκ°μ μΈ νμΈνλ μμ΄ μ¬μ©: μ¬μ νλ ¨λ BERT/GPTλ₯Ό μ¬μ©ν΄ μ 보 κ²μ μμ€ν μμ±
- μ μ΄ νμ΅μ μ¬μ©ν΄ λ§€μ° νΉμ ν μμ μ μννκΈ° μν μ¬μ νλ ¨λ LLM νμΈ νλ : νΉμ λλ©μΈ/μ°μ μ λ¬Έμ μμ½μ μμ±νκΈ° μν΄ T5 νμΈνλ
- μ¬μ νλ ¨λ LLMμ μ¬μ νλ ¨μ ν΅ν΄ ν΄κ²°ν μ μλλ‘ νμ΅λμκ±°λ ν©λ¦¬μ μΈ μ§κ΄μΌλ‘ μνν μ μλ μμ μμ² : GPT-4μ λΈλ‘κ·Έ ν¬μ€νΈ μμ± μμ², T5μ μΈμ΄ λ²μ μν μμ²
1.4.1 μ ν΅μ μΈ μμ°μ΄ μ²λ¦¬ μμ
λλΆλΆμ LLMμ λΆλ₯, λ²μ κ°μ μΌλ°μ μΈ NLPμμ μμ μ΅κ³ μ κ²°κ³Όλ₯Ό μ 곡νλ€. νΈλμ€ν¬λ¨Έμ κ±°λν λ§λμΉλ₯Ό μ΄μ©ν ν¨μ¨μ μΈ μ¬μ νλ ¨μΌλ‘ κ°λ°μμ μ€λ¬΄μλ€μ΄ λΉκ΅μ μ μ λ μ΄λΈλ§λ λ°μ΄ν°λ₯Ό μ΄μ©ν΄μ μμ μ λ λμ μ νλλ‘ μνν λλΆμ΄λ€.
ν μ€νΈ λΆλ₯
ν
μ€νΈ λΆλ₯ μμ
μ μ£Όμ΄μ§ ν
μ€νΈ μ‘°κ°μ λ μ΄λΈμ ν λΉνλ κ²μΌλ‘ μ£Όλ‘ κ°μ± λΆμμ νν μ¬μ©λλ€. μ¬κΈ°μ λͺ©νλ ν
μ€νΈλ₯Ό κΈμ , λΆμ , μ€λ¦½μΌλ‘ λΆλ₯νλ κ²μ΄λ€. λν, μ£Όμ λΆλ₯μμλ 미리 μ μλ μΉ΄ν
κ³ λ¦¬λ‘ λΆλ₯νλ λ°μλ μ¬μ©ν μ μλ€.

BERTμ κ°μ λͺ¨λΈμ μ κ·Έλ¦Όμμ λ³Ό μ μλ―μ΄ μλμ μΌλ‘ μ μ λ μ΄λΈλ§ λ°μ΄ν°λ‘ νμΈνλνμ¬ λΆλ₯λ₯Ό μνν μ μλ€.
λ²μ μμ
κΈ°κ³ λ²μμΌλ‘ μλ―Έμ λ§₯λ½μ μ μ§νλ©΄μ ν μΈμ΄μ ν μ€νΈλ₯Ό λ€λ₯Έ μΈμ΄λ‘ λ²μνλ κ²μ΄λ€. μ ν΅μ μΈ λ²μ μμ μ λ μΈμ΄μ μΆ©λΆν μμ μ λλ©μΈ μ§μμ λ¬Έμ λ‘ μλΉν κΈ°κ³λ²μμ΄ μ΄λ €μ΄ μμ μ΄μμ§λ§ μ΅κ·Όμ LLMμμλ μ¬μ νλ ¨κ³Ό ν¨μ¨μ μΈ μ΄ν μ κ³μ°μΌλ‘ μμ μ λ μ½κ² μνν μ μμλ€.
