AI μ κ³κ° λ ν λ² λ€νλ€λ¦¬κ³ μλ€. ‘λ₯μν¬(DeepSeek)’λΌλ μ€κ΅μ AI μ€ννΈμ μ΄ μ λΉμ©μ΄λ©΄μλ κ³ μ±λ₯μ AI λͺ¨λΈμ μ 보μ΄λ©° μ£Όλͺ©μ λ°κ³ μλ€. μ΄ νμ¬μ 곡μμ μΈ AI νλ ¨ λΉμ©μ μ½ **81μ΅ μ(557λ§6000λ¬λ¬)**λ‘ λ°νλμ§λ§, μ€μ ν¬μ κΈμ‘μ 7μ‘° μ(50μ΅ λ¬λ¬) μ΄μμ μ΄λ₯Ό κ²μ΄λΌλ λΆμμ΄ λμλ€.
λλ체 λ₯μν¬λ μ΄λ€ νμ¬μ΄λ©°, μ΄λ»κ² μ΄λ κ² λΉ λ₯Έ μλλ‘ μ±μ₯ν μ μμμκΉ? κ·Έλ¦¬κ³ μ΄λ‘ μΈν΄ κΈλ‘λ² AI μμ₯μλ μ΄λ€ λ³νκ° μΌμ΄λκ³ μμκΉ?
λ₯μν¬μ μ±μ₯ λ°°κ²½ – νμ΄νλΌμ΄μ΄μμ λ 립ν AI μ€ννΈμ
λ₯μν¬λ 2023λ
, μ€κ΅μ AI ν€μ§νλ ‘νμ΄νλΌμ΄μ΄(High-Flyer)’μμ λ
립ν AI μ€ννΈμ
μ΄λ€.
νμ΄νλΌμ΄μ΄λ λ―Έκ΅μ AI λ°λ체 μμΆ μ ν μ‘°μΉκ° μνλκΈ° μ μΈ 2021λ
μ A100 GPU 1λ§ κ°λ₯Ό μ μ μ μΌλ‘ ν보νλ€. μ΄ν, λ₯μν¬λ₯Ό ν΅ν΄ 본격μ μΈ AI λͺ¨λΈ κ°λ°μ μ§μ€ ν¬μνλ©°, νμ¬λ μ΄ 5λ§ κ° μ΄μμ μλΉλμ(NVIDIA) GPUλ₯Ό 보μ νκ³ μλ κ²μΌλ‘ μλ €μ‘λ€.
λ₯μν¬κ° 보μ ν GPUλ λ€μκ³Ό κ°λ€.
- H100 GPU μ½ 1λ§ κ°
- H800 GPU μ½ 1λ§ κ° (H100κ³Ό μ°μ° μ±λ₯μ λμΌνμ§λ§ λ€νΈμν¬ λμν μ ν μμ)
- H20 GPU μΆκ° μ£Όλ¬Έ μ§ν μ€ (μλΉλμκ° μ΅κ·Ό 9κ°μ λμ μ€κ΅ μμ₯μ μν΄ 100λ§ κ° μ΄μ μμ°ν λͺ¨λΈ)
μ΄μ²λΌ λ₯μν¬λ AI λͺ¨λΈ νλ ¨μ νμν λ§λν μ°μ° μμμ 보μ νκ³ μμΌλ©°, μ΄λ₯Ό λ°νμΌλ‘ λΉ λ₯Έ κΈ°μ νμ μ μ΄λ£¨κ³ μλ€.
AI κ°λ°μ 80μ΅? μ€μ λ‘ 7μ‘° μ λκ² ν¬μ
λ₯μν¬λ AI νλ ¨ λΉμ©μ **557λ§6000λ¬λ¬(μ½ 81μ΅ μ)**λ‘ λ°ννμ§λ§, μΈλΆμ μΈ λΉμ© λ΄μμ 곡κ°νμ§ μμλ€. νμ§λ§ μ κ³ λΆμ κΈ°κ΄ **μΈλ―Έμ λ리μμ€(SemiAnalysis)**λ λ₯μν¬κ° μ€μ λ‘λ 7μ‘° μ(50μ΅ λ¬λ¬) μ΄μμ ν¬μλ₯Ό μ§ννλ€κ³ νκ°νλ€.
μ΄ ν¬μ λ΄μμ μ΄ν΄λ³΄λ©΄,
- μλ² ν¬μ λΉμ©(CapEx, μλ³Έ μ§μΆ): μ½ 2μ‘° 3332μ΅ μ(16μ΅ λ¬λ¬)
- μ΄μ λΉμ©(OpEx, μ΄μ μ§μΆ): μ½ 1μ‘° 3766μ΅ μ(9μ΅ 4400λ§ λ¬λ¬)
μ¦, AI λͺ¨λΈμ νλ ¨νλ GPU ꡬ맀 λΉμ©λΏλ§ μλλΌ λ°μ΄ν°μΌν° ꡬμΆ, μ λ ₯ λΉμ©, μ°κ΅¬κ°λ°(R&D), μΈκ±΄λΉ λ±μ΄ ν¬ν¨λ κ±°λν ν¬μ κ·λͺ¨λΌλ κ²μ΄λ€.
μ΄λ κΈλ‘λ² AI 리λλ€κ³Ό λΉκ΅ν΄λ μλΉν μμ€μ΄λ€. μλ₯Ό λ€μ΄, μ€νAI(OpenAI)κ° GPT-4 κ°λ°μ μ½ 1μ‘° μ(7~8μ΅ λ¬λ¬) μ λ ν¬μν κ²κ³Ό λΉκ΅νλ©΄, λ₯μν¬μ ν¬μ κ·λͺ¨λ κ·Έλ³΄λ€ ν¨μ¬ ν¬λ€.
λ₯μν¬μ μ°¨λ³μ – μ체 λ°μ΄ν°μΌν° μ΄μ
λ₯μν¬λ ꡬκΈ(Google)μ΄λ μ€νAIμ²λΌ μΈλΆ ν΄λΌμ°λ μλΉμ€(AWS, GCP λ±)λ₯Ό μ΄μ©νλ κ²μ΄ μλλΌ μ체 λ°μ΄ν°μΌν°λ₯Ό μ΄μνκ³ μλ€.
μ΄λ¬ν μ΄μ λ°©μμ λ€μκ³Ό κ°μ μ₯μ μ΄ μλ€.
β
λͺ¨λΈ κ°λ° λ° μ€ν μλ κ·Ήλν – ν΄λΌμ°λ νκ²½λ³΄λ€ μ΅μ νλ AI νλ ¨μ΄ κ°λ₯
β
λ°μ΄ν° 보μ κ°ν – μ체 μλ²μμ λ°μ΄ν°λ₯Ό μ²λ¦¬νμ¬ μΈλΆ μ μΆ κ°λ₯μ± μ΅μν
β
μ₯κΈ°μ μΌλ‘ λΉμ© μ κ° – μ΄κΈ° ν¬μ λΉμ©μ΄ ν¬μ§λ§, μ§μμ μΈ GPU μ¬μ© λΉμ©μ μ€μΌ μ μμ
νΉν λ₯μν¬λ μλ‘μ΄ AI μν€ν μ²μΈ **λ©ν°ν€λμ μ¬μ΄ν μ (Multi-head Latent Attention, MLA)**μ μ°κ΅¬νλ©°, κΈ°μ‘΄ νΈλμ€ν¬λ¨Έ λͺ¨λΈλ³΄λ€ λ ν¨μ¨μ μΈ AI ꡬ쑰λ₯Ό κ°λ°νκ³ μλ€.
μ€κ΅ λ΄ AI μΈμ¬ μμ – μ°κ΅¬μ μ°λ΄ 18μ΅ μ
λ₯μν¬λ μ€κ΅ λ΄ μ΅κ³ μμ€μ AI μΈμ¬λ₯Ό λκ±° μμ νκ³ μλ€.
- λ² μ΄μ§λ, μ μ₯λ λ± μ£Όμ λν μΆμ μΈμ¬ μ κ·Ή μ±μ©
- λ°μ΄λ μ°κ΅¬μμκ² μ°λ΄ 130λ§ λ¬λ¬(μ½ 18μ΅ μ) μ§κΈ
- νμ¬ μ§μ μ 150λͺ μμ€, λΉ λ₯΄κ² μ¦κ° μ€
μ΄μ²λΌ λ₯μν¬λ μ κ³ μ΅κ³ μμ€μ λμ°λ₯Ό μ 곡νλ©°, μ€κ΅ λ΄ AI μ°κ΅¬ μΈλ ₯μ λ μ μ μΌλ‘ ν‘μνκ³ μλ€.
μ΄λ λ¨μν μΈμ¬ μ±μ©μ λμ΄, μ€κ΅μ΄ AI κΈ°μ μ립μ μ΄λ£¨λ λ° μ€μν μν μ ν κ²μ΄λΌλ μ μμ μλ―Έκ° ν¬λ€.
λ―Έκ΅μ AI λ°λ체 μμΆ κ·μ μλ μ΄μλ¨μ λ₯μν¬
λ―Έκ΅ μ λΆλ 3λ μ°μμΌλ‘ μ€κ΅μ λν AI λ°λ체 μμΆμ μ νν΄μλ€.
νμ§λ§ λ₯μν¬λ μ°νμ μΈ λ°©μμΌλ‘ H100 λ° H20 GPUλ₯Ό λλ ν보νλ©° AI λͺ¨λΈ κ°λ°μ μ΄μ΄κ°κ³ μλ€.
μ΄λ¬ν μμ§μμ λ―Έκ΅ AI μ
κ³λ₯Ό κΈ΄μ₯νκ² λ§λλ μμλ‘ μμ©νκ³ μλ€.
μ€νAIμ μ μ¬νΈλ¨Ό(Sam Altman) CEOλ λ₯μν¬μ AI λͺ¨λΈμ λν΄
“λ°μ΄λ λͺ¨λΈ”μ΄λΌκ³ νκ°νλ©΄μλ, μ€νAI λ°μ΄ν°λ₯Ό λ¬΄λ¨ μ¬μ©νμ κ°λ₯μ±μ μ κΈ°νλ€.
μ¦, λ₯μν¬κ° GPT-4μ μ μ¬ν μμ€μ AI λͺ¨λΈμ κ°λ°νμ§λ§, κ·Έ κ³Όμ μμ λΆλ²μ μΈ λ°μ΄ν° νμ©μ΄ μμλμ§ μ¬λΆκ° λ Όλμ΄ λ μ μλ€λ μλ―Έλ€.
κ²°λ‘ – λ₯μν¬, κΈλ‘λ² AI νλλ₯Ό νλ€λ€
λ₯μν¬λ
β
μ λΉμ© κ³ μ±λ₯ AI λͺ¨λΈ κ°λ°
β
5λ§ κ° μ΄μμ GPU 보μ
β
μ체 λ°μ΄ν°μΌν° μ΄μμ ν΅ν λΉ λ₯Έ κΈ°μ νμ
β
μ€κ΅ λ΄ AI μΈμ¬ λ
μ μμ
μ΄λ¬ν μμλ₯Ό κΈ°λ°μΌλ‘, κΈλ‘λ² AI μ κ³λ₯Ό λ€νλλ μλ‘μ΄ κ°μλ‘ λ μ€λ₯΄κ³ μλ€.
μ΄μ μ€μν κ²μ, λ₯μν¬κ°
- AI λͺ¨λΈμ μ΄λ€ λ°©μμΌλ‘ λ°μ μν¬ κ²μΈμ§
- λ―Έκ΅μ κ·μ μ μ΄λ»κ² λμν κ²μΈμ§
- μ€νAIμμ λ°μ΄ν° μ¬μ© λ Όλμ μ΄λ»κ² ν΄κ²°ν κ²μΈμ§
μ΄λ¬ν λ³μλ€μ΄ ν₯ν AI μ κ³μ νλ¦μ κ²°μ μ§κ² λ κ²μ΄λ€.
AI ν¨κΆμ λλ¬μΌ λ―Έκ΅κ³Ό μ€κ΅μ κ²½μ μμμ, λ₯μν¬κ° ‘μ€κ΅ν μ€νAI’κ° λ μ μμμ§ κ·μΆκ° μ£Όλͺ©λλ€.