Новый Π±Π΅Π½Ρ‡ΠΌΠ°Ρ€ΠΊΒ β€” Π½ΠΎΠ²Ρ‹ΠΉ Ρ€Π΅ΠΊΠΎΡ€Π΄:Β NVIDIA ΠΏΠΎΠ΄Ρ‚Π²Π΅Ρ€Π΄ΠΈΠ»Π° лидСрскиС ΠΏΠΎΠ·ΠΈΡ†ΠΈΠΈ Π² MLPerf Inference

Компания NVIDIA ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π»Π° Π½ΠΎΠ²Ρ‹Π΅, Π΅Ρ‰Ρ‘ Π±ΠΎΠ»Π΅Π΅ Π²ΠΏΠ΅Ρ‡Π°Ρ‚Π»ΡΡŽΡ‰ΠΈΠ΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ Π² области Ρ€Π°Π±ΠΎΡ‚Ρ‹ с большими языковыми модСлями (LLM) Π² Π±Π΅Π½Ρ‡ΠΌΠ°Ρ€ΠΊΠ΅ MLPerf Inference 4.0. Π—Π° ΠΏΡ€ΠΎΡˆΠ΅Π΄ΡˆΠΈΠ΅ ΠΏΠΎΠ»Π³ΠΎΠ΄Π° ΠΈ Π±Π΅Π· Ρ‚ΠΎΠ³ΠΎ высокиС Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹, дСмонстрируСмыС Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€ΠΎΠΉ Hopper Π² инфСрСнс-сцСнариях, ΡƒΠ΄Π°Π»ΠΎΡΡŒ ΡƒΠ»ΡƒΡ‡ΡˆΠΈΡ‚ΡŒ практичСски Π²Ρ‚Ρ€ΠΎΠ΅. Π‘Ρ‚ΠΎΠ»ΡŒ Π²Π½ΡƒΡˆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ достигнут благодаря ΠΊΠ°ΠΊ Π°ΠΏΠΏΠ°Ρ€Π°Ρ‚Π½Ρ‹ΠΌ ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΡΠΌ Π² ускоритСлях H200, Ρ‚Π°ΠΊ ΠΈ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ½Ρ‹ΠΌ оптимизациям. Π“Π΅Π½Π΅Ρ€Π°Ρ‚ΠΈΠ²Π½Ρ‹ΠΉ ИИ Π±ΡƒΠΊΠ²Π°Π»ΡŒΠ½ΠΎ Π²Π·ΠΎΡ€Π²Π°Π» ΠΈΠ½Π΄ΡƒΡΡ‚Ρ€ΠΈΡŽ: Π·Π° послСдниС Π΄Π΅ΡΡΡ‚ΡŒ Π»Π΅Ρ‚ Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½Π°Ρ ΠΌΠΎΡ‰Π½ΠΎΡΡ‚ΡŒ, затрачиваСмая Π½Π° ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ нСйросСтСй, выросла Π½Π° ΡˆΠ΅ΡΡ‚ΡŒ порядков, Π° LLM с Ρ‚Ρ€ΠΈΠ»Π»ΠΈΠΎΠ½ΠΎΠΌ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² ΡƒΠΆΠ΅ Π½Π΅ ΡΠ²Π»ΡΡŽΡ‚ΡΡ Ρ‡Π΅ΠΌ-Ρ‚ΠΎ Π½Π΅ΠΎΠ±Ρ‹Ρ‡Π½Ρ‹ΠΌ. Однако ΠΈ инфСрСнс ΠΏΠΎΠ΄ΠΎΠ±Π½Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Ρ‚ΠΎΠΆΠ΅ являСтся нСпростой Π·Π°Π΄Π°Ρ‡Π΅ΠΉ, ΠΊ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ NVIDIA ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΈΡ‚ комплСксно, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ, ΠΏΠΎ Π΅Ρ‘ ΠΆΠ΅ собствСнным словам, «ΠΌΠ½ΠΎΠ³ΠΎΠΌΠ΅Ρ€Π½ΡƒΡŽ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΡŽ».
Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ: 3dnews.ru

Π”ΠΎΠ±Π°Π²ΠΈΡ‚ΡŒ ΠΊΠΎΠΌΠΌΠ΅Π½Ρ‚Π°Ρ€ΠΈΠΉ