AI ÄÄÇ»Æà ±â¼ú ºÐ¾ßÀÇ ¼±µÎÁÖÀÚÀÎ ¿£ºñµð¾Æ°¡ ¹Ì±¹ ½Ã¾ÖƲ¿¡¼ °³ÃÖµÈ ¸¶ÀÌÅ©·Î¼ÒÇÁÆ®(Microsoft) ¿¬·Ê °³¹ßÀÚ ÄÜÆÛ·±½º ‘¸¶ÀÌÅ©·Î¼ÒÇÁÆ® ºôµå(Microsoft Build) 2024’¿¡¼ ¿£ºñµð¾Æ(NVIDIA) GTC¿¡¼ °øÀ¯ÇÑ ¾ç»çÀÇ Çù·Â »óȲÀ» ¹ÙÅÁÀ¸·Î Áö¼ÓÀûÀÎ Çù¾÷À» °ÈÇÑ´Ù°í ¹àÇû´Ù.
ÃÖÀûÈµÈ AI ¿öÅ©Ç÷ο찡 Çϵå¿þ¾î ÀÎÇÁ¶ó¿¡¼ ¼ÒÇÁÆ®¿þ¾î ¶óÀ̺귯¸®¿¡ À̸£±â±îÁö °¢ ±¸¼º ¿ä¼Ò°¡ Á¤È®ÇÑ À½À» ³»´Â ¿Ïº®ÇÏ°Ô Á¶À²µÈ ¿ÀÄɽºÆ®¶ó¿¡ ºñÀ¯µÉ ¼ö ÀÖ´Ù¸é, ¿£ºñµð¾Æ¿Í ¸¶ÀÌÅ©·Î¼ÒÇÁÆ®ÀÇ ¿À·£ Á¶È´Â °³¹ßÀÚÀÇ ±Í¿¡ À½¾Ç°úµµ °°Àº Á¸Àç´Ù.
¸¶ÀÌÅ©·Î¼ÒÇÁÆ®¿¡¼ °³¹ßÇÑ ÃֽŠAI ¸ðµ¨Àº ÆÄÀÌ-3(Phi-3) ¼ÒÇü ¾ð¾î ¸ðµ¨(small language model, SLM) Á¦Ç°±ºÀ» Æ÷ÇÔÇÑ´Ù. ¶ÇÇÑ ¿£ºñµð¾Æ GPU¿¡¼ ½ÇÇà °¡´ÉÇϵµ·Ï ÃÖÀûȵŠ¿£ºñµð¾Æ NIM Ãß·Ð ¸¶ÀÌÅ©·Î¼ºñ½º·Î »ç¿ëÇÒ ¼ö ÀÖ´Ù. cuOpt °æ·Î ÃÖÀûÈ AI¿Í °°ÀÌ ¿£ºñµð¾Æ¿¡¼ °³¹ßÇÑ ´Ù¸¥ ¸¶ÀÌÅ©·Î¼ºñ½º´Â ¸¶ÀÌÅ©·Î¼ÒÇÁÆ® ¾ÖÀú ¸¶ÄÏÇ÷¹À̽º(Azure Marketplace)¿¡ Á¤±âÀûÀ¸·Î Ãß°¡µÇ°í ÀÖ´Ù. ÀÌ´Â ¿£ºñµð¾Æ AI ¿£ÅÍÇÁ¶óÀÌÁî(AI Enterprise) ¼ÒÇÁÆ®¿þ¾î Ç÷§ÆûÀÇ ÀϺÎÀÌ´Ù.
ÀÌ·¯ÇÑ AI ±â¼ú ¿Ü¿¡µµ ¿£ºñµð¾Æ¿Í ¸¶ÀÌÅ©·Î¼ÒÇÁÆ®´Â ´õ ¸¹Àº ÃÖÀûÈ¿Í ÅëÇÕ ¼¼Æ®¸¦ Á¦°øÇÏ°í ÀÖ´Ù. À̸¦ ÅëÇØ ¿£ºñµð¾Æ ÁöÆ÷½º RTX(GeForce RTX)¿Í ¿£ºñµð¾Æ RTX GPU ±â¹Ý PC¿ë °í¼º´É AI ¾ÛÀ» ¸¸µå´Â °³¹ßÀÚ¸¦ Áö¿øÇÑ´Ù.
¸¶ÀÌÅ©·Î¼ÒÇÁÆ®ÀÇ ÆÄÀÌ-3 ¸ðµ¨ °¡¼ÓÈ
¸¶ÀÌÅ©·Î¼ÒÇÁÆ®´Â 38¾ï °³ÀÇ ÆĶó¹ÌÅÍ°¡ ÀÖ´Â ÆÄÀÌ-3-¹Ì´Ï(Phi-3-mini)¿Í À¯»çÇÑ ¼ÒÇü(70¾ï °³ ÆĶó¹ÌÅÍ)°ú ÁßÇü(140¾ï °³ ÆĶó¹ÌÅÍ) ¸ðµ¨À» Ãß°¡ÇØ ÆÄÀÌ-3 °³¹æÇü ¼ÒÇü ¾ð¾î ¸ðµ¨ Á¦Ç°±ºÀ» È®ÀåÇÏ°í ÀÖ´Ù. ¶ÇÇÑ À̹ÌÁö¿Í ÅؽºÆ®¸¦ Áö¿øÇÏ´Â 42¾ï °³ ÆĶó¹ÌÅÍÀÇ »õ·Î¿î ¸ÖƼ¸ð´Þ ¸ðµ¨ÀÎ ÆÄÀÌ-3-ºñÀü(Phi-3-vision)À» µµÀÔÇÑ´Ù.
ÀÌ ¸ðµç ¸ðµ¨Àº ¿£ºñµð¾Æ ÅÙ¼RT-LLM(TensorRT-LLM)À» ÅëÇØ GPU¿¡ ÃÖÀûȵŠÀÖ´Ù. ¶ÇÇÑ ¿£ºñµð¾Æ NIMÀ¸·Î »ç¿ëÇÒ ¼ö Àִµ¥, ÀÌ´Â ¾îµð¿¡³ª ¹èÆ÷ÇÒ ¼ö Àִ ǥÁØ API¸¦ °®Ãá °¡¼ÓÈµÈ Ãß·Ð ¸¶ÀÌÅ©·Î¼ºñ½ºÀÌ´Ù.
NIM ±â¹Ý ÆÄÀÌ-3 ¸ðµ¨¿ë API´Â ¿©±â¿Í ¾ÖÀú ¸¶ÄÏÇ÷¹À̽ºÀÇ ¿£ºñµð¾Æ AI ¿£ÅÍÇÁ¶óÀÌÁî¿¡¼ »ç¿ëÇÒ ¼ö ÀÖ´Ù.
¾ÖÀú ¸¶ÄÏÇ÷¹À̽º¿¡¼ ¿£ºñµð¾Æ cuOpt Á¦°ø
°æ·Î ÃÖÀûȸ¦ À§ÇÑ GPU °¡¼Ó AI ¸¶ÀÌÅ©·Î¼ºñ½ºÀÎ ¿£ºñµð¾Æ cuOpt°¡ ÀÌÁ¦ ¿£ºñµð¾Æ AI ¿£ÅÍÇÁ¶óÀÌÁ ÅëÇØ ¾ÖÀú ¸¶ÄÏÇ÷¹À̽º¿¡¼ Á¦°øµÈ´Ù. cuOpt´Â ¹è¼Û ¼ºñ½º, öµµ ½Ã½ºÅÛ, â°í¿Í °øÀå µî¿¡¼ ½Ç½Ã°£ ¹°·ù °ü¸®¸¦ °¡´ÉÇÏ°Ô ¸¸µå´Â ´ë±Ô¸ð º´·Ä ¾Ë°í¸®ÁòÀ» Áö¿øÇÑ´Ù.
ÀÌ ¸ðµ¨Àº ÁÖ¿ä ¶ó¿ìÆà º¥Ä¡¸¶Å©(routing benchmarks)¿¡¼ 24°³¿¡ ´ÞÇÏ´Â ¼¼°è ±â·ÏÀ» ¼¼¿ì¸ç ÃÖ°íÀÇ Á¤È®µµ¿Í ½Å¼Ó¼ºÀ» ÀÔÁõÇß´Ù. Â÷·® °æ·Î¸¦ ÃÖÀûÈÇÏ°í À̵¿ ½Ã°£À» Àý¾àÇϸç À¯ÈÞ ±â°£À» ÃÖ¼ÒÈÇØ ¹°·ù¿Í °ø±Þ¸Á »ê¾÷¿¡¼ ¼ö½Ê¾ï ´Þ·¯¸¦ Àý¾àÇÒ ¼ö ÀÖ´Ù.
°³¹ßÀÚ´Â ¾ÖÀú ¸¶ÄÏÇ÷¹À̽º¸¦ ÅëÇØ cuOpt ¸¶ÀÌÅ©·Î¼ºñ½º¸¦ ¾ÖÀú ¸Ê½º(Maps)¿¡ ½±°Ô ÅëÇÕÇÒ ¼ö ÀÖ´Ù. ÀÌ·Î½á ¿£ÅÍÇÁ¶óÀÌÁî±Þ °ü¸® µµ±¸¿Í º¸¾ÈÀÌ µÞ¹ÞħµÈ ½Ç½Ã°£ ¹°·ù °ü¸®¿Í ±âŸ Ŭ¶ó¿ìµå ±â¹Ý ¿öÅ©Ç÷ο츦 Áö¿øÇÒ ¼ö ÀÖ´Ù.
¿£ºñµð¾Æ RTX·Î PC¿¡¼ AI ¼º´É ÃÖÀûÈ
¿£ºñµð¾Æ °¡¼Ó ÄÄÇ»Æà Ç÷§ÆûÀº ÃֽŠAIÀÇ ÁßÃß·Î, °³¹ßÀÚµéÀÌ Àü ¼¼°è 1¾ï °³ ÀÌ»óÀÇ À©µµ¿ì¿ë ÁöÆ÷½º RTX ±â¹Ý PC¿Í ¿£ºñµð¾Æ RTX ±â¹Ý ¿öÅ©½ºÅ×À̼ÇÀ» À§ÇÑ ¼Ö·ç¼Ç ±¸ÃàÀ» Áö¿øÇÑ´Ù.
¿£ºñµð¾Æ¿Í ¸¶ÀÌÅ©·Î¼ÒÇÁÆ®´Â Â÷¼¼´ë PC¿Í ¿öÅ©½ºÅ×ÀÌ¼Ç ¾ÖÇø®ÄÉÀ̼ǿ¡¼ AI¸¦ °¡¼ÓÈÇϱâ À§ÇØ À©µµ¿ì °³¹ßÀÚ¿¡°Ô ´ÙÀ½°ú °°Àº »õ·Î¿î ÃÖÀûÈ¿Í ÅëÇÕ ±â´ÉÀ» Á¦°øÇÑ´Ù.
• ¿£ºñµð¾Æ ´ÙÀÌ·ºÆ®X(DirectX) µå¶óÀ̹ö, »ý¼ºÇü AI ONNX ·±Å¸ÀÓ(Generative AI ONNX Runtime) È®Àå°ú ´ÙÀÌ·ºÆ®ML(DirectML)À» ÅëÇØ °Å´ë ¾ð¾î ¸ðµ¨(large language model, LLM)¿¡ ´ëÇÑ ´õ ºü¸¥ Ãß·Ð ¼º´ÉÀ» Á¦°øÇÑ´Ù. ÀÌ·¯ÇÑ ÃÖÀûÈ´Â ¿£ºñµð¾Æ ÁöÆ÷½º RTX¿Í ¿£ºñµð¾Æ RTX GPU¿¡¼ ÃÖ´ë 3¹è ´õ ºü¸¥ ¼º´ÉÀ» Á¦°øÇÑ´Ù. ÇöÀç ÁöÆ÷½º °ÔÀÓ ·¹µð(Game Ready), ¿£ºñµð¾Æ ½ºÆ©µð¿À(Studio)¿Í ¿£ºñµð¾Æ RTX ¿£ÅÍÇÁ¶óÀÌÁî µå¶óÀ̹ö¿¡¼ »ç¿ëÇÒ ¼ö ÀÖ´Ù.
• WebNNÀ» ÅëÇØ ½ºÅ×ÀÌºí µðÇ»Àü(Stable Diffusion)°ú À§½ºÆÛ(Whisper) °°Àº AI ¸ðµ¨À» À§ÇÑ RTX GPUÀÇ ÃÖÀûÈµÈ ¼º´ÉÀ» Á¦°øÇÑ´Ù. WebNNÀº °³¹ßÀÚ°¡ ¿Âµð¹ÙÀ̽º Çϵå¿þ¾î¸¦ »ç¿ëÇØ À¥ ¾ÖÇø®ÄÉÀ̼ǿ¡¼ AI ¸ðµ¨À» °¡¼ÓÈÇÒ ¼ö ÀÖµµ·Ï µ½´Â APIÀÌ´Ù.
• À©µµ¿ì°¡ ´ÙÀÌ·ºÆ®MLÀ» ÅëÇØ ÆÄÀÌÅäÄ¡(PyTorch)¸¦ Áö¿øÇϵµ·Ï ¼³Á¤µÇ¸é ¼öõ °³ÀÇ Çã±ëÆäÀ̽º(Hugging Face) ¸ðµ¨ÀÌ À©µµ¿ì¿¡¼ ±âº»À¸·Î ÀÛµ¿ÇÑ´Ù. ¿£ºñµð¾Æ¿Í ¸¶ÀÌÅ©·Î¼ÒÇÁÆ®´Â 1¾ï °³ ÀÌ»óÀÇ RTX GPU¿¡¼ ¼º´ÉÀ» È®ÀåÇϱâ À§ÇØ Çù·ÂÇÏ°í ÀÖ´Ù.
¸¶ÀÌÅ©·Î¼ÒÇÁÆ® ºôµå¿¡¼ ¿£ºñµð¾Æ¿Í ÇÔ²²Çϱâ
ÄÜÆÛ·±½º Âü°¡ÀÚµéÀº ¿£ºñµð¾ÆÀÇ FP28 ºÎ½º¸¦ ¹æ¹®ÇØ °³¹ßÀÚ Àü¹®°¡¸¦ ¸¸³ª°í ¿£ºñµð¾Æ NIM, ¿£ºñµð¾Æ cuOpt, ¿£ºñµð¾Æ ¿È´Ï¹ö½º(Omniverse), ¿£ºñµð¾Æ RTX AI Ç÷§ÆûÀÇ ¶óÀÌºê µ¥¸ð¸¦ üÇèÇÒ ¼ö ÀÖ´Ù. ºÎ½º¿¡¼´Â ÀÇ·á À̹Ì¡ ¿öÅ©Ç÷ο츦 À§ÇÑ ¿£ºñµð¾Æ ¸ð³ªÀÌ(MONAI) Ç÷§Æû°ú ½Å¾à °³¹ßÀ» À§ÇÑ ¿£ºñµð¾Æ ¹ÙÀÌ¿À³×¸ð(BioNeMo) »ý¼ºÇü AI Ç÷§Æûµµ ¼±º¸À̸ç, µÎ Ç÷§Æû ¸ðµÎ ¿£ºñµð¾Æ AI ¿£ÅÍÇÁ¶óÀÌÁîÀÇ ÀϺηΠ¾ÖÀú¿¡¼ »ç¿ëÇÒ ¼ö ÀÖ´Ù.
¿£ºñµð¾Æ ¿¬»ç°¡ Âü¿©ÇÑ ¼¼¼Ç¿¡ Âü¼®ÇØ À©µµ¿ì PC¿¡¼ ¿£ºñµð¾Æ RTX AI Ç÷§Æû ±â´É¿¡ ´ëÇØ ÀÚ¼¼È÷ È®ÀÎÇÒ ¼ö ÀÖ´Ù. ¶ÇÇÑ ¸¶ÀÌÅ©·Î¼ÒÇÁÆ® ¾ÖÀú¿¡¼ »ý¼ºÇü AI¿Í µðÁöÅÐ Æ®À© µµ±¸¸¦ ¹èÆ÷ÇÏ´Â ¹æ¹ýÀ» ¾Ë¾Æº¼ ¼ö ÀÖ´Ù.
5¿ù 22ÀÏ(¼ö) ¿ÀÀü 6½Ã 30ºÐºÎÅÍ 23ÀÏ(¸ñ) ¿ÀÀü 3½Ã 15ºÐ±îÁö(Çѱ¹½Ã°£) ¿¸®´Â °³¹ßÀÚ ¼îÄÉÀ̽º(Developer Showcase)¿¡ µî·ÏÇØ °³¹ßÀÚµéÀÌ ¾ÖÀú¿¡¼ ¿£ºñµð¾Æ AI ¼ÒÇÁÆ®¿þ¾î¸¦ È°¿ëÇØ Çõ½ÅÀûÀÎ »ý¼ºÇü AI¸¦ ±¸ÃàÇÏ´Â ¹æ¹ýÀ» ¾Ë¾Æº¼ ¼ö ÀÖ´Ù.