¿£ºñµð¾Æ°¡ GenSLM ¸ðµ¨À» ÈÆ·ÃÇϱâ À§ÇØ ¿£ºñµð¾Æ A100 ÅÙ¼ ÄÚ¾î GPU(A100 Tensor Core GPU)±â¹Ý ½´ÆÛÄÄÇ»Å͸¦ »ç¿ëÇß´Ù°í ¹àÇû´Ù. ¾Æ¿ï·¯ À̹ø ÁÖ ÄݷζóµµÁÖ µ§¹ö¿¡¼ ¿¸®´Â SC23¿¡¼ ¿£ºñµð¾Æ´Â °¡¼Ó ÄÄÇ»Æà ºÐ¾ßÀÇ »õ·Ó°í ȹ±âÀûÀÎ ¿¬±¸ °á°ú¸¦ °øÀ¯ÇÑ´Ù.
³Î¸® ¾Ë·ÁÁø °Ô³ð µ¥ÀÌÅÍ¿ë ´ë±Ô¸ð ¾ð¾î ¸ðµ¨ÀÌ Äڷγª19ÀÇ ¿øÀÎ ¹ÙÀÌ·¯½ºÀÎ SARS-CoV-2ÀÇ ½ÇÁ¦ º¯Á¾°ú ¸Å¿ì À¯»çÇÑ À¯ÀüÀÚ ¼¿À» »ý¼ºÇÏ´Â ´É·ÂÀ» Áõ¸íÇß´Ù.
Áö³ÇØ °í¼º´É ÄÄÇ»Æà ±â¹Ý Äڷγª19 ¿¬±¸ ºÎ¹®¿¡¼ °íµçº§(Gordon Bell) »óÀ» ¼ö»óÇÑ GenSLM ¸ðµ¨Àº DNA¿Í RNAÀÇ ±¸¼º ¿ä¼ÒÀÎ ´ºÅ¬·¹¿ÀƼµå ¼¿(nucleotide sequences) µ¥ÀÌÅÍ ¼¼Æ®¸¦ ±â¹ÝÀ¸·Î ÇнÀµÆ´Ù. ÀÌ ¸ðµ¨Àº ¾Æ¸£°ï ±¹¸³ ¿¬±¸¼Ò(Argonne National Laboratory), ¿£ºñµð¾Æ, ½ÃÄ«°í ´ëÇб³(University of Chicago)¿Í ±âŸ ¿©·¯ Çаè¿Í »ó¾÷ Çù·Â¾÷üÀÇ ¿¬±¸¿øµé¿¡ ÀÇÇØ °³¹ßµÆ´Ù.
¿¬±¸ÁøÀº GenSLMÀÌ »ý¼ºÇÑ ´ºÅ¬·¹¿ÀƼµå ¼¿À» µÇµ¹¾Æº» °á°ú, ÆÒµ¥¹Í ùÇغÎÅÍ Äڷγª19 ¹ÙÀÌ·¯½º °Ô³ð¸¸ ÈÆ·ÃÇßÀ½¿¡µµ ºÒ±¸ÇÏ°í AI°¡ »ý¼ºÇÑ ¼¿ÀÇ Æ¯Á¤ Ư¼ºÀÌ ¿ÃÇØ À¯ÇàÇÑ ½ÇÁ¦ ¿¡¸®½º(Eris)¿Í ÇǷѶó(Pirola) º¯Á¾°ú °ÅÀÇ ÀÏÄ¡ÇÏ´Â °ÍÀ» ¹ß°ßÇß´Ù.
GenSLMÀº ÀÚü ¿°±â¼¿À» »ý¼ºÇÏ´Â °Í ¿Ü¿¡µµ º¯Á¾À» ±¸ºÐÇÔÀ¸·Î½á ¼·Î ´Ù¸¥ Äڷγª19 °Ô³ð ¿°±â¼¿À» ºÐ·ùÇÏ°í Ŭ·¯½ºÅ͸µÇÒ ¼ö ÀÖ´Ù. ¿£ºñµð¾ÆÀÇ °¡¼Ó ¼ÒÇÁÆ®¿þ¾î ÇãºêÀÎ NGC¿¡ °ð °ø°³µÉ µ¥¸ð¿¡¼´Â »ç¿ëÀÚ°¡ Äڷγª19 ¹ÙÀÌ·¯½º °Ô³ð ³» ´Ù¾çÇÑ ´Ü¹éÁúÀÇ ÁøÈ ÆÐÅÏ¿¡ ´ëÇÑ GenSLMÀÇ ºÐ¼® ½Ã°¢È¸¦ »ìÆ캼 ¼ö ÀÖ´Ù.
GenSLMÀÇ ÇÙ½É ±â´ÉÀº ±ä ´ºÅ¬·¹¿ÀƼµå ¹®ÀÚ¿À» Çؼ®ÇÏ´Â ´É·ÂÀÌ´Ù. ÀÌ´Â ¿µ¾î ÅؽºÆ®¸¦ ÇнÀÇÑ LLMÀÌ ¹®ÀåÀ» Çؼ®ÇÏ´Â °Í°ú °°Àº ¹æ½ÄÀ¸·Î DNAÀÇ A, T, G, C ¶Ç´Â RNAÀÇ A, U, G, CÀÇ ¼¿·Î Ç¥½ÃµÇ´Â ¹®ÀÚ¿À» Çؼ®ÇÑ´Ù. ÀÌ ±â´ÉÀ» ÅëÇØ ¸ðµ¨Àº ¾à 30,000°³ÀÇ ´ºÅ¬·¹¿ÀƼµå·Î ±¸¼ºµÈ Äڷγª¹ÙÀÌ·¯½ºÀÇ °Ô³ð¿¡¼ ¼·Î ´Ù¸¥ ¿µ¿ª °£ÀÇ °ü°è¸¦ ÀÌÇØÇÒ ¼ö ÀÖ´Ù.
µ¥¸ð¿¡¼ »ç¿ëÀÚ´Â 8°³ÀÇ ¼·Î ´Ù¸¥ Äڷγª19 º¯Á¾ Áß¿¡¼ Çϳª¸¦ ¼±ÅÃÇÒ ¼ö ÀÖ´Ù. À̷νá AI ¸ðµ¨ÀÌ ¹ÙÀÌ·¯½º °Ô³ðÀÇ ´Ù¾çÇÑ ´Ü¹éÁú¿¡¼ µ¹¿¬º¯À̸¦ ÃßÀûÇÏ´Â ¹æ¹ýÀ» ÀÌÇØÇÑ´Ù. ÀÌ ½Ã°¢È´Â ¹ÙÀÌ·¯½º ´Ü¹éÁú Àü¹ÝÀÇ ÁøÈÀû °áÇÕÀ» ¹¦»çÇØ Æ¯Á¤ º¯Á¾¿¡¼ ¾î¶² °Ô³ð Á¶°¢ÀÌ ¹ß°ßµÉ °¡´É¼ºÀÌ ³ôÀºÁö °Á¶ÇÑ´Ù.
GenSLMÀº 1¾ï 1,000¸¸ °³ ÀÌ»óÀÇ ¿øÇÙ»ý¹° °Ô³ð ¼¿·Î ÈƷõƴÙ. ¹ÚÅ׸®¾Æ¿Í ¹ÙÀÌ·¯½º »ý¹°Á¤º¸ÇÐ ¸®¼Ò½º ¼¾ÅÍ(Bacterial and Viral Bioinformatics Resource Center)ÀÇ ¿ÀÇ ¼Ò½º µ¥ÀÌÅ͸¦ ÅëÇØ ¾à 150¸¸ °³ÀÇ COVID ¹ÙÀÌ·¯½º ¼¿ÀÇ ±Û·Î¹ú µ¥ÀÌÅÍ ¼¼Æ®·Î ¹Ì¼¼ Á¶Á¤µÆ´Ù. ÇâÈÄ ´Ù¸¥ ¹ÙÀÌ·¯½º³ª ¹ÚÅ׸®¾ÆÀÇ °Ô³ð¿¡ ´ëÇؼµµ ÀÌ ¸ðµ¨À» ¹Ì¼¼ Á¶Á¤ÇØ »õ·Î¿î ¿¬±¸ ºÐ¾ß¿¡ È°¿ëÇÒ ¼ö ÀÖ´Ù.
¿¬±¸ÁøÀº ¸ðµ¨ ÈÆ·ÃÀ» À§ÇØ ¿£ºñµð¾Æ A100 ÅÙ¼ ÄÚ¾î GPU(A100 Tensor Core GPU)±â¹Ý ½´ÆÛÄÄÇ»Å͸¦ »ç¿ëÇß´Ù. ÀÌ´Â ¾Æ¸£°ïÀÇ Æú¶ó¸®½º(Polaris) ½Ã½ºÅÛ, ¹Ì±¹ ¿¡³ÊÁöºÎÀÇ ÆÞ¸ÓÅÍ(Perlmutter)¿Í ¿£ºñµð¾Æ ¼¿¸°(Selene)À» Æ÷ÇÔÇÑ´Ù.
ÀÛ³â SC22 ½´ÆÛÄÄÇ»Æà ÄÜÆÛ·±½º¿¡¼ GenSLMs ¿¬±¸ÆÀÀº °íµçº§ »óÀ» ¹Þ¾Ò´Ù. À̹ø ÁÖ µ§¹ö¿¡¼ ¿¸®´Â SC23¿¡¼ ¿£ºñµð¾Æ´Â °¡¼Ó ÄÄÇ»Æà ºÐ¾ßÀÇ »õ·Ó°í ȹ±âÀûÀÎ ¿¬±¸ °á°ú¸¦ °øÀ¯ÇÑ´Ù. Àüü ÀÏÁ¤Àº ¿©±â¼ È®ÀÎÇÒ ¼ö ÀÖÀ¸¸ç, ¿£ºñµð¾ÆÀÇ Æ¯º° ¿¬¼³Àº ¿©±â¼ È®ÀÎÇÒ ¼ö ÀÖ´Ù.
Àü ¼¼°è ¼ö¹é ¸íÀÇ °úÇÐÀÚ¿Í ¿£Áö´Ï¾î·Î ±¸¼ºµÈ ¿£ºñµð¾Æ ¸®¼Ä¡(Research)´Â AI, ÄÄÇ»ÅÍ ±×·¡ÇÈ, ÄÄÇ»ÅÍ ºñÀü, ÀÚÀ²ÁÖÇà ÀÚµ¿Â÷, ·Îº¸Æ½½º µîÀÇ ÁÖÁ¦¿¡ ÁßÁ¡À» µÐ ÆÀÀ¸·Î ±¸¼ºµÅ ÀÖ´Ù. ¿£ºñµð¾Æ ¸®¼Ä¡¿¡ ´ëÇÑ ÀÚ¼¼ÇÑ ³»¿ë°ú ¿£ºñµð¾Æ ÇコÄÉ¾î ´º½º´Â ¿©±â¼ ±¸µ¶ÇÒ ¼ö ÀÖ´Ù.
¾Æ¸£°ï ±¹¸³¿¬±¸¼ÒÀÇ ¹Ù¶ù ÄÉÀÏ(Bharat Kale)ÀÌ ¸ÞÀÎ À̹ÌÁö¸¦ Á¦°øÇß´Ù.
ÀÌ ¿¬±¸´Â ¹Ì±¹ DOE °úÇб¹°ú ±¹°¡ ÇپȺ¸±¹ÀÇ °øµ¿ ÀÛ¾÷ÀÎ ¿¢»ç½ºÄÉÀÏ ÄÄÇ»Æà ÇÁ·ÎÁ§Æ®(Exascale Computing Project, 17-SC-20-SC)ÀÇ Áö¿øÀ» ¹Þ¾Ò´Ù. ¿¬±¸´Â Äڷγª19 ´ëÀÀ¿¡ ÁßÁ¡À» µÐ DOE ±¹¸³ ¿¬±¸¼Ò ÄÁ¼Ò½Ã¾öÀÎ ±¹¸³ °¡»ó »ý¸í°øÇÐ ¿¬±¸¼Ò(National Virtual Biotechnology Laboratory)¸¦ ÅëÇØ DOEÀÇ Áö¿øÀ» ¹Þ¾ÒÀ¸¸ç, Äڷγª ¹ÙÀÌ·¯½º Á¶Ä¡(CARES Act, Coronavirus Aid, Relief, and Economic Security Act)¿¡ µû¸¥ ÀÚ±ÝÀ¸·Î ¼öÇàµÆ´Ù.