ij³ª´Ù 3´ë ÀΰøÁö´É¿¬±¸¼Ò ÁßÀÇ ÇϳªÀÎ ¾Ë¹öŸ ÀΰøÁö´É ¿¬±¸¼Ò (Alberta Machine Intelligence Institute, amii)¿Í ´ëÇѹα¹ ÀΰøÁö´É(AI) Ç÷§Æû Àü¹®±â¾÷ ¸¶ÀÎÁî·¦ÀÌ °øµ¿¿¬±¸ °è¾àÀ» ü°áÇß´Ù.
amii´Â °ÈÇнÀ ºÐ¾ß¿¡¼ °Á¡À» °¡Áö°í ÀÖ´Â ¼¼°èÀûÀ¸·Î À¯¸íÇÑ ¿¬±¸¼Ò Áß Çϳª´Ù. À̹ø Çù¾à¿¡¼´Â ChatGPT ÇнÀÀÇ °¡Àå Áß¿äÇÑ °í¸®ÀÎ °ÈÇнÀ ºÐ¾ß¿¡¼ÀÇ Çõ½ÅÀûÀÎ ¿¬±¸ °³¹ßÀ» ¸ñÇ¥·Î ÇÑ´Ù.
À̸¦ À§ÇØ amii¿Í ¸¶ÀÎÁî·¦Àº Reinforcement Learning from Human Feedback (RLHF) pipelineÀ» ¿¬±¸ÇÏ´Â °ÍÀ» ù ¹ø° °úÁ¦·Î ¼±Á¤Çß´Ù. ÀÌ ¿¬±¸´Â Àΰ£ÀÇ Çǵå¹éÀ» ÅëÇØ °ÈÇнÀ ¾Ë°í¸®ÁòÀ¸·Î ÃÊ°Å´ë ¾ð¾î¸ðµ¨ ¼º´ÉÀ» °³¼±ÇÏ´Â ÆÄÀÌÇÁ¶óÀÎÀ» °³¹ßÇÏ´Â °ÍÀÌ´Ù.
¿ÀÇÂAI°¡ ³í¹®¿¡¼ ¹àÈù ±âÁ¸ÀÇ ÆÄÀÌÇÁ¶óÀÎÀ» ÀÚµ¿ÈÇÏ¿© º¸´Ù ³ôÀº ¼öÁØÀÇ ¼º´ÉÀ» ¹ßÈÖÇÏ´Â AI ¸ðµ¨ÀÌ Áö¼ÓÀûÀ¸·Î °³¼±µÇµµ·Ï ÇÏ´Â °ÍÀÌ ¸ñÇ¥ÀÌ´Ù.
À̹ø Çù¾àÀº amii¿Í maum.ai°¡ ÀΰøÁö´É ºÐ¾ß¿¡¼ÀÇ ±â¼úÀû Çõ½ÅÀ» ÀÌ·ç¾î³ª°¡´Â µ¥ Áß¿äÇÑ ¿ªÇÒÀ» ÇÒ °ÍÀ¸·Î ±â´ëµÇ¸ç, µÎ ±â¾÷Àº °·ÂÇÑ ±â¼ú·ÂÀ» ¹ÙÅÁÀ¸·Î, AI ºÐ¾ß¿¡¼ÀÇ Áö¼ÓÀûÀÎ ¹ßÀü°ú Çõ½ÅÀ» ÃßÁøÇÒ °ÍÀÌ´Ù.
|