Àü³²´ë ¿¬±¸ÆÀ ¡®¾ó±¼ °¡·Áµµ °¨Á¤ Àд AI±â¼ú¡¯ °³¹ß

·ÎÄÃ
Àü³²´ë ¿¬±¸ÆÀ ¡®¾ó±¼ °¡·Áµµ °¨Á¤ Àд AI±â¼ú¡¯ °³¹ß
À¯¼®ºÀ ±³¼öÆÀ, ¿Ã 10¿ù Æĸ® ±¹Á¦ÄÁÆÛ·±½º¿¡¼­ '·¹ÀÌÅÏÆ® ¿ÀÆÛ(Latent-OFER)' ¹ßÇ¥
  • ÀÔ·Â : 2023. 07.18(È­) 17:11
  • ¹èÁøÈñ ±âÀÚ
¡®¾ó±¼ °¡·Áµµ °¨Á¤ Àд AI±â¼ú¡¯ (±×·¡ÇÁ) [»çÁø Àü³²´ëÇб³]
[ÇÁ·¹½ºÁ¸] Àü³²´ëÇб³ ÀΰøÁö´ÉÀ¶ÇÕÇаú À¯¼®ºÀ ±³¼öÆÀÀÌ ÃÔ¿µ ¿µ»ó¿¡¼­ ¾ó±¼ÀÌ °¡·ÁÁ®µµ °¨Á¤À» ÀÐÀ» ¼ö ÀÖ´Â ±â¼úÀ» °³¹ßÇß´Ù.

¿¬±¸ÆÀÀº ÃÔ¿µµÈ ¾ó±¼ À̹ÌÁöÀÇ Áß¿äÇÑ Á¤º¸°¡ °¡·ÁÁø »óȲ¿¡¼­µµ ¾ó±¼À» º¹¿øÇÏ°í °¨Á¤À» °­ÀÎÇÏ°Ô ÃßÁ¤ÇÒ ¼ö ÀÖ´Â ½Ã°¢Áö´É ¾Ë°í¸®ÁòÀ» Á¦¾ÈÇß´Ù.

¿µ»ó¿¡¼­ ¼ÕÀ̳ª Ä¿ÇÇÀÜ µî ¹°Ã¼°¡ ¾ó±¼ ÀϺθ¦ °¡¸®¸é, ±âÁ¸ AI ±â¹Ý °¨Á¤ÀÎ½Ä ±â¼ú¿¡¼­´Â ¾ó±¼ÀÇ Æ¯Â¡À» ÃßÃâÇØ °¨Á¤À» Á¤È®ÇÏ°Ô ¿¹ÃøÇÏ´Â µ¥ »ó´çÇÑ ¾î·Á¿òÀÌ ÀÖ¾ú´Ù.

¿¬±¸ÆÀÀÌ °³¹ßÇÑ ¡®·¹ÀÌÅÏÆ® ¿ÀÆÛ(Latent-OFER)¡¯´Â ¾ó±¼¿¡¼­ °¡·ÁÁø ºÎºÐÀ» °¨Á¤ ¶óº§(label)ÀÌ º¯ÇÏÁö ¾Êµµ·Ï º¹¿øÇÏ°í ÀνÄÇØ °¨Á¤ÀνÄÀÇ Á¤È®µµ¸¦ ³ôÀÌ´Â ±â¼úÀÌ´Ù. °¡·ÁÁø ¿µ¿ªÀº ÀÚ±âÁöµµÇнÀ ±â¹ÝÀÇ ¡®Æó»ö ÆÐÄ¡ °¨Áö±â¡¯¸¦ ÅëÇØ ¸¶½ºÅ· 󸮵ȴÙ.

ÀÌÈÄ ºñÀü Æ®·£½ºÆ÷¸Ó(Vision Transformer) ±â¹Ý ÇÏÀ̺긮µå À籸¼º ³×Æ®¿öÅ©¸¦ »ç¿ëÇØ, °¨ÁöµÈ Æó»ö ¿µ¿ªÀ» ¿ÏÀüÇÑ À̹ÌÁö·Î º¹¿øÇÏ´Â ¹æ½ÄÀÌ´Ù.

¿¬±¸ÆÀÀº °¨Á¤ ¿¬°ü ÀáÀç º¤ÅÍ ÃßÃâ±â¸¦ »õ·Ó°Ô Á¦¾ÈÇϸ鼭, Àüü ÀáÀç º¤ÅÍ Áß °¨Á¤ °ü·Ã Á¤º¸¸¸À» ÁýÁßÇØ ÀνÄÀ» À§ÇÑ Æ¯Â¡Á¡À¸·Î È°¿ëÇÏ´Â ±â¼úÀ» »ç¿ëÇß´Ù.

¡®Latent-OFER¡¯ ±â¼úÀº ÁÖ¿ä Á¤º¸°¡ °¡·ÁÁ®µµ ÀΰøÁö´É ÀÎ½Ä ¼º´É ÀúÇϸ¦ ¹æÁöÇÑ´Ù´Â µ¥ ÀåÁ¡ÀÌ ÀÖ´Ù. ¿¬±¸ÆÀÀº ´Ù¾çÇÑ µ¥ÀÌÅͺ£À̽º ½ÇÇèÀ» ÅëÇØ °³¹ßµÈ ±â¼úÀÌ ±âÁ¸ ¹æ¹ýµéÀÇ ¼º´ÉÀ» ´É°¡ÇÑ´Ù´Â °á°ú¸¦ È®º¸Çß´Ù.

ÀÌ ¿¬±¸´Â Àü³²´ë ÀΰøÁö´ÉÀ¶ÇÕÇаú ½Ã°¢Áö´É¹Ìµð¾î¿¬±¸½Ç ÀÌÀÌ»è ¼®»ç°úÁ¤ Çлý(1ÀúÀÚ), ÀÌÀº±â Çм®»ç¿¬°è°úÁ¤ Çлý(2ÀúÀÚ)·Î Âü¿©Çß°í, À¯¼®ºÀ ±³¼ö°¡ ±³½ÅÀúÀÚ·Î Âü¿©Çß´Ù.

Latent-OFER ±â¼ú °ü·Ã ICCV 2023 ½ÂÀÎ³í¹®°ú ¼Ò½º ÄÚµå ¸µÅ©´Â Çмú ³í¹® ¿ÀǾ׼­½ºÀÎ arXiv¿¡¼­ È®ÀÎÇÒ ¼ö ÀÖ´Ù.

ÇÑÆí, ÇØ´ç ¿¬±¸³í¹®Àº ¿ÃÇØ 10¿ù ÇÁ¶û½º Æĸ®¿¡¼­ °³ÃÖÇÏ´Â IEEE International Conference on Computer Vision (ICCV) 2023 ±¹Á¦ ÄÁÆÛ·±½º¿¡¼­ °ø½ÄÀûÀ¸·Î ¹ßÇ¥µÉ ¿¹Á¤ÀÌ´Ù.

*³í¹® ¿øÁ¦: Latent-OFER: Detect, Mask, and Reconstruct with Latent Vectors for Occluded Facial Expression Recognition
¹èÁøÈñ ±âÀÚ news@presszon.kr     ¹èÁøÈñ ±âÀÚÀÇ ´Ù¸¥ ±â»ç º¸±â