Potato
์•ˆ๋…•ํ•˜์„ธ์š”, ๊ฐ์žก๋‹ˆ๋‹ค?๐Ÿฅ” ^___^ ๐Ÿ˜บ github ๋ฐ”๋กœ๊ฐ€๊ธฐ ๐Ÿ‘‰๐Ÿป

AI study/์ž์—ฐ์–ด ์ฒ˜๋ฆฌ (NLP)

[NLP] ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ๋ฅผ ์œ„ํ•œ ์‹œํ€€์Šค ๋ชจ๋ธ๋ง (Attention, ์–ดํ…์…˜ ๋ฉ”์ปค๋‹ˆ์ฆ˜)

๊ฐ์ž ๐Ÿฅ” 2021. 8. 6. 06:55
๋ฐ˜์‘ํ˜•

 

-- ๋ณธ ํฌ์ŠคํŒ…์€ ํŒŒ์ดํ† ์น˜๋กœ ๋ฐฐ์šฐ๋Š” ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ (ํ•œ๋น›๋ฏธ๋””์–ด) ์ฑ…์„ ์ฐธ๊ณ ํ•ด์„œ ์ž‘์„ฑ๋œ ๊ธ€์ž…๋‹ˆ๋‹ค.
-- ์†Œ์Šค์ฝ”๋“œ๋Š” ์—ฌ๊ธฐ

 

1. ์–ดํ…์…˜ (Attention)

1.1 ์–ดํ…์…˜ ๋“ฑ์žฅ ๋ฐฐ๊ฒฝ

  1. ์•ž์„œ ์–ธ๊ธ‰ํ•œ seq2seq ๋ชจ๋ธ์€ '์ „์ฒด ์ž…๋ ฅ ๋ฌธ์žฅ'์„ ํ•˜๋‚˜์˜ ๋ฒกํ„ฐ๋กœ ์ธ์ฝ”๋”ฉํ•˜๊ธฐ์—, ์งง์€ ๋ฌธ์žฅ์—๋งŒ ์ ํ•ฉํ•˜๊ณ  ๊ธด ๋ฌธ์žฅ์—์„œ๋Š” ์ „์ฒด ์ž…๋ ฅ ์ •๋ณด๋ฅผ ์ œ๋Œ€๋กœ ๊ฐ์ง€ํ•˜์ง€ ๋ชปํ•œ๋‹ค๋Š” ๋ฌธ์ œ์  ๋ฐœ์ƒ
    ์ฆ‰, ํ•˜๋‚˜์˜ ๊ณ ์ •๋œ ํฌ๊ธฐ์˜ ๋ฒกํ„ฐ์— ๋ชจ๋“  ์ •๋ณด๋ฅผ ๋‹ด๋‹ค๋ณด๋‹ˆ ์ •๋ณด ์†์‹ค์ด ๋ฐœ์ƒํ•œ๋‹ค.
  2. RNN์˜ ๊ณ ์งˆ์ ์ธ ๋ฌธ์ œ์ธ ๊ธฐ์šธ๊ธฐ ์†Œ์‹ค ๋ฌธ์ œ (Vanishing Gradient)๊ฐ€ ์กด์žฌํ•œ๋‹ค.

โ–ถ ์ด๋Ÿฐ RNN์— ๊ธฐ๋ฐ˜ํ•œ sequence๋ชจ๋ธ์˜ ๋ฌธ์ œ๋“ค์€ ๊ธฐ๊ณ„ ๋ฒˆ์—ญ ๋ถ„์•ผ์—์„œ ์ž…๋ ฅ ๋ฌธ์žฅ์ด ๊ธธ๋ฉด ํ’ˆ์งˆ์ด ๋–จ์–ด์ง€๋Š” ์น˜๋ช…์ ์ธ ๋‹จ์ ์œผ๋กœ ์ž‘์šฉ

โ–ถ ๋”ฐ๋ผ์„œ ์ด๋ฅผ ์œ„ํ•œ ๋Œ€์•ˆ์œผ๋กœ ์ž…๋ ฅ ์‹œํ€€์Šค๊ฐ€ ๊ธธ์–ด์ง€๋ฉด ์ถœ๋ ฅ ์‹œํ€€์Šค์˜ ์ •ํ™•๋„๊ฐ€ ๋–จ์–ด์ง€๋Š” ํ˜„์ƒ์„ ๋ณด์ •ํ•ด์ฃผ๊ธฐ ์œ„ํ•œ ๊ธฐ๋ฒ•์ธ ์–ดํ…์…˜์ด ๋“ฑ์žฅํ–ˆ์Œ.

 

1.2 ์–ดํ…์…˜

์‚ฌ๋žŒ์œผ๋กœ ์˜ˆ๋ฅผ ๋“ค์–ด ์„ค๋ช…ํ•˜์ž๋ฉด, 

  • ์ผ๋ฐ˜์ ์œผ๋กœ ์‚ฌ๋žŒ์€ ์ธ์ฝ”๋”, ๋””์ฝ”๋” ๋ฐฉ์‹ ์ฒ˜๋Ÿผ ๋ฌธ์žฅ์˜ ์˜๋ฏธ๋ฅผ ์ถ”์ถœํ•œ ๋’ค, ์ด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ๋ฒˆ์—ญํ•˜์ง€ ์•Š๋Š”๋‹ค
  • ํ•œ๊ธ€์˜ ์˜์ž๋Š” ์˜์–ด๋กœ chair์ž„์„ ์•Œ๊ณ , ํ•œ๊ธ€์˜ ~์˜๋Š” ์˜์–ด์˜ of์ž„์„ ์•Œ๊ณ  ๋ฒˆ์—ญ์„ ํ•œ๋‹ค. (์ฆ‰, ๋จธ๋ฆฟ์†์— ์ €์žฅ๋œ ๊ฒƒ์„ ๋– ์˜ค๋ฅด๋Š” ๋ฐฉ์‹์œผ๋กœ ๋ฒˆ์—ญ์„ ์ง„ํ–‰)
  • ์ฑ…์„ ์ฝ์„ ๋•Œ ๋ชจ๋“  ๋ฌธ์žฅ์„ ์ฒ˜์Œ๊ณผ ๋์œผ๋กœ ๋ฐ”๋ผ๋ณด๊ณ  ๊ธฐ์–ตํ•˜๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ, ํ•œ ๋‹จ์–ด์”ฉ ์ฝ์œผ๋ฉด์„œ ์ฃผ๋ณ€ ๋‹จ์–ด์— ์ฃผ์˜๋ฅผ ๊ธฐ์šธ์ด๊ณ  ์ฝ์–ด๋‚˜๊ฐ„๋‹ค.

โ–ถ ์ฆ‰, ์‚ฌ๋žŒ๋“ค์€ ์ถœ๋ ฅ์„ ์ƒ์„ฑํ• ๋•Œ ๊ด€๋ จ๋œ ์ž…๋ ฅ ๋ถ€๋ถ„์— ์ดˆ์ ์„ ๋‘์–ด ๋ฒˆ์—ญ์„ ํ•˜๊ฒŒ๋˜๋Š”๋ฐ, ์ด๋ฅผ '์–ดํ…์…˜'์ด๋ผ๊ณ  ํ•œ๋‹ค. ์ฑ…์„ ์ฝ์œผ๋ฉด์„œ๋„ ๋ชจ๋“  ๋‹จ์–ด์— ์–ดํ…์…˜์„ ๋ถ€์—ฌํ•˜๋ฉฐ ์ฝ๊ฒŒ๋œ๋‹ค. 

 

1.3 ์–ดํ…์…˜ ๋ฉ”์ปค๋‹ˆ์ฆ˜ (Attention Mechanism)

  • ์ „์ฒด ์ž…๋ ฅ์˜ ์ตœ์ข… ์š”์•ฝ์ด ์•„๋‹ˆ๋ผ, ์ž…๋ ฅ์˜ ์—ฌ๋Ÿฌ ๋ถ€๋ถ„์— ์–ดํ…์…˜์„ ๋ถ€์—ฌํ•˜๋Š” ์‹œํ€€์Šค ์ƒ์„ฑ ๋ชจ๋ธ
  • ์‹ ๊ฒฝ๋ง์˜ ์„ฑ๋Šฅ์„ ๋†’์ด๊ธฐ ์œ„ํ•œ ๋ฉ”์ปค๋‹ˆ์ฆ˜
  • ๋””์ฝ”๋”์—์„œ ์ถœ๋ ฅ ๋‹จ์–ด๋ฅผ ์˜ˆ์ธกํ•˜๋Š” ๋งค time step ๋งˆ๋‹ค ์ธ์ฝ”๋”์—์„œ์˜ ์ „์ฒด ์ž…๋ ฅ ๋ฌธ์žฅ์„ ๋‹ค์‹œ ํ•œ ๋ฒˆ ์ฐธ๊ณ ํ•จ
    • ์ „์ฒด ์ž…๋ ฅ ๋ฌธ์žฅ ์ „๋ถ€ ๋‹ค ๋™์ผํ•œ ๋น„์œจ๋กœ ์ฐธ๊ณ ํ•˜๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ, ํ•ด๋‹น ์‹œ์ ์—์„œ ์˜ˆ์ธกํ•ด์•ผํ•  ๋‹จ์–ด์™€ ์—ฐ๊ด€์ด ์žˆ๋Š” ์ž…๋ ฅ ๋‹จ์–ด ๋ถ€๋ถ„์„ ์ข€ ๋” ์ง‘์ค‘(attention)ํ•ด์„œ ๋ณธ๋‹ค๋Š” ์•„์ด๋””์–ด

1.4 dot-product Attetion์˜ ๋™์ž‘๋ฐฉ์‹

๋‹ค์–‘ํ•œ ์ข…๋ฅ˜์˜ ์–ดํ…์…˜ ๋ฉ”์ปค๋‹ˆ์ฆ˜์ด ์กด์žฌํ•˜์ง€๋งŒ, ์–ด์ฒธ์…˜์˜ ์ดํ•ด๋ฅผ ์œ„ํ•ด ๋‹ท ํ”„๋กœ๋•ํŠธ ์–ดํ…์…˜ (dot_product_attention) ์„ ํ™œ์šฉํ•˜์—ฌ ์–ดํ…์…˜์˜ ๋™์ž‘๋ฐฉ์‹์„ ์ดํ•ดํ•ด ๋ณด์ž. (๋‹ค์–‘ํ•œ ์ข…๋ฅ˜์˜ ์–ดํ…์…˜ ๋ฉ”์ปค๋‹ˆ์ฆ˜์€ ์—ฌ๊ธฐ๋ฅผ ํด๋ฆญํ•˜๋ฉด ํ™•์ธ ํ•  ์ˆ˜ ์žˆ๋‹ค.)

์ถœ์ฒ˜) https://wikidocs.net/22893

  1. ๋””์ฝ”๋”์˜ ์ฒซ๋ฒˆ์งธ, ๋‘๋ฒˆ์งธ ๋‹จ์–ด๋Š” ์ด๋ฏธ ์–ดํ…์…˜ ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ํ†ตํ•ด ์˜ˆ์ธก์ด ์™„๋ฃŒ๋๋‹ค๊ณ  ๊ฐ€์ •ํ•˜๊ณ , ์„ธ๋ฒˆ์งธ ๋‹จ์–ด์ธ Suis๋ฅผ ์˜ˆ์ธกํ•˜๊ธฐ ์œ„ํ•œ ๊ณผ์ •์„ ์„ค๋ช…ํ•˜๊ณ  ์žˆ๋‹ค.
  2. ๋””์ฝ”๋”์˜ ์„ธ๋ฒˆ์งธ ๋‹จ์–ด๋ฅผ ์˜ˆ์ธกํ•˜๊ธฐ ์œ„ํ•ด LSTM ์…€์—์„œ ์ธ์ฝ”๋”์˜ ๋ชจ๋“  ์ž…๋ ฅ๋‹จ์–ด๋ฅผ ๋‹ค์‹œ ์ฐธ๊ณ ํ•˜๊ณ ์ž ํ•œ๋‹ค. ๊ทธ๋ž˜์„œ ์„ธ๋ฒˆ์งธ LSTM ์…€์—์„œ ๋„ค๊ฐœ์˜ ๋ป—์–ด๋‚˜๊ฐ€๋Š” ํ™”์‚ดํ‘œ๋ฅผ ๋ณผ ์ˆ˜์žˆ๋‹ค.
  3. ์šฐ์„  โ— ๋ถ€๋ถ„์„ ๋ณด์ž. ์ด ๋ถ€๋ถ„์—์„œ ์–ดํ…์…˜ ์Šค์ฝ”์–ด๋ฅผ ๊ตฌํ•˜๊ฒŒ ๋œ๋‹ค. (์ž์„ธํ•œ ๊ณ„์‚ฐ ๋ฐฉ๋ฒ•์€ ์—ฌ๊ธฐ)
  4. ์ดํ›„ โ–  ๋ถ€๋ถ„์„ ๋ณด๋ฉด, ์†Œํ”„ํŠธ ๋ฉ•์Šค ํ•จ์ˆ˜๋ฅผ ํ†ตํ•ด ์–ดํ…์…˜ ๋ถ„ํฌ๋ฅผ ๊ตฌํ•œ๋‹ค. ์†Œํ”„ํŠธ๋งฅ์Šค ํ•จ์ˆ˜๋ฅผ ํ†ตํ•ด ๋‚˜์˜จ ๊ฒฐ๊ณผ๊ฐ’์€ I, am, a, student ๋‹จ์–ด ๊ฐ๊ฐ์ด ์ถœ๋ ฅ ๋‹จ์–ด๋ฅผ ์˜ˆ์ธกํ•  ๋•Œ ์–ผ๋งˆ๋‚˜ ๋„์›€์ด ๋˜๋Š”์ง€ ์ •๋„๋ฅผ ์ˆ˜์น˜ํ™”ํ•ด์„œ ํ‘œํ˜„ํ•œ ๊ฐ’์ด๋‹ค. ์ด๋ฅผ ๋นจ๊ฐ„์ƒ‰ ์ง์‚ฌ๊ฐํ˜•์˜ ํฌ๊ธฐ๋กœ ์ˆ˜์น˜์˜ ํฌ๊ธฐ๋กœ ํฌํ˜„ํ•ด ๋†“์•˜๋‹ค.
  5. ๋‹ค์Œ์œผ๋กœ โ–ฒ ๋ถ€๋ถ„์„ ๋ณด์ž. ์ด ๋ถ€๋ถ„์—์„œ๋Š” ๊ฐ ์–ดํ…์…˜์˜ ๊ฐ€์ค‘์น˜์™€ ์€๋‹‰ ์ƒํƒœ๋ฅผ ๊ฐ€์ค‘ํ•ฉํ•˜์—ฌ ์–ดํ…์…˜ ๊ฐ’ (attention value)๋ฅผ ๊ตฌํ•˜๋Š” ๊ณผ์ •์„ ๊ฑฐ์นœ๋‹ค. ์ฆ‰, ์•ž์„œ ์†Œํ”„ํŠธ๋งฅ์Šค ํ•จ์ˆ˜๋กœ ๊ตฌํ•œ ์ˆ˜์น˜ํ™”๋œ ๊ฐ’์„ ํ•˜๋‚˜์˜ ์ •๋ณด๋กœ ๋‹ด์•„์„œ ๋””์ฝ”๋”๋กœ ์ „์†กํ•˜๋Š” ๊ณผ์ •์ด๋‹ค.
  6. ๋งˆ์ง€๋ง‰ ๊ณผ์ •์—์„œ ๋„์ถœ๋œ ์–ดํ…์…˜ ๊ฐ’(attention value)์™€ ๋””์ฝ”๋”์˜ t์‹œ์ ์˜ ์€๋‹‰์ƒํƒœ๋ฅผ ์—ฐ๊ฒฐํ•œ ํ›„, ์˜ˆ์ธก์„ ์ˆ˜ํ–‰ํ•˜๊ฒŒ ๋œ๋‹ค.

 

1.5 ์–ดํ…์…˜์ด ํ•„์š”ํ•œ ์ด์œ 

ํŒŒ์ดํ† ์น˜๋กœ ๋ฐฐ์šฐ๋Š” ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ p.225

  • ํ•ด๋‹น ๊ทธ๋ž˜ํ”„๋Š” ์–ดํ…์…˜์„ ์‚ฌ์šฉํ•  ๋•Œ (RNNsearch-50, RNNsearch-30)๊ณผ ๊ทธ๋ ‡์ง€ ์•Š์„ ๋•Œ(RNNenc-50, RNNenc-30) ๊ธฐ๊ณ„ ๋ฒˆ์—ญ ์‹œ์Šคํ…œ์˜ BLEU ์ ์ˆ˜ ๋ณ€ํ™”๋ฅผ ๋ณด์—ฌ์ค€๋‹ค.
  • ๋’ค์— ๋ถ™์–ด ์žˆ๋Š” 30๊ณผ 50์€ ๊ฐ๊ฐ ์ตœ๋Œ€ ๋‹จ์–ด ๊ธธ์ด๊ฐ€ 30, 50 ๋ฌธ์žฅ์ด๋ผ๋Š” ๋œป
  • ์–ดํ…์…˜์ด ์—†๋Š” ๊ธฐ๊ณ„๋ฒˆ์—ญ์‹œ์Šคํ…œ์€ ๋ฌธ์žฅ ๊ธธ์ด๊ฐ€ ๊ธธ์ˆ˜๋ก ์„ฑ๋Šฅ์ด ๊ฐ์†Œํ•œ๋‹ค.
  • ์–ด์ฒธ์…˜์„ ์‚ฌ์šฉํ•˜๋ฉด ๊ธด ๋ฌธ์žฅ์˜ ๋ฒˆ์—ญ ์„ฑ๋Šฅ์ด ํ–ฅ์ƒ๋˜์ง€๋งŒ, ๊ธฐ๊ณ„๋ฒˆ์—ญ์˜ ์„ฑ๋Šฅ์€ ํ›ˆ๋ จ๋œ ๋ฌธ์žฅ์˜ ๊ธธ์ด์— ๋น„๋ก€ํ•˜๊ฒŒ ๋œ๋‹ค. 

 

1.6 ์–ดํ…์…˜ ํ•จ์ˆ˜

https://wikidocs.net/22893

  • ์ฟผ๋ฆฌ(Query) : t ์‹œ์ ์˜ ๋””์ฝ”๋” ์…€์—์„œ์˜ ์€๋‹‰ ์ƒํƒœ
  • ํ‚ค(Key) : ํŠน์ •์‹œ์ ์˜ ์ธ์ฝ”๋” ์…€์˜ ์€๋‹‰ ์ƒํƒœ
  • ๊ฐ’(Value) : ์–ดํ…์…˜์„ ์‚ฌ์šฉํ•  ๋•Œ์˜ ์ธ์ฝ”๋”๋Š” ์ตœ์ข… ์€๋‹‰ ์ƒํƒœ ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ์ค‘๊ฐ„ ํƒ€์ž„ ์Šคํ…์˜ ์€๋‹‰์ƒํƒœ๋„ ๊ณ ๋ คํ•˜๋Š”๋ฐ, ์ธ์ฝ”๋”์˜ ์ด๋Ÿฐ ์€๋‹‰์ƒํƒœ๋ฅผ ๊ฐ’์ด๋ผ๊ณ  ๋ถ€๋ฆ„

ํŒŒ์ดํ† ์น˜๋กœ ๋ฐฐ์šฐ๋Š” ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ p.227

  • ํ•ด๋‹น ์‚ฌ์ง„์€ t=0์ผ ๋•Œ์˜ ์–ดํ…์…˜ ๊ณผ์ •์„ ๋ณด์—ฌ์คŒ
  • ์–ดํ…์…˜์€ ์ฃผ์˜๋ฅผ ๊ธฐ์šธ์ด๋ ค๋Š” ๊ฐ’์ดใ…ก ๊ฐœ์ˆ˜์™€ ์ฐจ์›์ด ๊ฐ™์€ ๋ฒกํ„ฐ ํ•˜๋‚˜๋กœ ํ‘œํ˜„๋˜๋Š”๋ฐ, ์ด๋ฅผ '์–ดํ…์…˜๋ฒกํ„ฐ or ์–ดํ…์…˜๊ฐ€์ค‘์น˜ or ์ •๋ ฌ' ์ด๋ผ๊ณ  ๋ถ€๋ฆ„.
  • ์–ดํ…์…˜ ๊ฐ€์ค‘์น˜๋Š” ์ธ์ฝ”๋” ์ƒํƒœ (๊ฐ’)๊ณผ ์—ฐ๊ฒฐ๋˜์–ด ๋ฌธ๋งฅ๋ฒกํ„ฐ๋ฅผ ์ƒ์„ฑ
  • ์ „์ฒด ๋ฌธ์žฅ์˜ ์ธ์ฝ”๋”ฉ ๋Œ€์‹ ์— ํ•ด๋‹น ๋ฌธ๋งฅ๋ฒกํ„ฐ๊ฐ€ ๋””์ฝ”๋”์˜ ์ž…๋ ฅ์ด ๋จ
  • ๋‹ค์Œ ํƒ€์ž…์Šคํ…์˜ ์–ดํ…์…˜ ๋ฒกํ„ฐ๋Š” ํ˜ธํ™˜์„ฑํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์—…๋ฐ์ดํŠธ ๋œ๋‹ค. 
    • ํ˜ธํ™˜์„ฑ ํ•จ์ˆ˜๋Š” ์‚ฌ์šฉํ•˜๋Š” ์–ดํ…์…˜ ๋ฉ”์ปค๋‹ˆ์ฆ˜์— ๋”ฐ๋ผ ๋‹ค๋ฅด๋‹ค.

โ–ถ ์–ดํ…์…˜์„ ๊ตฌํ˜„ํ•˜๋Š” ๋ฐฉ๋ฒ• (์ถ”ํ›„ ์ž์„ธํ•œ ์„ค๋ช… ํ•„์š”)

  • Content-aware attention (์ฝ˜ํ…์ธ  ์ธ์‹ ์–ดํ…์…˜)
  • location-aware attention (์œ„์น˜ ์ธ์‹ ์–ดํ…์…˜)
    • ์ฟผ๋ฆฌ๋ฒกํ„ฐ์™€ ํ‚ค๋งŒ ์‚ฌ์šฉ
  • soft attention (์†Œํ”„ํŠธ ์–ดํ…์…˜)
    • ์–ดํ…์…˜ ๊ฐ€์ค‘์น˜๊ฐ€ 0๊ณผ 1 ์‚ฌ์ด์˜ ์‹ค์ˆ˜
  • global attention (์ „์—ญ ์–ดํ…์…˜)
    • ์ž…๋ ฅ์˜ ๋ชจ๋“  ํƒ€์ž„ ์Šคํ…์— ๋Œ€ํ•ด ์ธ์ฝ”๋” ์ƒํƒœ๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๋ฉ”์ปค๋‹ˆ์ฆ˜
  • local attention (์ง€์—ญ ์–ดํ…์…˜)
    • ํ˜„์žฌ ํƒ€์ž…์Šคํ… ์ฃผ์œ„์— ์žˆ๋Š” ์ž…๋ ฅ์—๋งŒ ์˜์กดํ•˜๋Š” ๋ฉ”์ปค๋‹ˆ์ฆ˜
  • supervised attention (์ง€๋„ ์–ดํ…์…˜)
    • ๋ช…์‹œ์ ์œผ๋กœ ์ •๋ ฌ ์ •๋ณด๋ฅผ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ๋กœ ์ œ๊ณตํ•˜๋Š” ๋ฉ”์ปค๋‹ˆ์ฆ˜
    • ๋™์‹œ์— ํ›ˆ๋ จ๋˜๋Š” ๋ณ„๋„์˜ ์‹ ๊ฒฝ๋ง์„ ์‚ฌ์šฉํ•ด์„œ ์–ดํ…์…˜ ํ•จ์ˆ˜๋ฅผ ํ•™์Šต์‹œํ‚ด
  • multiheaded attention (๋ฉ€ํ‹ฐํ—ค๋“œ ์–ดํ…์…˜)
    • ํŠธ๋žœ์Šคํฌ๋จธ ๋„คํŠธ์›Œํฌ๋ฅผ ์œ„ํ•œ ๋ฉ”์ปค๋‹ˆ์ฆ˜
    • ์—ฌ๋Ÿฌ ์–ดํ…์…˜ ๋ฒกํ„ฐ๋ฅผ ์‚ฌ์šฉํ•ด์„œ ์ž…๋ ฅ์˜ ๋‹ค์–‘ํ•œ ์˜์—ญ์„ ์ถ”์ 
  • self attention (์…€ํ”„ ์–ดํ…์…˜)
    • ์ž…๋ ฅ์˜ ์–ด๋–ค ์˜์—ญ์— ์˜ํ–ฅ์„ ๋ฏธ์น˜๋Š”์ง€ ํ•™์Šตํ•˜๋Š” ๋ฉ”์ปค๋‹ˆ์ฆ˜
  • multimodal attention (๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์–ดํ…์…˜)
    • ์ด๋ฏธ์ง€์™€ ์Œ์„ฑ์ฒ˜๋Ÿผ ์ž…๋ ฅ์˜ ํ˜•ํƒœ๊ฐ€ ๋‹ค์–‘ํ•  ๋•Œ ์‚ฌ์šฉํ•˜๋Š” ๋ฉ”์ปค๋‹ˆ์ฆ˜

 

 

โ–ถ ์ฐธ๊ณ ์ž๋ฃŒ

  1. ํŒŒ์ดํ† ์น˜๋กœ ๋ฐฐ์šฐ๋Š” ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ
  2. ๋”ฅ๋Ÿฌ๋‹์„ ์ด์šฉํ•œ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ ์ž…๋ฌธ
๋ฐ˜์‘ํ˜•