Potato
์•ˆ๋…•ํ•˜์„ธ์š”, ๊ฐ์žก๋‹ˆ๋‹ค?๐Ÿฅ” ^___^ ๐Ÿ˜บ github ๋ฐ”๋กœ๊ฐ€๊ธฐ ๐Ÿ‘‰๐Ÿป

AI study/ํ†ต๊ณ„ & ML & DL

[๋จธ์‹ ๋Ÿฌ๋‹] ์ง€๋„ํ•™์Šต / ๋น„์ง€๋„ํ•™์Šต ํŠน์ง•๊ณผ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์˜ˆ์‹œ

๊ฐ์ž ๐Ÿฅ” 2020. 12. 20. 18:07
๋ฐ˜์‘ํ˜•

 

์ง€๋„ํ•™์Šต (Supervised Learning
  • ์•Œ๊ณ ๋ฆฌ์ฆ˜์— ์ฃผ์ž…๋˜๋Š” ํ›ˆ๋ จ๋ฐ์ดํ„ฐ์— ๋ ˆ์ด๋ธ”(y๊ฐ’)์ด ํฌํ•จ๋˜์–ด ์žˆ๋‹ค.
    • ์˜ˆ) ๊ณ ์–‘์ด์‚ฌ์ง„(1,0), ๊ฐ•์•„์ง€์‚ฌ์ง„ (0,1) ์ด๋Ÿฐ์‹์œผ๋กœ ์ •ํ™•ํ•œ ๋ผ๋ฒจ๋ง์ด ๋˜์–ด์žˆ๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ํ›ˆ๋ จ๋ฐ์ดํ„ฐ๋กœ ์ด์šฉํ•œ๋‹ค.
  • ๋Œ€ํ‘œ์ ์ธ ์ง€๋„ํ•™์Šต ๋ฐฉ๋ฒ•

https://www.slideshare.net/ssuser163469/ndc-2016-61452271

    • ๋ถ„๋ฅ˜
      • ์ข…๋ฅ˜๋ฅผ ์˜ˆ์ธกํ•˜๋Š” ๊ฒƒ  
      • ๋ฐ์ดํ„ฐ๋ฅผ ํŠน์ • ๋ผ๋ฒจ๊ฐ’(y๊ฐ’)์œผ๋กœ ๋ถ„๋ฅ˜(์˜ˆ์ธก)ํ•˜๋Š” ์ž‘์—…
      • ์ŠคํŒธ๋ถ„๋ฅ˜ ( ์ŠคํŒธ์ด๋‹ค (1)  / ์ŠคํŒธ ์•„๋‹ˆ๋‹ค (0) )  : ๋ณดํ†ต Yes / No ๋ฅผ 1๊ณผ 0์œผ๋กœ ํ‘œํ˜„ํ•œ๋‹ค. - ์ด์ง„๋ถ„๋ฅ˜
      • ์–ด๋–ค ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด ์—ฌ๋Ÿฌ๊ฐ’ ์ค‘ ํ•˜๋‚˜๋กœ ๋ถ„๋ฅ˜ํ•˜๊ธฐ๋„ ํ•œ๋‹ค. - ๋‹ค์ค‘๋ถ„๋ฅ˜
        • ๊ณ ์–‘์ด (1,0,0) / ๊ฐ•์•„์ง€ (0,1,0) / ํ† ๋ผ (0,0,1)...
    • ํšŒ๊ท€
      • ์—ฐ์†๋œ ๊ฐ’์„ ์˜ˆ์ธกํ•˜๋Š” ๊ฒƒ 
      • ์–ด๋–ค ๋ฐ์ดํ„ฐ๋“ค์˜ ํŠน์ง• (feature)์„ ํ† ๋Œ€๋กœ ๊ฐ’(์ˆ˜์น˜)์„ ์˜ˆ์ธก ํ•˜๋Š” ์ž‘์—…
        • ์˜ˆ) features = ์ฃผํ–‰๊ฑฐ๋ฆฌ, ์—ฐ์‹, ๋ธŒ๋žœ๋“œ ๋“ฑ 
               Target (๊ตฌํ•˜๋ ค๋Š” ๊ฐ’) = ์ค‘๊ณ ์ฐจ ๊ฐ€๊ฒฉ
      • ๊ฒฐ๊ณผ ๊ฐ’์€ ์‹ค์ˆ˜์ด๋ฉฐ, ์—ฐ์†์„ฑ์„ ๊ฐ–๋Š”๋‹ค.
    • ์ง€๋„ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์˜ˆ์‹œ
      • K-Nearest Neibors (k-์ตœ๊ทผ์ ‘ ์ด์›ƒ, KNN)
      • Linear Regression (์„ ํ˜• ํšŒ๊ท€)
      • Logistic Regression (๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€)
      • SVM (Support Vector Machines)
      • Decision Tree (์˜์‚ฌ๊ฒฐ์ • ๋‚˜๋ฌด)
      • Random Forest (๋žœ๋ค ํฌ๋ ˆ์ŠคํŠธ)
      • Neural Networks (์‹ ๊ฒฝ๋ง)
๋น„์ง€๋„ํ•™์Šต (Unsupervised Learning) 
  • ๋ ˆ์ด๋ธ”์ด ์—†๋Š” ์ƒํƒœ์˜ ํ›ˆ๋ จ๋ฐ์ดํ„ฐ๋ฅผ ์ด์šฉํ•˜์—ฌ ํ•™์Šตํ•˜๋Š” ๋ฐฉ๋ฒ•
  • ๋จธ์‹ ๋Ÿฌ๋‹ ์‹œ์Šคํ…œ์ด ์•Œ์•„์„œ y๊ฐ’(ํƒ€๊ฒŸ)์ด ๋ฌด์—‡์ธ์ง€ ํ•™์Šตํ•ด์•ผํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๋น„์ง€๋„ ํ•™์Šต์ด๋ผ๊ณ  ํ•œ๋‹ค.
  • ์˜ˆ์‹œ)
    • ๊ณ ์–‘์ด, ๊ฐ•์•„์ง€, ๋‹ญ, ์ƒˆ๋ฅผ ๋น„์ง€๋„ ํ•™์Šต ์‹œํ‚ค๋ฉด
      ๋‹ค๋ฆฌ๊ฐ€ 4๊ฐœ์ธ ๊ฐ•์•„์ง€, ๊ณ ์–‘์ด๋ฅผ ํ•œ ๋ฌถ์Œ์œผ๋กœ
      ๋‹ค๋ฆฌ๊ฐ€ 2๊ฐœ์ธ ๋‹ญ, ์ƒˆ๋ฅผ ํ•œ ๋ฌถ์Œ์œผ๋กœ ๋ฌถ์„ ์ˆ˜ ์žˆ์„ ๊ฒƒ์ด๋‹ค.
    • ์ด์ฒ˜๋Ÿผ ํ›ˆ๋ จ๋ฐ์ดํ„ฐ์˜ ์ ์ ˆํ•œ Feature(๋‹ค๋ฆฌ ์ˆ˜)๋ฅผ ์ฐพ์•„๋‚ด์•ผ ์ข‹์€ ๊ฒฐ๊ณผ๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ๋‹ค.
  • ๋น„์ง€๋„ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์˜ˆ์‹œ
    • ๊ตฐ์ง‘ (Clustering)
      • k-means
      • ๊ณ„์ธต ๊ตฐ์ง‘ ๋ถ„์„ (Hierarchical Cluster Analysis, HCA)
      • ๊ธฐ๋Œ“๊ฐ’ ์ตœ์†Œํ™” (Expectation maximization)
    • ์ฐจ์›์ถ•์†Œ
      (์ •๋ณด ์†์‹ค์„ ์ตœ์†Œํ™” ํ•˜๋ฉด์„œ ๋ฐ์ดํ„ฐ๋ฅผ ๊ฐ„์†Œํ™” ํ•˜๋Š” ๋ฐฉ๋ฒ•)
      ex. ์ค‘๊ณ ์ฐจ์˜ ๊ฐ€๊ฒฉ์„ ์˜ˆ์ธกํ• ๋•Œ, ์ฃผํ–‰๊ฑฐ๋ฆฌ์™€ ์—ฐ์‹์€ ๋งค์šฐ ์ƒ๊ด€์žˆ๋Š” ๊ด€๊ณ„. ์ด๋ฅผ "๋งˆ๋ชจ ์ •๋„"๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ํ•˜๋‚˜์˜ ํŠน์„ฑ์œผ๋กœ ํ•ฉ์นจ์œผ๋กœ์จ ๋ฐ์ดํ„ฐ์˜ ์ฐจ์›์„ ์ถ•์†Œํ•  ์ˆ˜ ์žˆ๋‹ค. (์ด๋ฅผ ํŠน์„ฑ ์ถ”์ถœ ์ด๋ผ๊ณ  ํ•œ๋‹ค.)
      • ์ฃผ์„ฑ๋ถ„ ๋ถ„์„ (Principal Component Analysis, PCA)
      • ์ปค๋„ PCA
      • ์ง€์—ญ์  ์„ ํ˜• ์ž„๋ฐฐ๋”ฉ
      • t-SNE (t-distributed Stochastic Neighbor Embedding, ์‹œ๊ฐํ™”ํ•จ์œผ๋กœ์จ ์ฐจ์›์„ ์ถ•์†Œํ•˜๋Š” ๋ฐฉ์‹)
    • ์—ฐ๊ด€ ๊ทœ์น™ ํ•™์Šต
      (๋ฐ์ดํ„ฐ์˜ ํŠน์„ฑ ๊ฐ„์˜ ํฅ๋ฏธ๋กœ์šด ๊ด€๊ณ„๋ฅผ ์ฐพ์•„๋‚ด๋Š” ํ•™์Šต)
      ex. "๋งฅ์ฃผ๋ฅผ ์‚ฌ๋ฉด์„œ ํ•จ๊ป˜ ๊ธฐ์ €๊ท€๋ฅผ ์‚ฐ๋‹ค" ๋ผ๋Š” ํŠน์ดํ•œ ์—ฐ๊ด€๊ด€๊ณ„๋ฅผ ๋ฐํ˜€๋‚ด๋ฉด์„œ ๋‹ค๋ฐฉ๋ฉด์œผ๋กœ ํ™œ์šฉ ๊ฐ€๋Šฅํ•˜๋‹ค.
      • Apriori
      • Eclat
๋ฐ˜์‘ํ˜•