λ³Έλ¬Έ λ°”λ‘œκ°€κΈ°
ꡐ윑/슀파λ₯΄νƒ€

[TIL] 내일배움캠프 AI 9κΈ° - 10회

by gomdeng 2024. 12. 6.

🐢 ν•™μŠ΅ λ²”μœ„

  • κ°•μ’Œ:  λ°”λ‹₯λΆ€ν„° μ‹œμž‘ν•˜λŠ” λ¨Έμ‹ λŸ¬λ‹ 3~5 μ£Όμ°¨

 

🐢 곡뢀 λ‚΄μš©

ν˜„μž¬ λ³΄μœ ν•˜κ³  μžˆλŠ” 지식과 κ°•μ˜λ‘œλŠ” 이해가 κ°€λŠ₯ν•œ λ‚΄μš©μ΄ 거의 μ—†μ—ˆλ‹€.
λ‹€μ‹œ 듀을 λ•Œ 도움이 λ˜λ„λ‘ κ°•μ˜μ—μ„œ λ‚˜μ˜¨ μš©μ–΄μ— λŒ€ν•΄ μ •λ¦¬ν•˜κ³ μž ν•œλ‹€.
✨ νšŒκ·€ λͺ¨λΈ
   1. ν†΅κ³„ν•™μ—μ„œ ν•˜λ‚˜ λ˜λŠ” κ·Έ μ΄μƒμ˜ 독립 λ³€μˆ˜μ™€ 쒅속 λ³€μˆ˜ κ°„μ˜ 관계λ₯Ό λͺ¨λΈλ§ν•˜λŠ” 데 μ‚¬μš©
   2. λ³€μˆ˜λ“€ μ‚¬μ΄μ˜ 관계λ₯Ό μˆ˜μ‹μœΌλ‘œ ν‘œν˜„
   3. μ£Όμ–΄μ§„ 데이터에 κΈ°λ°˜ν•΄ 쒅속 λ³€μˆ˜μ˜ 값을 μ˜ˆμΈ‘ν•˜κ±°λ‚˜ μ„€λͺ…ν•˜λŠ” 데 μ‚¬μš©
   
   βœ”️ μœ ν˜•

   1) λ‹¨μˆœ μ„ ν˜• νšŒκ·€ (Simple Linear Regression)
        • ν•œ 개의 독립 λ³€μˆ˜μ™€ ν•œ 개의 쒅속 λ³€μˆ˜ μ‚¬μ΄μ˜ μ„ ν˜• 관계λ₯Ό λͺ¨λΈλ§


   2) 닀쀑 μ„ ν˜• νšŒκ·€ (Multiple Linear Regression)
        • 두 개 μ΄μƒμ˜ 독립 λ³€μˆ˜λ₯Ό ν¬ν•¨ν•˜κ³  쒅속 λ³€μˆ˜μ™€μ˜ μ„ ν˜• 관계λ₯Ό μ„€λͺ…
        • νŠΉμ • 이벀트의 λ°œμƒ μ—¬λΆ€λ₯Ό μ˜ˆμΈ‘ν•˜λŠ” 데 μ‚¬μš©
        • λͺ¨λΈμ€ 쒅속 λ³€μˆ˜μ˜ 둜그 였즈(log-odds)κ°€ 독립 λ³€μˆ˜μ˜ μ„ ν˜• μ‘°ν•©μœΌλ‘œ ν‘œν˜„


   3) λ‘œμ§€μŠ€ν‹± νšŒκ·€ (Logistic Regression)
        • 쒅속 λ³€μˆ˜κ°€ 이진 κ°’(예: 0 λ˜λŠ” 1)인 경우 μ‚¬μš©    

        • νŠΉμ • 이벀트의 λ°œμƒ μ—¬λΆ€λ₯Ό μ˜ˆμΈ‘ν•˜λŠ” 데 μ‚¬μš©
        • λͺ¨λΈμ€ 쒅속 λ³€μˆ˜μ˜ 둜그 였즈(log-odds)κ°€ 독립 λ³€μˆ˜μ˜ μ„ ν˜• μ‘°ν•©μœΌλ‘œ ν‘œν˜„

   4) λ‹€ν•­ νšŒκ·€ (Polynomial Regression)
        • 독립 λ³€μˆ˜μ˜ 고차항을 ν¬ν•¨ν•˜μ—¬ λ³΅μž‘ν•œ λΉ„μ„ ν˜• 관계λ₯Ό λͺ¨λΈλ§


✨ μ§€λ„ν•™μŠ΅
   1. κΈ°κ³„ν•™μŠ΅μ˜ ν•œ 방법
   2. μ•Œκ³ λ¦¬μ¦˜μ΄ λ ˆμ΄λΈ”μ΄ μ§€μ •λœ ν›ˆλ ¨ 데이터λ₯Ό μ‚¬μš© 및 ν•™μŠ΅
   3. μƒˆλ‘œμš΄ λ°μ΄ν„°μ˜ 좜λ ₯을 μ˜ˆμΈ‘ν•˜λŠ” λͺ¨λΈμ„ κ΅¬μΆ•ν•˜λŠ” κ³Όμ •
   
   βœ”️ νŠΉμ§•

   1) λ ˆμ΄λΈ”λœ 데이터
        • μ•Œκ³ λ¦¬μ¦˜μ€ μž…λ ₯(X)κ³Ό μ •ν™•ν•œ 좜λ ₯(Y) 쌍이 ν¬ν•¨λœ 데이터 μ„ΈνŠΈλ₯Ό μ‚¬μš©ν•˜μ—¬ ν•™μŠ΅


   2) λͺ¨λΈ 예츑
        • ν•™μŠ΅λœ νŒ¨ν„΄μ„ 기반으둜 μƒˆλ‘œμš΄ μž…λ ₯ 데이터에 λŒ€ν•œ μ˜ˆμΈ‘μ„ μˆ˜ν–‰


   3) 평가
        • λͺ¨λΈμ˜ μ„±λŠ₯은 검증 데이터셋 λ˜λŠ” ν…ŒμŠ€νŠΈ 데이터셋을 μ‚¬μš©ν•˜μ—¬ 평가 

        • 정확도, 정밀도, μž¬ν˜„μœ¨, F1 점수 λ“± λ‹€μ–‘ν•œ μ§€ν‘œλ‘œ μΈ‘μ •

   βœ”️ μœ ν˜•

   1) λΆ„λ₯˜(Classification)
        • 좜λ ₯ λ³€μˆ˜κ°€ λ²”μ£Όν˜•(예: 이메일이 μŠ€νŒΈμΈμ§€ μ•„λ‹Œμ§€)일 λ•Œ μ‚¬μš©


   2) νšŒκ·€(Regression)
        • 좜λ ₯ λ³€μˆ˜κ°€ 연속적인 수치(예: μ§‘μ˜ 가격, μ˜¨λ„ λ“±)일 λ•Œ μ‚¬μš©

 

 

🐢 λŠλ‚€μ 

1. μ œκ³΅λ˜λŠ” κ°•μ’Œλ‘œλŠ” 도무지 따라가기 μ–΄λ €μšΈ 것 κ°™λ‹€λŠ” νŒλ‹¨μ΄ λ“€μ—ˆλ‹€. 
2. κ°œμΈμ μœΌλ‘œλΌλ„ μ–΄λ–»κ²Œλ“  κ³΅λΆ€ν•˜λŠ” μ‹œκ°„μ„ λ§ˆλ ¨ν•΄μ•Ό ν•  것 κ°™λ‹€.
3. μ–΄λ–»κ²Œλ“  λ¨Έμ‹ λŸ¬λ‹ κ°•μ’Œλ₯Ό λ‹€ λ“€μ—ˆλŠ”λ° ν† ν• κ±° κ°™λ‹€.