λ³Έλ¬Έ λ°”λ‘œκ°€κΈ°
  • ONI와 Jean-y의 μŠ€λ§ˆνŠΈν•œ 곡간 πŸ”Ž
πŸ€– AI일잘러 μ˜€λ‹ˆμ˜ AI

λ‘œμ§€μŠ€ν‹± νšŒκ·€(Logistic Regression)

by Smart Platform 2023. 3. 18.
728x90
λ°˜μ‘ν˜•

μ•ˆλ…•ν•˜μ„Έμš” AI일잘러 μ˜€λ‹ˆμž…λ‹ˆλ‹€ πŸ€–

λ‘œμ§€μŠ€ν‹±νšŒκ·€μ— λŒ€ν•œ 글을 μž‘μ„±ν•΄λ³΄μ•˜μŠ΅λ‹ˆλ‹€ πŸ–‹

μ˜€λŠ˜μ€ λ‘œμ§€μŠ€ν‹± νšŒκ·€μ— λŒ€ν•΄ μ•Œμ•„λ³΄λŠ” μ‹œκ°„μ„ κ°€μ Έλ³΄κ² μŠ΅λ‹ˆλ‹€ πŸ‘ŒπŸ»

 

"Without data, you're just another person with an opinion."
- W. Edwards Deming

 

I. μ†Œκ°œ

  A. λ‘œμ§€μŠ€ν‹± νšŒκ·€μ˜ μ •μ˜
  λ‘œμ§€μŠ€ν‹± νšŒκ·€λŠ” ν•˜λ‚˜ μ΄μƒμ˜ 예츑 λ³€μˆ˜λ₯Ό 기반으둜 이진 κ²°κ³Ό(0 λ˜λŠ” 1)λ₯Ό μ˜ˆμΈ‘ν•˜λŠ” λΆ„λ₯˜ λ¬Έμ œμ— μ‚¬μš©λ˜λŠ” 톡계적 λ°©λ²•μž…λ‹ˆλ‹€. κ²°κ³Ό λ³€μˆ˜μ˜ ν™•λ₯ μ„ 예츑 λ³€μˆ˜μ˜ ν•¨μˆ˜λ‘œ λͺ¨λΈλ§ν•˜λŠ” 지도 ν•™μŠ΅ μ•Œκ³ λ¦¬μ¦˜μ˜ μΌμ’…μž…λ‹ˆλ‹€.

  B. λ‘œμ§€μŠ€ν‹± νšŒκ·€μ˜ μ‚¬μš© 사둀
  λ‘œμ§€μŠ€ν‹± νšŒκ·€λŠ” 의료, λ§ˆμΌ€νŒ…, 금육, μ‚¬νšŒκ³Όν•™ λ“± λ‹€μ–‘ν•œ λΆ„μ•Όμ—μ„œ 널리 μ‚¬μš©λ˜κ³  μžˆμŠ΅λ‹ˆλ‹€. λͺ‡ 가지 μ‚¬μš© μ‚¬λ‘€λŠ” λ‹€μŒκ³Ό κ°™μŠ΅λ‹ˆλ‹€:
    β–ͺ 증상을 기반으둜 ν™˜μžμ˜ μ§ˆλ³‘ μ—¬λΆ€ 예츑
    β–ͺ λΉ„μ¦ˆλ‹ˆμŠ€μ—μ„œ μ΄νƒˆν•  κ°€λŠ₯성이 λ†’은 κ³ κ° μ‹λ³„
    β–ͺ μ΄λ©”일을 μŠ€νŒΈ λ˜λŠ” μŠ€νŒΈμ΄ μ•„λ‹Œ κ²ƒμœΌλ‘œ λΆ„λ₯˜
    β–ͺ μ‹ μš© μΉ΄λ“œ μ‚¬κΈ° κ±°λž˜ μ‹λ³„

 

II. λ‘œμ§€μŠ€ν‹± νšŒκ·€μ˜ κ°œλ… 이해

  A. 쒅속 λ³€μˆ˜μ™€ 독립 λ³€μˆ˜
  λ‘œμ§€μŠ€ν‹± νšŒκ·€μ—μ„œ 쒅속 λ³€μˆ˜(κ²°κ³Ό λ³€μˆ˜λΌκ³ λ„ 함)λŠ” 이진(0 λ˜λŠ” 1)이고 독립 λ³€μˆ˜(예츑 λ³€μˆ˜λΌκ³ λ„ 함)λŠ” μ—°μ†ν˜• λ˜λŠ” λ²”μ£Όν˜•μΌ 수 μžˆμŠ΅λ‹ˆλ‹€.

  B. μ‹œκ·Έλͺ¨μ΄λ“œ ν•¨μˆ˜
  μ‹œκ·Έλͺ¨μ΄λ“œ ν•¨μˆ˜λŠ” λ‘œμ§€μŠ€ν‹± νšŒκ·€μ—μ„œ μ‹€μˆ˜ 값을 0κ³Ό 1 μ‚¬μ΄μ˜ ν™•λ₯  κ°’μœΌλ‘œ λ³€ν™˜ν•˜λŠ” 데 μ‚¬μš©λ˜λŠ” μˆ˜ν•™ ν•¨μˆ˜μž…λ‹ˆλ‹€. μ‹œκ·Έλͺ¨μ΄λ“œ ν•¨μˆ˜λŠ” λ‹€μŒκ³Ό 같은 κ³΅μ‹μœΌλ‘œ ν‘œν˜„λ©λ‹ˆλ‹€:

  1 / (1 + exp(-z))

μ—¬κΈ°μ„œ zλŠ” 독립 λ³€μˆ˜μ™€ 각 κ³„μˆ˜μ˜ μ„ ν˜• μ‘°ν•©μž…λ‹ˆλ‹€.

  C. λΉ„μš© ν•¨μˆ˜
  λΉ„μš© ν•¨μˆ˜λŠ” λ‘œμ§€μŠ€ν‹± νšŒκ·€ λͺ¨λΈμ˜ μ„±λŠ₯을 ν‰κ°€ν•˜λŠ” 데 μ‚¬μš©λ©λ‹ˆλ‹€. 이 ν•¨μˆ˜λŠ” 예츑 ν™•λ₯ κ³Ό 쒅속 λ³€μˆ˜μ˜ μ‹€μ œ κ°’ μ‚¬μ΄μ˜ 차이λ₯Ό μΈ‘μ •ν•©λ‹ˆλ‹€. λͺ©ν‘œλŠ” λΉ„μš© ν•¨μˆ˜λ₯Ό μ΅œμ†Œν™”ν•˜μ—¬ 더 λ‚˜μ€ λͺ¨λΈ μ„±λŠ₯을 λ‹¬μ„±ν•˜λŠ” κ²ƒμž…λ‹ˆλ‹€.

III. λ‘œμ§€μŠ€ν‹± νšŒκ·€λ₯Ό μˆ˜ν–‰ν•˜λŠ” 단계
  A. 데이터 μ „μ²˜λ¦¬
  이 λ‹¨κ³„μ—λŠ” 뢄석을 μ€€λΉ„ν•˜κΈ° μœ„ν•΄ 데이터 집합을 μ •λ¦¬ν•˜κ³  λ³€ν™˜ν•˜λŠ” μž‘μ—…μ΄ ν¬ν•¨λ©λ‹ˆλ‹€. μ—¬κΈ°μ—λŠ” λ‹€μŒμ΄ 포함될 수 μžˆμŠ΅λ‹ˆλ‹€.
    β–ͺ  λˆ„λ½λœ κ°’ μ²˜λ¦¬
    β–ͺ  μ€‘볡 μ œκ±°
    β–ͺ  λ²”μ£Όν˜• λ³€μˆ˜ μΈμ½”λ”©
    β–ͺ  μˆ«μž λ³€μˆ˜ μŠ€μΌ€μΌλ§

 

  B. 데이터 집합 λΆ„ν• 
  데이터 μ„ΈνŠΈλŠ” ν›ˆλ ¨ μ„ΈνŠΈμ™€ ν…ŒμŠ€νŠΈ μ„ΈνŠΈμ˜ 두 λΆ€λΆ„μœΌλ‘œ λΆ„ν• ν•΄μ•Ό ν•©λ‹ˆλ‹€. ν›ˆλ ¨ μ„ΈνŠΈλŠ” λͺ¨λΈμ„ ν›ˆλ ¨ν•˜λŠ” 데 μ‚¬μš©λ˜λ©°, ν…ŒμŠ€νŠΈ μ„ΈνŠΈλŠ” λͺ¨λΈμ˜ μ„±λŠ₯을 ν‰κ°€ν•˜λŠ” 데 μ‚¬μš©λ©λ‹ˆλ‹€.

  C. λͺ¨λΈ ν›ˆλ ¨
  λ‹€μŒ λ‹¨κ³„λŠ” λ‘œμ§€μŠ€ν‹± νšŒκ·€ λͺ¨λΈμ„ ν›ˆλ ¨ 집합에 λ§žμΆ”λŠ” κ²ƒμž…λ‹ˆλ‹€. μ—¬κΈ°μ—λŠ” λΉ„μš© ν•¨μˆ˜λ₯Ό μ΅œμ†Œν™”ν•˜λŠ” 독립 λ³€μˆ˜ κ³„μˆ˜μ˜ 졜적 값을 μ°ΎλŠ” μž‘μ—…μ΄ ν¬ν•¨λ©λ‹ˆλ‹€.

  D. λͺ¨λΈ 평가
  λͺ¨λΈμ΄ ν•™μŠ΅λ˜λ©΄ ν…ŒμŠ€νŠΈ μ„ΈνŠΈμ—μ„œ 평가해야 ν•©λ‹ˆλ‹€. μ—¬κΈ°μ—λŠ” 정확도, 정밀도, 리콜, F1 점수 λ“± λ‹€μ–‘ν•œ μ„±λŠ₯ λ©”νŠΈλ¦­μ„ κ³„μ‚°ν•˜λŠ” μž‘μ—…μ΄ ν¬ν•¨λ©λ‹ˆλ‹€.

  E. 예츑
  λ§ˆμ§€λ§‰ λ‹¨κ³„λŠ” ν•™μŠ΅λœ λͺ¨λΈμ„ μ‚¬μš©ν•˜μ—¬ μƒˆλ‘œμš΄ 데이터λ₯Ό μ˜ˆμΈ‘ν•˜λŠ” κ²ƒμž…λ‹ˆλ‹€. μ—¬κΈ°μ—λŠ” μƒˆλ‘œμš΄ 데이터λ₯Ό λͺ¨λΈμ— μž…λ ₯ν•˜κ³  ν•™μŠ΅λœ κ³„μˆ˜λ₯Ό μ‚¬μš©ν•˜μ—¬ 예츑 ν™•λ₯ μ„ κ³„μ‚°ν•˜λŠ” μž‘μ—…μ΄ ν¬ν•¨λ©λ‹ˆλ‹€.

IV. 마치며

  A. λ‘œμ§€μŠ€ν‹± νšŒκ·€μ˜ μž₯점
  λ‘œμ§€μŠ€ν‹± νšŒκ·€ λΆ„μ„μ—λŠ” λ‹€μŒκ³Ό 같은 λͺ‡ 가지 μž₯점이 μžˆμŠ΅λ‹ˆλ‹€:
    β–ͺ  κ΅¬ν˜„ λ° ν•΄μ„μ΄ μ‰½μŠ΅λ‹ˆλ‹€.
    β–ͺ  λ” μ μ€ μ»΄ν“¨νŒ… λ¦¬μ†ŒμŠ€ ν•„μš”
    β–ͺ  λ²”μ£Όν˜• λ°μ΄ν„°μ™€ μˆ«μž λ°μ΄ν„°λ₯Ό λͺ¨λ‘ μ²˜λ¦¬ν•  μˆ˜ μžˆμŠ΅λ‹ˆλ‹€.


  B. λ‘œμ§€μŠ€ν‹± νšŒκ·€μ˜ ν•œκ³„
  λ‘œμ§€μŠ€ν‹± νšŒκ·€ 뢄석에도 λ‹€μŒκ³Ό 같은 λͺ‡ 가지 ν•œκ³„κ°€ μžˆμŠ΅λ‹ˆλ‹€:
    β–ͺ  λ…립 λ³€μˆ˜μ™€ λ‘œμ§“ ν•¨μˆ˜ κ°„에 μ„ ν˜• κ΄€κ³„κ°€ μžˆλ‹€κ³  κ°€μ •ν•©λ‹ˆλ‹€.
    β–ͺ  μƒκ΄€κ΄€κ³„κ°€ λ†’은 λ³€μˆ˜μ—μ„œλŠ” μž˜ μž‘λ™ν•˜μ§€ μ•Šμ„ μˆ˜ μžˆμŒ
    β–ͺ  λΉ„μ„ ν˜• κ΄€κ³„에 λŒ€ν•΄ λ” λ³΅μž‘ν•œ λͺ¨λΈμ΄ ν•„μš”ν•  μˆ˜ μžˆμŒ


  결둠적으둜 λ‘œμ§€μŠ€ν‹± νšŒκ·€λŠ” λΆ„λ₯˜ 문제λ₯Ό μœ„ν•œ κ°•λ ₯ν•œ λ„κ΅¬λ‘œ, μ—¬λŸ¬ λΆ„μ•Όμ—μ„œ λ‹€μ–‘ν•˜κ²Œ ν™œμš©λ˜κ³  μžˆμŠ΅λ‹ˆλ‹€. κ΄€λ ¨λœ κ°œλ…κ³Ό 단계λ₯Ό μ΄ν•΄ν•˜λ©΄ λͺ¨λΈμ˜ μ„±λŠ₯을 μ„±κ³΅μ μœΌλ‘œ κ΅¬ν˜„ν•˜κ³  평가할 수 μžˆμŠ΅λ‹ˆλ‹€.

λŒ“κΈ€