본문 바로가기

강의/Udacity ML

2.19 비디오 유출 감지

SMALL

이 예제에서는 신경 네트워크를 사용한다. 신경 네트워크의 작동 방식에 대한 알고리즘은 이번 강의의 범위를 벗어나지만 어떻게 적용되는지 보기 위해 적용한다.

 


1단계 : 문제 정의

전문 현장 관리 서비스를 제공하는 회사를 운영하고 있다고 가정하자. 산업 화학 공장 고객에게는 유출 및 기타 건강 위험에 대한 신속한 대응이 필요하다. 공장의 보안 감시 시스템을 사용하여 유출물을 자동으로 탐지할 수 있다면 관리팀을 더 빨리 동원할 수 있다.

이미지 -> 모델 -> 유출 포함 감지

 


2단계 : 모델 훈련 (+ 선택)

이 작업은 지도형 훈련이다. 목표는 각 이미지가 클래스에 속하는지 여부를 예측하는 것이다.

유출 포함 / 미포함 -> ML 작업 -> 지도형 훈련 (데이터 라벨화) -> 카테고리 라벨

 

2단계 : 데이터셋 만들기

수집

과거 데이터와 안전하게 준비된 유출물을 사용하여 여러 조명 조건 및 환경에서 유출 및 유출되지 않은 모든 이미지 컬렉션을 구축할 수 있다.

 

탐지 및 정화

모든 사진을 살펴서 유출이 사진에 확실히 있는지 확인해야 한다. Python 도구와 영상 화질을 개선하기 위해 사용할 수 있는 기술이 있고, 반복이 필요할 경우 사용할 수 있다.

 

데이터 벡터화 (수치화)

많은 모델에서 숫자 데이터가 필요하므로 모든 이미지 데이터를 숫자 형식으로 변환해야 한다. Python 도구를 사용하면 자동으로 수행할 수 있다.

각 픽셀이 0, 1로 표시되는 방법이 있다. 0은 완전히 검은색이고 1은 흰색이다.

 

데이터 나누기

이미지 데이터를 훈련 데이터 셋과 테스트 데이터 셋으로 분할할 수 있다.

 


3단계 : 모델 훈련

전통적으로 이 문제를 해결하려면 기본 픽셀 위에 수공학적 기능 (이미지에서 눈에 띄는 가장자리와 모서리의 위치 등)을 배치 후 기능에 대한 모델을 훈련해야 한다.

오늘날, 딥 신경망은 이러한 종류의 문제를 해결하기 위해 사용되는 가장 흔한 도구이다. 많은 딥 뉴럴 네트워크 모델은 기본 픽셀 위에 있는 기능을 학습하도록 구성되어 있으므로 배울 필요가 없다. 우선 전반적인 내용을 살펴본다.

 

CNN (Convolutional nueral network)

신경망은 서로 연결된 매우 간단한 모델의 집합이라고 생각할 수 있다. 이러한 간단한 모델들은 뉴런이라고 불리며, 이 모델들 사이의 연결은 웨이트라고 불리는 훈련 가능한 모델 매개 변수이다.

 


4단계 : 모델 평가

모델을 평가하는데 사용할 수 있는 통계 매트릭은 매우 다양하다. 기계 학습에 대한 경험이 쌓이면 모델을 가장 효과적으로 평가하는 데 도움이 될 수 있는 매트릭을 조사하는 방법을 배우게 된다.

 

Confusion Matrix : False negative rate / Recall precision

F1 Score : Log Loss / ROC curve, Negative predictive value / Specificity

 

이러한 경우 정확도가 최상의 평가 매커니즘이 아닐 수 있다.

이유 : 이 모델이 항상 유출을 포함하지 않음 클래스를 볼 수 있다. 따라서 대부분의 경우 유출이 발생하지 않음을 예측하는 모델은 매우 정확해 보일 것이다. 정말로 신경써야 할 것은 실제 유출을 거의 놓치지 않는 평가 도구이다.

 

정밀도리콜이 효과적임을 알 수 있다. 정밀도는 유출에 대한 모든 예측 중 얼마나 맞았는가? 라는 질문에 대답할 수 있고, 모든 실제 유출 중 몇 개를 감지했는가? 에 답하여 생각할 수 있다.

 

수동 평가는 매우 중요하다. 실제 유출에 비해 단계적 유출이 충분히 현실적인가 확신할 수 없다. 모델이 실제 유출에서 얼마나 뛰어난 성능을 발휘하는지 보다 정확하게 파악하기 위해 기록에서 추가적인 예를 찾을 수 있다. 이렇게 모델이 만족스럽게 작동하는지 확인할 수 있다.

 


5단계 : 모델 추론

모델은 AWS Panorama와 같은 시스템 학습 워크로드를 실행하는 시스템에 배포할 수 있다.

다행히, 대부분의 경우는 유출이 포함되지 않는 경우이다. 그러나 유출 포함 클래스가 감지되면 간단한 호출 시스템이 팀에게 응답하라고 경고할 수 있다.

 


용어

Convolutional neural networks(CNN)

특히 영상을 처리하는데 뛰어난 신경 네트워크 유형

 

신경망

간단한 모델들이 연결되어 있는 것. 간단한 모델은 뉴런이라고 하고, 모델 간 연결은 웨이트라고 한다.

 

SMALL

'강의 > Udacity ML' 카테고리의 다른 글

3.4 컴퓨터 비전 및 응용 분야  (0) 2021.07.10
3.1 AWS로 머신러닝 학습하기  (0) 2021.07.09
2.18 북 장르 탐색 예제  (0) 2021.07.07
2.17 집 가격 예측  (0) 2021.07.07
2.16 예제 소개  (0) 2021.07.07