본문 바로가기

강의/Udacity ML

4.24 모델 버전 관리

SMALL

이전 예에서는 각 커밋이 해당 모델에 대한 점수로 문서화되어 있음을 알 수 있었다. 이것은 모델 버전을 추적하는 데 도움이 되는 간단한 방법이다. 데이터 과학의 버전 제어는 까다로울 수 있다. 대량의 데이터, 모델 버전, 시드 및 하이퍼 파라미터와 같이 추적하기 어려운 부분이 많기 때문이다.

 

ML 모델의 버전 관리

기계 학습 작업(현재 유행어 패턴 xxOps에서는 mlOps라고 함)은 기존 소프트웨어 개발 작업(devOps)과는 상당히 다르다. 그 이유 중 하나는 ML 실험에서 코드(작은 일반 파일) 외에도 큰 데이터 집합과 모델 아티팩트가 요구되기 때문이다.

 

1. ML 모델은 확장성, 보안, 가용성, 사실상 무제한의 스토리지 공간으로 지속된다.

2. ML 모델은 버전 제어 하에 있다. 즉, 특정 버전의 태그와 액세스를 편리하게 할 수 있다.

3. 버전 제어 데이터셋과 함께 분석 코드를 통해 ML 모델의 감사성, 투명성, 재현성을 보장할 수 있다.

4. 기존 모델 설정에 따라 새로운 실험을 빠르고 협업적으로 초기화할 수 있다.

 

Git 과 DVC

git

(데이터셋 및 모델 아티팩트의) 코드 및 메타데이터를 처리한다.

dvc

대규모 데이터 집합 및 모델 아티팩트를 처리한다.

 

 

 

 

SMALL

'강의 > Udacity ML' 카테고리의 다른 글

5.7 테스트 중심의 개발 및 데이터 과학  (0) 2021.08.04
5.2 테스팅 & 도구  (0) 2021.07.31
4.23 VC 시나리오 #3  (0) 2021.07.30
4.22 VC 시나리오 #2  (0) 2021.07.30
4.21 VC 시나리오 #1  (0) 2021.07.30