본문 바로가기

강의

(63)
2.12 모델 평가 데이터를 수집하고 모델을 교육한 후에는 모델의 성능을 평가할 수 있다. 평가에 사용되는 매트릭스는 정의한 문제에 특정할 수 있다. 머신러닝에 대한 이해도가 높아짐에 따라 효과적으로 평가할 수 있는 다양한 매트릭스를 탐색할 수 있다. 모델 정확도 사용 모델 정확도는 꽤 일반적인 평가 지표이다. 정확도는 모델이 정확히 맞추는 예측 비율이다. 예를 들어, 꽃잎 길이와 같은 측정 가능한 세부 정보를 바탕으로 꽃을 일반적인 두 종중 하나로 식별하는 모델을 만들었다고 상상해보자. 모형이 올바른 종을 예측하는 빈도를 알고자 할때, 모델의 정확성을 살펴봐야 한다. 확장된 학습 로그 손실 사용 모델이 생성하는 예측에 대해 얼마나 불확실한지 계산하는것. 불확실성은 모델이 생성되는 예측이 얼마나 정확하다고 생각하는지를 의미..
2.10 모델 훈련 데이터셋 나누기 모델 훈련의 첫번째 단계는 데이터 셋을 무작위로 분할하는 것이다. 따라서 훈련 중 일ㅇ부 데이터를 숨겨 두면 모델을 생산에 투입하기 전에 데이터를 평가하는데 사용할 수 있다. 특히 치우침 - 분산 트레이드 오프를 검사하기 위해 이 작업을 수행한다. 데이터 셋을 분할하면 두가지 데이터 셋이 제공된다. 훈련 데이터셋 모델을 교육할 데이터. 대부분의 데이터가 포함된다. 많은 개발자들이 약 80%로 추산한다. 테스트 데이터셋 훈련 중에 모델에서 보류된 데이터는 모델이 새 데이터에 얼마나 잘 일반화가 되었는지 테스트하는데 사용된다. 모델 훈련 용어 모델 훈련 알고리즘은 일부 손실 기능을 최소화하기 위해 모델의 파라미터를 반복적으로 업데이트한다. 모델 파라미터 모델의 동작 방식을 변경하기 위해 훈련..
2.8 데이터셋 만들기 요약 다음 순서는 기계 학습 기반 문제를 해결하는 데 사용할 수 있는 데이터셋을 구축하는 것이다. 필요한 데이터를 이해하면 보다 효과적인 솔루션을 구축할 수 있도록 더 나은 모델과 알고리즘을 선택하는 데 도움이 된다. 기계학습 과정에서 가장 중요한 단계 데이터를 작업하는 것은 아마도 기계 학습 프로세스의 가장 간과되면서도 중요한 단계이다. 2017년에 실시된 O'Reilly 연구에 따르면 머신러닝 실무자는 80%의 시간을 데이터 작업에 할애했다. 데이터 작업의 4가지 측면 데이터 수집 - 데이터 검사 - 요약 통계 - 데이터 시각화 기계학습 애플리케이션의 데이터 작업, 이해 및 처리에대해서만 전체 클래스를 수강할 수 있다. 어떤 종류의 기계학습 프로젝트에서도 우수한 품질의 데이터는 필수적이다. 이제 데이..
2.6 문제 정의 어떻게 머신 러닝 작업을 시작할 것인가? 아주 명확한 작업을 정의해라. 스노우콘 판매 사례에서 매출을 올릴 수 있는 방법은 구체적인 과제와는 정반대이다. 이 문제에 대한 답을 어떻게 시도할 수 있는지를 보여준다 : '1달러를 추가하면 판매가 증가하는가?' / '스노우콘에 유기농 향료를 0.5달러 추가하면 판매가 증가하는가?' 이 문제를 해결하는데 사용할 수 있는 머신러닝 과제를 식별한다. 머신러닝 작업이란? 모든 모델 훈련 알고리즘과 모델 자체는 데이터를 입력으로 사용한다. 출력은 다를 수 있으며, 해결하도록 설계된 과제에 따라 몇개의 다른 그룹으로 분류된다. 종종 머신러닝 과제를 정의하는 과정의 일환으로 모델을 교육하는데 필요한 종류의 데이터를 사용한다. 이번 수업에서 지도학습, 비지도학습의 두 보편적..
2.5 머신 러닝의 5단계 머신 러닝 처리의 주요 단계 머신러닝 실무자는 사용되는 특정 모델 또는 교육 알고리즘에 관계없이 공통 워크플로우를 실습하여 머신러닝 작업을 수행한다. 이러한 단계는 반복적이다. 실제로 프로세스의 각 단계에서 프로세스가 어떻게 진행되는지 검토해야 한다. 예상대로 진행되지 않는다면 다시 돌아가 현재 단계 또는 이전 단계를 재수행하여 식별해야 한다. https://www.notion.so/2-5-Introduction-to-the-Five-Machine-Learning-Steps-f0a2fa28bf714754bcf3736b7c740ff7
2.3 머신러닝의 구성 요소 머신러닝의 구성 요소 기계학습을 통해 해결된 거의 모든 작업은 다음 세가지 주요 구성 요소를 포함한다. 머신 러닝 모델 모델 학습 알고리즘 모델 추론 알고리즘 찰흙에 빗대어 머신러닝 이해하기 찰흙으로 찻주전자를 만드는 단계를 생각하며 머신러닝의 요소 간의 관계를 이해할 수 있다. 1. 먼저, 흙 한 덩어리로 시작한다. 이 단계에서는 점토를 다양한 형태로 성형하여 다양한 용도로 사용할 수 있다. 찻주전자 하나를 만들기 위해 이 진흙 덩어리를 사용한다. 2. 흙을 검사하고 분석하여 찻주전자 처럼 만든다. 3. 찻주전자를 목표로 찰흙을 성형한다. 머신 러닝 모델이란? 머신러닝 모델은 점토 조각과 마찬가지로 여러 다양한 형태로 성형될 수 있으며 다양한 용도로 사용할 수 있다. 보다 기술적인 정의는 머신러닝 모델..
2.2 머신러닝이란 무엇인가? 머신러닝이란 무엇인가? 머신러닝은 최신 소프트웨어 개발 기술과 컴퓨터가 실제 데이터의 예를 사용하여 문제를 해결할 수 있도록 하는 인공지능(AI)의 일종이다. 머신러닝은 명확한 프로그램 없이도 컴퓨터가 자동적으로 배우고 경험을 통해 향상하도록 한다. 요약 머신러닝은 더 넓은 인공지능 분야이다. 이 분야는 인간과 유사한 지능을 사용하여 작업을 수행할 수 있는 기계의 기능과 관련이 있다. 기계 학습에는 몇가지 기법이 존재한다. 1. 지도형 기계 학습 모든 데이터 셋의 훈련 샘플은 라벨 또는 출력 값이 연결되어 있다. 그 결과 알고리즘은 라벨 또는 출력 값을 예측하는 방법을 학습한다. 2. 비지도형 기계 학습 학습 데이터에 대한 라벨이 없다. 기계학습 알고리즘은 데이터를 지배하는 기본 패턴 또는 분포를 학습한..

LIST