강의/Udacity ML (42) 썸네일형 리스트형 2.17 집 가격 예측 주택 가격 예측은 기계학습을 도입하는데 사용되는 가장 일반적인 예 중 하나이다. 전통적으로, 부동산 평가자들은 주택의 가치를 추정하는데 도움을 주기 위해 주택에 대한 많은 수량화 가능한 세부상황(방 수, 부지 크기, 건축 연도)을 사용한다. 1단계 : 문제 정의 Q. 집값은 부지의 크기나 침실 개수로 산정할 수 있는가? 최근 분양된 주택의 분양가에 접근하거나 주택 가격을 평가하게 할 수 있다. 이 데이터가 있으므로 지도형 학습 과제이다. 연속된 숫자 값을 예측하려고 하므로 회귀 작업이다. 2단계 : 데이터셋 만들기 데이터 수집 지난 1년동안 이웃에서 팔린 수많은 집들의 예를 수집하고, 감정가를 지불하여 분양가를 알 수 없는 집들을 평가한다. 데이터 탐구 대부분의 기게학습 모델이 일련의 번호로 작동하므로 .. 2.16 예제 소개 지도형 학습 기계학습으로 부지의 크기와 침실 수에 따른 인근 주택가격 예측 비지도형 학습 기계학습을 사용하여 뒷표지 설명의 문구를 분석하여 마이크로 장르의 책을 분리한다. 딥 뉴런 네트워크 보안카메라의 연구소 비디오 영상에서 화학 물질 유출을 탐지 2.14 모델 추론 요약 모델을 훈련하고 유효성을 평가한 후 결과에 만족하면 현장에서 보이지 않는 데이터를 사용하여 실제 문제에 대한 예측을 생성할 수 있다. 기계학습에서, 이 과정은 추론이라고 불린다. 반복 프로세스 모델을 구축한 후에도 항상 모니터링하여 원하는 결과를 얻고 있는지 확인한다. 데이터를 재조사하건, 모델 교육 알고리즘의 일부 매개 변수를 수정하거나, 훈련에 사용되는 모델 유형을 변경하는 경우가 해당된다. 2.12 모델 평가 데이터를 수집하고 모델을 교육한 후에는 모델의 성능을 평가할 수 있다. 평가에 사용되는 매트릭스는 정의한 문제에 특정할 수 있다. 머신러닝에 대한 이해도가 높아짐에 따라 효과적으로 평가할 수 있는 다양한 매트릭스를 탐색할 수 있다. 모델 정확도 사용 모델 정확도는 꽤 일반적인 평가 지표이다. 정확도는 모델이 정확히 맞추는 예측 비율이다. 예를 들어, 꽃잎 길이와 같은 측정 가능한 세부 정보를 바탕으로 꽃을 일반적인 두 종중 하나로 식별하는 모델을 만들었다고 상상해보자. 모형이 올바른 종을 예측하는 빈도를 알고자 할때, 모델의 정확성을 살펴봐야 한다. 확장된 학습 로그 손실 사용 모델이 생성하는 예측에 대해 얼마나 불확실한지 계산하는것. 불확실성은 모델이 생성되는 예측이 얼마나 정확하다고 생각하는지를 의미.. 2.10 모델 훈련 데이터셋 나누기 모델 훈련의 첫번째 단계는 데이터 셋을 무작위로 분할하는 것이다. 따라서 훈련 중 일ㅇ부 데이터를 숨겨 두면 모델을 생산에 투입하기 전에 데이터를 평가하는데 사용할 수 있다. 특히 치우침 - 분산 트레이드 오프를 검사하기 위해 이 작업을 수행한다. 데이터 셋을 분할하면 두가지 데이터 셋이 제공된다. 훈련 데이터셋 모델을 교육할 데이터. 대부분의 데이터가 포함된다. 많은 개발자들이 약 80%로 추산한다. 테스트 데이터셋 훈련 중에 모델에서 보류된 데이터는 모델이 새 데이터에 얼마나 잘 일반화가 되었는지 테스트하는데 사용된다. 모델 훈련 용어 모델 훈련 알고리즘은 일부 손실 기능을 최소화하기 위해 모델의 파라미터를 반복적으로 업데이트한다. 모델 파라미터 모델의 동작 방식을 변경하기 위해 훈련.. 2.8 데이터셋 만들기 요약 다음 순서는 기계 학습 기반 문제를 해결하는 데 사용할 수 있는 데이터셋을 구축하는 것이다. 필요한 데이터를 이해하면 보다 효과적인 솔루션을 구축할 수 있도록 더 나은 모델과 알고리즘을 선택하는 데 도움이 된다. 기계학습 과정에서 가장 중요한 단계 데이터를 작업하는 것은 아마도 기계 학습 프로세스의 가장 간과되면서도 중요한 단계이다. 2017년에 실시된 O'Reilly 연구에 따르면 머신러닝 실무자는 80%의 시간을 데이터 작업에 할애했다. 데이터 작업의 4가지 측면 데이터 수집 - 데이터 검사 - 요약 통계 - 데이터 시각화 기계학습 애플리케이션의 데이터 작업, 이해 및 처리에대해서만 전체 클래스를 수강할 수 있다. 어떤 종류의 기계학습 프로젝트에서도 우수한 품질의 데이터는 필수적이다. 이제 데이.. 2.6 문제 정의 어떻게 머신 러닝 작업을 시작할 것인가? 아주 명확한 작업을 정의해라. 스노우콘 판매 사례에서 매출을 올릴 수 있는 방법은 구체적인 과제와는 정반대이다. 이 문제에 대한 답을 어떻게 시도할 수 있는지를 보여준다 : '1달러를 추가하면 판매가 증가하는가?' / '스노우콘에 유기농 향료를 0.5달러 추가하면 판매가 증가하는가?' 이 문제를 해결하는데 사용할 수 있는 머신러닝 과제를 식별한다. 머신러닝 작업이란? 모든 모델 훈련 알고리즘과 모델 자체는 데이터를 입력으로 사용한다. 출력은 다를 수 있으며, 해결하도록 설계된 과제에 따라 몇개의 다른 그룹으로 분류된다. 종종 머신러닝 과제를 정의하는 과정의 일환으로 모델을 교육하는데 필요한 종류의 데이터를 사용한다. 이번 수업에서 지도학습, 비지도학습의 두 보편적.. 2.5 머신 러닝의 5단계 머신 러닝 처리의 주요 단계 머신러닝 실무자는 사용되는 특정 모델 또는 교육 알고리즘에 관계없이 공통 워크플로우를 실습하여 머신러닝 작업을 수행한다. 이러한 단계는 반복적이다. 실제로 프로세스의 각 단계에서 프로세스가 어떻게 진행되는지 검토해야 한다. 예상대로 진행되지 않는다면 다시 돌아가 현재 단계 또는 이전 단계를 재수행하여 식별해야 한다. https://www.notion.so/2-5-Introduction-to-the-Five-Machine-Learning-Steps-f0a2fa28bf714754bcf3736b7c740ff7 이전 1 2 3 4 5 6 다음