cnn 이미지 분류 예제

저자에 따르면, Fashion-MNIST 데이터는 필기 숫자에 몇 가지 문제가 있었기 때문에 이전 MNIST 필기 숫자 데이터에 대한 직접적인 드롭 인 대체를 위한 것입니다. 예를 들어 몇 픽셀만 보면 여러 자리를 올바르게 구분할 수 있었습니다. 선형 분류기를 사용하여도 높은 분류 정확도를 달성할 수 있었습니다. Fashion-MNIST 데이터는 기계 학습(ML) 알고리즘이 개별 클래스를 안정적으로 분리할 수 있도록 고급 기능을 학습해야 하므로 더욱 다양해질 것을 약속합니다. 안녕하세요 Srinivasan, 당신은 로컬로 모델을 훈련 한 경우 당신은 바탕 화면에서 이미지를 사용할 수 있습니다. 그러나 Google Colab에서 모델을 학습한 경우 먼저 colab에 이미지를 업로드한 다음 모델을 사용하여 예측을 수행해야 합니다. 당신이 볼 수 있듯이, 각 컨볼루션 후, 출력의 크기가 감소 (이 경우 우리는 32 * 32에서 28 * 28로 가는). 많은 레이어가있는 심층 신경망에서 출력은 이런 식으로 매우 작아지므로 잘 작동하지 않습니다. 따라서 출력이 입력 레이어와 크기가 같도록 입력 레이어의 경계에 영점을 추가하는 것이 표준 관행입니다. 따라서 이 예제에서는 입력 레이어의 양쪽에 크기 2의 패딩을 추가하면 출력 레이어의 크기는 구현 목적에서도 훌륭하게 작동하는 32*32*6이 됩니다.

당신이 크기의 입력을 가지고 있다고 가정 해 봅시다 N * N, 필터 크기는 F, 당신은 보폭으로 S를 사용하고 입력은 크기 P의 0 패드로 추가됩니다. 그런 다음 출력 크기는 다음과 같은 텐서플로우 자습서에서 텐서플로우를 사용하여 컨볼루션 신경망 기반 이미지 분류기를 구축합니다. Tensorflow를 시작하는 경우 여기에서 기본 Tensorflow 자습서를 읽는 것이 좋습니다. 그것은 당신이 다운로드 한 이미지 데이터 세트에 우리의 CNN을 맞게하는 시간이다. 그러나 그렇게하기 전에 이미지가 과도하게 맞지 않도록 미리 처리하려고합니다. 오버피팅은 한 계층에서 다른 계층으로 노드를 과도하게 장착하여 뛰어난 교육 정확도와 테스트 정확도를 얻을 때입니다. 위의 이미지를 고려 – 당신이 볼 수 있듯이, 우리는 처음 2 단계로 완료됩니다. 우리는 기능 이미지와 그것에서 하나의 픽셀을 고려했다. 이를 기존 이미지와 곱하면 제품이 다른 버퍼 피쳐 이미지에 저장됩니다. 다음으로, 우리가 먹을 때, `X`와 `O`는 높은 벡터에 몇 가지 요소가있을 것입니다. 아래 이미지를 고려, `X`에 대 한 볼 수 있듯이 높고 유사 하 게 다른 요소, `O`에 대 한 우리는 높은 다른 요소를 가지고: 패션 MNIST는 매우 잘 알려진에 대 한 드롭 인 대체, 기계 학습 안녕하세요 세계 – MNIST 데이터 집합 `숫자 식별` 연습 문제에서 확인할 수 있습니다.

이미지는 숫자 대신 티셔츠, 바지, 가방 등과 같은 의류 유형을 보여줍니다. 이 문제에 사용되는 데이터 집합은 Zalando Research에 의해 만들어졌습니다. 컨볼루션은 신호를 필터링하고 신호 등의 패턴을 찾기 위해 단일 처리에 사용되는 수학적 연산입니다. 컨볼루션 레이어에서 모든 뉴런은 입력에 컨볼루션 작업을 적용하므로 컨볼루션 뉴런이라고 합니다. 컨볼루션 뉴런에서 가장 중요한 매개 변수는 필터 크기이며 필터 크기가 5*5*3인 레이어가 있다고 가정해 보겠습니다. 또한 컨볼루션 뉴런에 공급되는 입력이 3채널이 있는 32*32 크기의 입력 이미지라고 가정합니다. 모델에서 가장 중요한 구성 요소는 컨볼루션 레이어입니다. 이 부분은 가중치의 빠른 계산을 위해 이미지 크기를 줄이고 일반화를 개선하는 것을 목표로 합니다. 이제 마찬가지로 다른 모든 피처 이미지에도 동일한 프로세스를 수행합니다.

admin