YOLO (You Only Look Once)

- 빠른 추론 속도와 상당한 정확도를 자랑하는 오브젝트 디텍션[물체 탐지] 모델

물체 탐지는 객체의 위치와 크기를 예측하는 문제와 해당 객체의 클래스를 분류하는 문제로 세분화 할 수 있다.

몇 가지를 정리하겠습니다. YOLO는 딥 러닝 알고리즘이므로 자체 설치가 필요하지 않으며 대신 알고리즘을 실행할

딥 러닝 프레임워크가 필요합니다.

YOLO를 설치하는 방법?

YOLO와 호환되는 가장 많이 사용되고 알려진 3가지 프레임워크

Darknet : YOLO 개발자가 만든 프레임워크로 yolo를 위해 특별히 제작되었습니다.
장점: 빠르고, GPU 또는 CPU와 함께 작동할 수 있습니다
. 단점: Linux os와 함께 작동합니다.

Darkflow: Tensorflow (또 다른 딥 러닝 프레임워크)에 대한 darknet의 적응입니다.
장점: 빠르고, GPU 또는 CPU와 함께 작동할 수 있으며, Linux, Windows 및 Mac과도 호환됩니다.
단점: 특히 Windows에서 설치가 매우 복잡합니다.

Opencv: 또한 opencv에는 YOLO와 함께 작동하는 딥 러닝 프레임워크가 있습니다. 최소한 opencv 3.4.2가 있는지 확인하십시오.
장점: opencv를 제외한 어떤 것도 설치할 필요 없이 작동합니다.
단점: CPU에서만 작동하므로 실시간으로 비디오를 처리하는 데 정말 빠른 속도를 얻을 수 없습니다.

Opencv에서 YOLO를 사용하는 방법

Opencv와 함께 YOLO를 사용하는 방법에 중점을 둘 것입니다. 이것은 복잡한 설치를 수행하지 않고 작동하는 알고리즘을 빠르게 얻을 수 있는 초보자에게 가장 좋은 방법입니다.

먼저 Opencv 및 numpy 라이브러리를 가져온 다음 알고리즘을 로드합니다.

클래스를 가져옵니다.

import cv2
import numpy as np

3개의 파일이 필요한 알고리즘을 실행합니다.

가중치 파일: 학습된 모델, 객체를 감지하는 알고리즘의 핵심입니다.
Cfg 파일 : 알고리즘의 모든 설정이 있는 구성 파일입니다.
파일 이름: 알고리즘이 감지할 수 있는 개체의 이름을 포함합니다.

# Load Yolo
net = cv2.dnn.readNet("yolov3.weights", "yolov3.cfg")
classes = []
with open("coco.names", "r") as f:
    classes = [line.strip() for line in f.readlines()]
layer_names = net.getLayerNames()
output_layers = [layer_names[i[0] - 1] for i in net.getUnconnectedOutLayers()]
colors = np.random.uniform(0, 255, size=(len(classes), 3))

그런 다음 객체 감지를 수행하려는 이미지를 로드하고 너비와 높이도 얻습니다.

# Loading image
img = cv2.imread("room_ser.jpg")
img = cv2.resize(img, None, fx=0.4, fy=0.4)
height, width, channels = img.shape

네트워크에서 전체 이미지를 바로 사용할 수는 없지만 먼저 Blob으로 변환하는 데 필요합니다. Blob 이미지에서 기능을 추출하고 크기를 조정하는 데 사용됩니다. YOLO는 세 가지 크기를 허용합니다.

320×320 크기가 작아서 정확도는 떨어지지만 속도는 더 좋습니다.
609×609 크기가 커서 정확도가 높고 속도가 느림
416×416 중간에 있고 둘 다 조금 얻을 수 있습니다.

여기서 Blob 이란?
Blob(Binary Large Object, 블랍)은 이미지, 사운드, 비디오와 같은 멀티미디어 데이터를 다룰 때 사용할 수 있습니다.

아래 코드 맨마지막 행 아웃 은 탐지 결과입니다. Outs는 탐지된 개체, 해당 위치 및 탐지에 대한 신뢰도에 대한 모든 정보를 포함하는 배열입니다.

# Detecting objects
blob = cv2.dnn.blobFromImage(img, 0.00392, (416, 416), (0, 0, 0), True, crop=False)
net.setInput(blob)
outs = net.forward(output_layers)

이 시점에서 감지가 완료되고 결과를 화면에 표시하기만 하면 됩니다.
그런 다음 아웃 배열을 반복하고 신뢰도를 계산하고 신뢰도 임계값을 선택합니다.

아래 코드 32행에서 임계값 신뢰도를 0.5로 설정 했습니다 . 더 크면 개체가 올바르게 감지된 것으로 간주하고 그렇지 않으면 건너뜁니다.
임계값은 0에서 1까지입니다. 1에 가까울수록 감지 정확도가 높고 0에 가까울수록 정확도는 낮지만 감지된 개체의 수도 많습니다.

# Showing informations on the screen
class_ids = []
confidences = []
boxes = []
for out in outs:
    for detection in out:
        scores = detection[5:]
        class_id = np.argmax(scores)
        confidence = scores[class_id]
        if confidence > 0.5:    # 32행은 이 라인을 의미합니다!!!!!!!!!!!!!!!!!!!!!!!!!
            # Object detected
            center_x = int(detection[0] * width)
            center_y = int(detection[1] * height)
            w = int(detection[2] * width)
            h = int(detection[3] * height)

            # Rectangle coordinates
            x = int(center_x - w / 2)
            y = int(center_y - h / 2)

            boxes.append([x, y, w, h])
            confidences.append(float(confidence))
            class_ids.append(class_id)

감지를 수행할 때 동일한 객체에 대해 더 많은 상자가 있으므로 이 "노이즈"를 제거하기 위해 다른 기능을 사용해야 합니다. 비최대 억제 라고 합니다.

indexes = cv2.dnn.NMSBoxes(boxes, confidences, 0.5, 0.4)

마지막으로 모든 정보를 추출하여 화면에 표시합니다.

Box : 감지된 물체를 둘러싸고 있는 사각형의 좌표를 포함합니다.
레이블 : 감지된 개체의 이름입니다.
Confidence : 0에서 1까지의 탐지에 대한 신뢰도입니다.

font = cv2.FONT_HERSHEY_PLAIN
for i in range(len(boxes)):
    if i in indexes:
        x, y, w, h = boxes[i]
        label = str(classes[class_ids[i]])
        color = colors[i]
        cv2.rectangle(img, (x, y), (x + w, y + h), color, 2)
        cv2.putText(img, label, (x, y + 30), font, 3, color, 3)


cv2.imshow("Image", img)
cv2.waitKey(0)
cv2.destroyAllWindows()

참고: https://pysource.com/2019/06/27/yolo-object-detection-using-opencv-with-python/

'딥러닝🤖 > YOLO, Opencv 🐢' 카테고리의 다른 글

[YOLO]#1 YOLO를 활용한 객체 탐지 (darknet install)&구글코랩 (2)	2022.11.06
무료로 Yolo , Opencv 에 대해 공부할 수 있는 사이트 (2)	2022.04.01
webcam에서 가져온 영상을 mp4로 저장하는 OpenCV Python (0)	2022.04.01
openCV를 사용한 YOLO 객체 감지 (0)	2022.04.01
darknet_YOLOv4 (0)	2022.03.23

CouchCoding

YOLO (You Only Look Once)

YOLO를 설치하는 방법?

Opencv에서 YOLO를 사용하는 방법

'딥러닝🤖 > YOLO, Opencv 🐢' 카테고리의 다른 글

티스토리툴바

YOLO (You Only Look Once)

YOLO를 설치하는 방법?

Opencv에서 YOLO를 사용하는 방법

'딥러닝🤖 > YOLO, Opencv 🐢' 카테고리의 다른 글

관련글

티스토리툴바