Table of Contents
Object Detection์ ๊ณต๋ถํ ๋ ๋ฑ์ฅํ๋ ๊ฐ๋
์ธ IoU์ NMS์ ๋ํด ์ ๋ฆฌํด๋ณด์๋ค. ๋ค๋ฅธ ๋ถ์ผ์์๋ ์ฐ์ด๋ ๊ฐ๋
์ธ์ง๋ ์์ง ๊ฒฌ๋ฌธ์ด ์ข์ ์ ๋ชจ๋ฅด๊ฒ ๋ค.
IoU(Intersection of Union)
์ค๋ช
๋!
IoU๋ ๋ ๊ฐ์ Bounding Box์์ ์ ์๋๋ ๊ฐ๋
์ผ๋ก, ์์ฃผ ๊ฐ๋จํ๋ค. ๋ ๋ฐ์ค์ ๊ต์งํฉ์ ๋ ๋ฐ์ค์ ํฉ์งํฉ์ผ๋ก ๋๋ ๊ฐ์ด๋ค. ์ฆ, ํฉ์งํฉ ๋ถ์ ๊ต์งํฉ์ด๋ค.
IoU๊ฐ 0์ด๋ผ๋ ๊ฒ์ ๊ต์งํฉ์ด ์๋ค๋ ๊ฒ์ด๊ณ , 1์ด๋ผ๋ ๊ฒ์ ๋ ๋ฐ์ค๊ฐ ์์ ํ ์ผ์นํ๋ค๋ ๊ฒ์ด๋ค. ์ฆ, ๋ ๋ฐ์ค๊ฐ ์ผ๋ง๋ ๋ง์ด ๊ฒน์น๋๊ฐ๋ฅผ 0~1 ์ฌ์ด์ ๊ฐ์ผ๋ก ๋ํ๋ธ ๊ฒ์ด๋ค.
์ด๋ฅผ ๋ชจ๋ธ ํ๊ฐ์ ์ฌ์ฉํ๋ฉด, ๋ชจ๋ธ์ด ์์ธกํ Bbox(Predicted Bbox)์, ์ฌ๋์ด ์ธก์ ํ ์ค์ธก Bbox(Ground Truth Bbox, ์ ๋ต)์ด ์ผ๋ง๋ ์ ํํ๊ฒ ๊ฒน์น๋๊ฐ๋ฅผ ๋ํ๋ด๋ ์งํ๋ก ์ฌ์ฉํ ์ ์๋ ๊ฒ์ด๋ค.
๊ทธ๋ฆฌ๊ณ , Detection Task์์ ๊ฐ๋ณ Object์ Detection ์์ธก ์ฑ๊ณต ์ฌ๋ถ๋ ๋ณดํต IoU ๊ฐ์ด ๊ฒฐ์ ํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง๋ค. ์๋ฅผ ๋ค์ด, PASCAL VOC ๊ฐ์ ๊ฒฝ์ฐ ์ด๋ฉด ์์ธก ์ฑ๊ณต์ผ๋ก ๋ณด๊ณ , COCO ๊ฐ์ ๊ฒฝ์ฐ IOU ๊ธฐ์ค์ ์ ์ ๋์ฌ๊ฐ๋ฉด์ ์งํํ๋ค.
NMS(Non-Maximum Suppression)
NMS๋ ์ผ์ข
์ ์๊ณ ๋ฆฌ์ฆ์ด๋ค. ๋ฌด์จ ์๊ณ ๋ฆฌ์ฆ์ธ์ง ์ค๋ช
ํ๊ธฐ ์ ์ ๋ชฉ์ ์ ๋จผ์ ์ค๋ช
ํ์๋ฉด, NMS๋ฅผ ์ํํ๋ ์ด์ ๋ ๋์ผํ ๋ฌผ์ฒด๋ฅผ ๊ฐ๋ฆฌํค๋ ์ฌ๋ฌ ๋ฐ์ค์ ์ค๋ณต์ ์ ๊ฑฐํ๊ธฐ ์ํจ์ด๋ค. (๋ง์ Object Detection ๊ธฐ๋ฒ๋ค์ Object๊ฐ ์์ ๋งํ ์์น์ ๋ง์ ๋ฐ์ค๋ฅผ ์น๋ ๊ฒฝํฅ์ด ๊ฐํ๋ค.) NMS๋ Detect๋ Object์ Bounding Box ์ค์ ๋น์ทํ ์์น์ ์๋ box๋ฅผ ์ ๊ฑฐํ๊ณ , ๊ฐ์ฅ ์ ํฉํ(์ ๋ค์ด๋ง๋) ๋ฐ์ค๋ฅผ ์ ํํ๋ ์๊ณ ๋ฆฌ์ฆ์ด๋ค.
NMS๋ฅผ ์ํํ๊ธฐ ์ . ํ๋์ ๋ฌผ์ฒด์ ์ฌ๋ฌ ๋ฐ์ค๊ฐ ์กด์ฌํ๋ค.
NMS๋ฅผ ์ํํ ๊ฒฐ๊ณผ. ํ๋์ ๋ฌผ์ฒด์ ์ด๋ฅผ ๊ฐ์ฅ ์ ๋ํ๋ด๋ ๋ฐ์ค๋ง ๋จ๋๋ค.
๊ณผ์ ์ ๋งค์ฐ ๊ฐ๋จํ๋ค. ํน์ ํด๋์ค๋ ํน์ ๋ฐ์ค๋ค์ ๋ํด์ ์ํํ๋ ์์
์ด ์๋๋ผ, ํ๋์ Detection ์ฅ๋ฉด์์ ๋ชจ๋ Bounding Box์ ๋ํด ์ํํ๋ ์์
์์ ์ ์ํ์.
1.
์ฐ์ , ํน์ Confidence threshold ์ดํ์ Bounding Box๋ ์ ๊ฑฐํ๋ค.
Remind: ๊ฐ Bounding Box๋ ๊ฐ๊ฐ ์ด ์ถ์ธก์ด ์ผ๋ง๋งํผ์ ํ์ ์ ๊ฐ์ง๋์ง์ ๋ํ Confidence score๋ฅผ ๊ฐ์ง๊ณ ์๋ค.
โข
๋ชจ๋ ๋ฐ์ค๋ฅผ ๋ณด๋ฉฐ, Confidence๊ฐ ์ผ์ ์์ค ์ดํ์ธ ๋ฐ์ค๋ค์ ๋ํด ์ผ์ฐจ์ ์ผ๋ก ํํฐ๋ง์ ๊ฑฐ์น๋ ๊ฒ์ด๋ค.
2.
๋จ์ Bounding Box๋ค์ Confidence score ๊ธฐ์ค ๋ชจ๋ ๋ด๋ฆผ์ฐจ์ ์ ๋ ฌํ๋ค.
3.
๋งจ ์์์๋ถํฐ ๋ฐ์ค ํ๋๋ฅผ ์ก๊ณ , ์ญ ๋ณด๋ฉด์ ์ด ๋ฐ์ค์ IoU๊ฐ ํน์ threshold ์ด์์ธ ๋ฐ์ค๋ค์ ๋ชจ๋ ์ ๊ฑฐํ๋ค.
โข
์ฝ๊ฒ ๋ ์ฌ๋ฆฌ๋ฉด ์๊ณ ๋ฆฌ์ฆ์ด๋ค. 2์ค for๋ฌธ!
โข
IoU๊ฐ ์ผ์ ์์ค ์ด์์ด๋ผ๋ฉด, ๋ ๋ฐ์ค๋ ์๋ก ๊ฐ์ ๋ฌผ์ฒด๋ฅผ ๊ฐ๋ฆฌํค๋ ๊ฒ์ด๋ผ๊ณ ํ๋จํ์ฌ ์๋์ ์ผ๋ก Confidence๊ฐ ๋ฎ์ ๋ฐ์ค๋ฅผ ์ ๊ฑฐํ๋ ๊ฒ์ด๋ค.
๊ณผ์ ์ค Confidence threshold์ IoU threshold ๋ ๊ฐ์ด ๋ฑ์ฅํ๋๋ฐ, Confidense threshold๊ฐ ๋์์๋ก, IoU threshold๊ฐ ๋ฎ์์๋ก ๋ ๋ง์ ๋ฐ์ค๊ฐ ์ ๊ฑฐ๋๋ค. ์์ธ์ง๋ ์๊ฐํด๋ณด๋ฉด ์๋ค!
๋ค๋ฅธ ์์ ๋ก ํ๋ฒ ๋ ๋ณด์. ์์ ๊ทธ๋ฆผ์์ ํ์์/๋นจ๊ฐ์ ๋ฐ์ค๋ค์ด Detect๋์๊ณ , ์ฌ๊ธฐ์ NMS๋ฅผ ์ํํ๋ค๊ณ ํด ๋ณด์.
1.
Confidence threshold ์ดํ์ธ Bbox๋ค์ ๋ชจ๋ ์ ๊ฑฐํ๋ค. ๊ฐ๋ น threshold๊ฐ 0.4๋ผ๊ณ ํ๋ฉด, Confidence๊ฐ 0.4 ์ดํ์ธ ๋ฐ์ค๋ค์ ๋ชจ๋ ์ ๊ฑฐ๋๋ค. ๊ทธ๋ฆผ์์๋ ์ ๊ฑฐ๋์๋ค๊ณ ์น์.
2.
๋ฐ์ค๋ค์ Confidence ๊ธฐ์ค ๋ด๋ฆผ์ฐจ์ ์ ๋ ฌํ๋ค. ์์๋๋ก [0.9 ๋ฐ์ค, 0.8 ๋ฐ์ค, 0.7 ๋ฐ์ค, 0.65 ๋ฐ์ค, 0.6 ๋ฐ์ค(์ผ์ชฝ), 0.6 ๋ฐ์ค(์ค๋ฅธ์ชฝ)] ์ด๋ ๊ฒ ๋ ๊ฒ์ด๋ค.
3.
์์์๋ถํฐ ์๊ณ ๋ฆฌ์ฆ์ฒ๋ผ ๋ค์ ๋ฐ์ค๋ค์ ์ญ ์ดํด๋ณด๋ฉด์, ๋ ๋ฐ์ค์ IoU๋ฅผ ๊ณ์ฐํด์ threshold ์ด์์ด๋ฉด ํด๋น ๋ฐ์ค๋ฅผ ์ ๊ฑฐํ๋ค.
โข
0.9 ๋ฐ์ค๋ฅผ ๋จผ์ ์ก๊ณ , ๋ค์ ๋ฐ์ค๋ค์ ๋ณด์.
โฆ
0.8 ๋ฐ์ค์๋ ๊ฒน์น์ง ์๋๋ค.
โฆ
๋ณด๋๊น 0.7 ๋ฐ์ค์ IoU๊ฐ threshold ์ด์์ด๋ค. ์ด ๋ฐ์ค๋ 0.9 ๋ฐ์ค์ ๊ฐ์ ๊ฒ์ ๊ฐ๋ฆฌํจ๋ค๊ณ ๊ฐ์ฃผํ๊ณ , ์ ๊ฑฐํ๋ค.
โฆ
0.65 ๋ฐ์ค, 0.6 ๋ฐ์ค(์ผ์ชฝ)๊ณผ๋ ๊ฒน์น์ง ์๋๋ค.
โฆ
0.6 ๋ฐ์ค(์ค๋ฅธ์ชฝ)์ IoU๊ฐ ๋ threshold ์ด์์ด๋ค. ๋ง์ฐฌ๊ฐ์ง๋ก ์ ๊ฑฐํ๋ค.
โข
์ด์ 0.8 ๋ฐ์ค๋ฅผ ๋ณด์.
โฆ
...
๊ฒฐ๊ณผ์ ์ผ๋ก ๊ทธ๋ฆผ์์ ํ์ ๋ฐ์ค๊ฐ NMS๋ฅผ ๋๋ฆฌ๊ณ ๋จ์ ๋ฐ์ค์ด๊ณ , ๋นจ๊ฐ ๋ฐ์ค๋ NMS ๊ณผ์ ์์ ์ ๊ฑฐ๋ ๋ฐ์ค์ด๋ค. ๋์ผํ ๋ฌผ์ฒด๋ฅผ ๊ฐ๋ฆฌํค๋ ๋ฐ์ค์ ์ค๋ณต์ ์ ๊ฑฐํ ๊ฒ์ด๋ค.