목록Artificial Intelligence/Computer Vision (3)
Gaegul's devlog
Optical Flow (광학흐름) 이란? 영상 내 물체의 움직임 패턴을 의미하며, 이전 프레임 t 와 다음 프레임 t +1 (t') 간 픽셀이 이동한 방향과 거리이다. 아래의 그림같이 두 연속적인 이미지(프레임)에서의 모션을 추정하는 것이다. Optical Flow는 비디오에서 주로 쓰이며, 물체의 움직임을 탐지하는 것과 관련된 motion segmentation 까지 많은 분야 까지 폭넓게 적용될 수 있다. 가장 대표적인 알고리즘 2가지 1. Lucas-Kanade Lucas-Kanade 알고리즘은 영상 내 이미지 사이의 시간적, 공간적 연속성과 이웃한 픽셀들의 움직임은 함께 간다는 것을 가정하고 만들어졌다. 연속된 이미지에서 우리가 관측하고 있는 포인트 p의 변위를 알고 싶다. 이 때, 연속성을 이..
Case 1. pretrained CNN model layer 직접 수정 pretrained CNN model layer 직접 수정하여 input channel을 변경해 보도록 하겠습니다. Problem 일반적인 classification task를 위한 cnn 기반 모델의 인풋은 3 channel (RGB)로 들어가게 됩니다. 하지만 데이터를 가공시키고 원하는 input channel 이 3채널이 아닐때(4채널 or 그 이상 채널이 들어가야 할 때) pretrained cnn 모델을 가져와서 사용하고 싶을때 본 방법은 유용합니다. 저는 se_resnext101 네트워크에 ImageNet dataset이 pretrained 모델을 가져와서 사용하였습니다. 그리고 제가 가공한 이미지 데이터는 9*256*2..
논문을 읽기 앞서 CT image의 Dicom 파일과 뇌출혈 subtype에 관해 알아보겠습니다. 1. Dicom 파일이란? DICOM은 의학 분야의 Digital Imaging and Communications의 약자입니다. 초음파 및 MRI 이미지와 같은 의료 정보를 환자의 정보와 함께 하나의 Dicom 파일에 저장할 수 있습니다. dicom 파일 여는 법 pydicom libraray를 설치 후에 사용 할 수 있습니다. 데이터 안에는 다음과 같은 meta 정보가 포함되어 있습니다. meta 정보에는 이미지 사이즈, Window 사이즈, 환자 정보, Study Instance UID, Series Instance UID등이 포함되어 있습니다. data = pydicom.read_file('/conte..