프로그래밍/Developer Student Clubs

ASL, Digit 데이터 수집

지누; 2020. 1. 16. 17:29

[스킵한 데이터셋]

🟤Sign Language MNIST (https://www.kaggle.com/datamunge/sign-language-mnist)

(실습기록)

링크🔗 https://github.com/alvinwan/sign-language-translator

하지만 이 데이터셋의 경우 csv 파일로 제공되어 있다.

darkflow는 jpg형식의 이미지가 필요한 걸로 알고 있어 jpg 형식으로 변환하려고 시도해봤다.

인터넷에 csv to jpg라고 검색하면 온라인 컨버터 사이트가 많이 뜨는데 용량이 커서 그런지 변환에 계속 실패했다.

따라서 csv 파일을 1000줄씩 끊어서 파일 한개당 약 3.5mb짜리로 분할 후 다시 변환해보았지만

실패했다. 😇

 

동일한 데이터셋으로 진행한 다른 프로젝트를 보니 아래와 같은 식으로 변환된 프로젝트만 존재했다.

우리팀이 원하는 자료는 이런식의 컬러 데이타였는데 어떻게 변환할지 몰라 일단 스킵하고 다른 데이터셋을 찾았다.

*참고

[darkflow png extension] https://github.com/thtrieu/darkflow/commit/80f5798d7dcce94969577b585cd26aa0f0c74602

 

[이후 찾은 데이터셋]

🟢ASL Alphabet (jpg) (https://www.kaggle.com/grassknoted/asl-alphabet#A100.jpg)

알파벳 당 3000개씩 있으며, jpg 형식이다

 

그리고 숫자 수화 데이터셋

🟢Sign-language-digit (https://github.com/ardamavi/Sign-Language-Digits-Dataset)

숫자 당 205개 내외씩 있으며, jpg 형식이다.

 

계속 찾아볼 예정