저희 프로그램은 opencv 와 dlib를 사용하여 웹캠에서 보이는 사람들의 얼굴과 입술을 인식합니다. 또한 Google Cloud Platform의 Speech to text API를 사용하여 마이크로 통해 들어오는 음성을 텍스트화하여 인식된 얼굴 옆에 말풍선을 사용해 띄워줍니다. 이 때 인식된 얼굴들 중에 누가 말했는지 알기위해 입술의 변화를 이용하여 인식하였습니다.
- 프로젝트 실행에 필요한 라이브러리를 다운받아 줍니다.
- Google Cloud Platform 에 프로젝트를 만듭니다.
- Google Cloud Platform에서 Speech To Text API와 Calendar API를 사용설정합니다.
- 비공개 키 .json 파일을 다운받고 경로를 등록해줍니다.
- Oauth 클라이언트 ID를 만들어 credentials.json를 다운받아 프로젝트 폴더 안에 넣어줍니다.
- Main.py를 실행합니다. (저희는 Pycham에서 실행하였습니다.)
본 프로젝트는 Window 환경에서 Anaconda Python을 사용하여 구현되었습니다.
- Opencv 3.4.3 이상
- imutils 0.51 버전
- dlib 19.4.0 이상
- google-cloud-speech 0.36.0 이상
- PIL 5.2.0 이상
- konlpy 0.5.1 이상
- google-api-python-client 1.7.4 이상
- oauth2client 4.1.3 이상
