온디바이스 AI 기반 실시간 상품 인식 및 음성 안내 Android 앱
|
📘 Notion Project Page 프로젝트 상세 문서 · 구현 과정 · 역할 정리 보기 |
Grabit.mp4
| 구분 | 내용 |
|---|---|
| 문제 | 매장 진열대에서 원하는 상품을 직접 찾기 어려움 |
| 해결 | 온디바이스 객체 탐지 + 손 추적 + 음성/비프음 안내 |
| 담당 | YOLOX-Nano 학습, TFLite/LiteRT 변환, Android 연동, 접근성 UX 흐름 설계 |
| 결과 | 실시간 상품 인식과 손 위치 기반 안내 기능 구현 |
GrabIT은 매장 진열대 앞에서 원하는 상품을 더 쉽게 찾을 수 있도록 돕는 Android 애플리케이션입니다.
카메라로 상품을 인식하고, 사용자의 손가락 위치를 추적하며, 음성 안내와 비프음 피드백을 통해 목표 상품의 위치를 직관적으로 안내하는 데 초점을 맞췄습니다.
상품명 음성 입력
→ 유사어 검색 / 상품군 매칭
→ 카메라 기반 실시간 상품 인식
→ 손가락 위치 추적
→ 목표 상품과 손 위치 거리 계산
→ 음성 안내 + 비프음 피드백
| 기능 | 설명 |
|---|---|
| 실시간 상품 인식 | YOLOX-Nano 모델을 TensorFlow Lite로 변환해 온디바이스 추론 수행 |
| 손 추적 | MediaPipe Hands로 손가락 끝 좌표를 추적 |
| 음성 제어 | STT / TTS 기반으로 화면을 보지 않고 앱 제어 |
| 비프음 피드백 | 목표 상품과 가까워질수록 비프음 간격을 짧게 조절 |
| 검색 기록 | Room Database 기반 최근 검색 기록 저장 |
| 유사어 검색 | E5 embedding 기반으로 구어체 표현을 정식 상품명과 매칭 |
| 상품 규격 API | 상품 크기 정보를 앱에 전달해 거리 계산 보조 |
- YOLOX-Nano 기반 상품 인식 모델 학습
- PyTorch 모델을 TensorFlow Lite / LiteRT 배포 형태로 변환
- Android 앱 내 온디바이스 추론 흐름 연결
- MediaPipe 손 추적 결과와 상품 박스 간 거리 기반 피드백 설계
- STT/TTS 기반 접근성 UX 흐름 정리
- Node.js / FastAPI 기반 유사어 검색 및 상품 규격 API 연동
| 영역 | 기술 |
|---|---|
| Android | Kotlin, Android Studio |
| Architecture | MVVM |
| On-Device AI | YOLOX-Nano, TensorFlow Lite, LiteRT |
| Vision | CameraX, MediaPipe Hands |
| Voice | SpeechRecognizer, TextToSpeech |
| Local DB | Room Database |
| Backend | Node.js, Express, FastAPI |
| NLP | intfloat/multilingual-e5-small, cosine similarity |
| Database | MongoDB |
| Network | Retrofit2, OkHttp3 |
| Infra | Docker, Docker Compose |
Android CameraX
→ YOLOX-Nano TFLite inference
→ 상품 bounding box 추출
→ MediaPipe Hands 손가락 좌표 추적
→ 목표 상품과 손 위치 거리 계산
→ TTS / Beep feedback
GrabIT은 앱 내부 모델 추론 외에도 상품명 매칭과 상품 규격 정보 제공을 위해 백엔드 API를 함께 사용합니다.
| 서버 | 역할 |
|---|---|
| Node.js API | 상품 정보, 유사어 검색 요청, 규격 정보 제공 |
| FastAPI E5 Service | 텍스트 임베딩 생성 및 유사도 계산 |
| MongoDB | 상품명, 유사어, 규격 데이터 저장 |
# Android Studio에서 프로젝트 열기
# Gradle Sync 후 실제 Android 기기에서 실행 권장docker-compose up --build -d
node seed.js
node seed-dimensions.jsapp/ Android app source
server/ Node.js API server
e5-service/ FastAPI embedding service
docker-compose.yml backend service orchestration


