Este projeto é um chatbot de transcrição de áudio que usa Whisper para transcrição e integra com um modelo de linguagem (LLM) para ajudar os usuários com as transcrições de áudio. O chatbot pode processar comandos via hotkeys do teclado.
Python 3.6+pynputpara interação com o tecladowhisper_livepara transcrição de áudio. Para mais instruções sobre como rodar o servidor de transcrição, clique aqui.langchain,langchain_groq,langchain_ollamapara interação com o modelo de linguagempython-dotenvpara gerenciamento de variáveis de ambienteOllamainstalado no seu computador (caso queira rodar modelos locais).
- Clone o repositório e navegue até o diretório do projeto.
- Instale os pacotes Python necessários:
pip install -r requirements.txt
- Certifique-se de ter o Ollama ou Groq rodando na sua máquina.
- Crie um arquivo .env no diretório raiz do projeto com as variáveis de ambiente necessárias.
Executando o Projeto
- Atualize o script com o endereço IP e a porta corretos para o TranscriptionClient.
- Inicie o script:
python seu_script.py