Skip to content

Centauryyy25/QueryLens

Folders and files

NameName
Last commit message
Last commit date

Latest commit

Β 

History

10 Commits
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 

Repository files navigation

πŸ”Ž QueryLens : Mini Search Engine Buat News Articles

Project ini adalah sistem pencarian dokumen simpel yang dibangun pakai TF-IDF + Cosine Similarity, terus di-bungkus jadi web app dengan Streamlit.
Intinya: dari data teks mentah β†’ jadi search engine mini yang interaktif. πŸ”₯


πŸš€ Fitur Utama

  • Keyword Search β†’ Ketik query, dapet artikel paling relevan.
  • Category Filter β†’ Bisa pilih kategori berita (Business, Politics, Sport, Tech, Entertainment).
  • Highlight Result β†’ Kata kunci otomatis di-highlight.
  • Custom Top-K β†’ Atur jumlah hasil (Top-5, Top-10, dst).
  • Precision@K β†’ Metode evaluasi simpel biar lebih machine learning vibe.

πŸ› οΈ Tech Stack

  • Bahasa: Python 3.9+
  • Library:
    • scikit-learn β†’ TF-IDF + Cosine Similarity
    • pandas β†’ Data wrangling
    • NLTK β†’ Preprocessing teks
    • Streamlit β†’ Web interface (frontend + backend langsung jadi)

πŸ“‚ Struktur Project

QueryLens/
β”œβ”€β”€ Dataset/
β”‚ └── bbc_news.csv # Dataset (hasil konversi dari .txt ke .csv)
β”‚
β”œβ”€β”€ app/
β”‚ β”œβ”€β”€ app.py # Streamlit app utama
β”‚ β”œβ”€β”€ preprocessing.py # Preprocessing teks
β”‚ └── search_engine.py # Core TF-IDF + Cosine Similarity
β”‚
β”œβ”€β”€ requirements.txt # Dependency Python
└── README.md # Dokumentasi project

πŸ“Š Dataset

  • Source: BBC News Dataset (Kaggle)
  • Udah diproses jadi CSV dengan field:
    • title β†’ judul artikel (atau kalimat pertama)
    • category β†’ kategori berita
    • text β†’ isi artikel lengkap

πŸ’» Cara Jalanin Lokal

  1. Clone repo ini
    git clone https://github.com/Centauryyy25/QueryLens.git
    cd QueryLens
    

πŸ‘€ Author
===
Created by Ilham Ahsan Saputra
πŸŽ“ Informatics Student
πŸ’» Junior Network Engineer | AI & ML Enthusiast

πŸ“Œ β€œTurning raw data into meaningful insights through Machine Learning.”

About

Project ini adalah **sistem pencarian dokumen** simpel yang dibangun pakai **TF-IDF** + **Cosine Similarity**, terus di-bungkus jadi web app dengan **Streamlit**. Intinya: dari data teks mentah β†’ jadi search engine mini yang interaktif. πŸ”₯

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors