SEAbird

Dataset creation and validation pipeline for Southeast Asian bird audio classification.

Dataset: The SEAbird dataset (6000 annotated 3-second segments, 10 species) is available on Zenodo:

Overview

End-to-end pipeline from Xeno-Canto downloads to optimized train/val/test splits:

Download recordings from Xeno-Canto (FLAC format)
Annotate bird vocalizations with interactive GUI
Extract 3-second segments
Quality control and filtering
Split with MIP optimization (prevents data leakage)

Pipeline Stages

Stage	Script	Description
1	`Stage1_xc_fetch_metadata.py`	Fetch recording metadata
2	`Stage2_xc_dload_all_from_species_list.py`	Download recordings
3	`Stage3_xc_dload_delta_by_id.py`	Download specific IDs
4	`Stage4_eda_downloads.py`	Exploratory data analysis
5	`Stage5_find_segments_interactive.py`	Interactive annotation GUI
6	`Stage6_extract_annotated_segments.py`	Extract WAV segments
7	`Stage7_quality_control_selection.py`	Quality control
8a	`Stage8a_splitter_mip.py`	MIP-based splitting (recommended)
8b	`Stage8b_splitter_genetic_algorithm.py`	GA-based splitting
8c	`Stage8c_splitter_simulated_annealing.py`	SA-based splitting
9	`Stage9_train_seabird_multifeature.py`	Train 4 CNN models

MIP Splitter (Stage 8a)

Generates CSV-based splits with configurable ratios:

python Stage8a_splitter_mip.py /path/to/dataset \
    --train_ratio 0.80 --val_ratio 0.10 --test_ratio 0.10 \
    --output /path/to/splits.csv

Output format:

# split_ratio=80:10:10 seed=42 objective=0 solver=mip_cbc
filename,split
xc1002657_2860.wav,test
xc1003831_2642.wav,train
...

Key features:

Source-based separation (same recording never in multiple splits)
Perfect class balance (objective=0 means exact ratios achieved)
Reproducible via seed parameter
CSV output for use with any training framework

Pre-generated Splits

Ready-to-use splits for 6000-sample dataset (seed=42, all objective=0):

splits_csv/
  seabird_splits_70_15_15_seed42.csv
  seabird_splits_75_10_15_seed42.csv
  seabird_splits_80_10_10_seed42.csv

Training

For audio-focused CNN training, see mun3im/mynanet.

Installation

pip install numpy scipy librosa soundfile requests tqdm matplotlib sounddevice pulp

License

MIT

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

SEAbird

Overview

Pipeline Stages

MIP Splitter (Stage 8a)

Pre-generated Splits

Training

Installation

License

About

Uh oh!

Releases

Packages

Contributors 2

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 27 Commits
splits_csv		splits_csv
DATA_DICTIONARY.md		DATA_DICTIONARY.md
DETAILS.md		DETAILS.md
HOWTO_CREATE_ANNOTATIONS.md		HOWTO_CREATE_ANNOTATIONS.md
LICENSE		LICENSE
README.md		README.md
Stage1_xc_fetch_metadata.py		Stage1_xc_fetch_metadata.py
Stage2_xc_dload_all_from_species_list.py		Stage2_xc_dload_all_from_species_list.py
Stage3_xc_dload_delta_by_id.py		Stage3_xc_dload_delta_by_id.py
Stage4_eda_downloads.py		Stage4_eda_downloads.py
Stage5_find_segments_interactive.py		Stage5_find_segments_interactive.py
Stage6_extract_annotated_segments.py		Stage6_extract_annotated_segments.py
Stage7_quality_control_selection.py		Stage7_quality_control_selection.py
Stage8a_splitter_mip.py		Stage8a_splitter_mip.py
Stage8b_splitter_genetic_algorithm.py		Stage8b_splitter_genetic_algorithm.py
Stage8c_splitter_simulated_annealing.py		Stage8c_splitter_simulated_annealing.py
Stage9_train_seabird_multifeature.py		Stage9_train_seabird_multifeature.py
species.py		species.py

License

mun3im/seabird

Folders and files

Latest commit

History

Repository files navigation

SEAbird

Overview

Pipeline Stages

MIP Splitter (Stage 8a)

Pre-generated Splits

Training

Installation

License

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

Packages