DNA-kmers_analysis

Python Jupyter-notebook to analyze k-mers in DNA reads.

Progetto

Presi in input un file FASTQ di reads di lunghezza costante, una soglia di frequenza F (tra 0 e 1) e una lunghezza k, produrre in output il report dell'uso dei k-mers per posizione nei reads in input. Un k-mer è una sottostringa di read di lunghezza k. Il report deve presentare per ciascun k-mer che ha una frequenza almeno pari a F (nel dataset di input) quante volte appare in ciascuna delle posizioni dei reads dalla prima a L - k + 1 (L: lunghezza dei reads). Selezionare il k-mer che appare più volte in una certa posizione e produrre in un file FASTA i reads che lo contengono (in quella posizione) con la loro qualità media.

Input

File FASTQ di una o più reads (SRR18961685-5000.fastq è un esempio);
F: soglia di frequenza minima;
k: lunghezza dei k-meri

Output

File FASTA contente i reads selezionati e le loro qualità medie.

Parametri

L : lunghezza dei reads (costante);
N : numero dei reads

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
K-mers_analysis.ipynb		K-mers_analysis.ipynb
README.md		README.md
SRR18961685-5000.fastq		SRR18961685-5000.fastq

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

DNA-kmers_analysis

Progetto

Input

Output

Parametri

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

DNA-kmers_analysis

Progetto

Input

Output

Parametri

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages