Environnement de Travail & Bio-informatique
- Système Linux : Maîtrise de la ligne de commande (Bash), gestion des fichiers de séquençage massifs et administration de base pour la recherche.
-
Gestion de paquets avec Conda & Mamba
Installation et gestion d'environnements reproductibles. Utilisation de Mamba pour l'accélération de la résolution des dépendances logicielles complexes (Bioconda).
Exploration et Analyse des Données Génomiques
- Écosystème NCBI & Système ENTREZ : Utilisation de l'outil SEARCH, gestion des Accession Numbers, RefSeq et métadonnées.
- Alignements (BLAST & MSA) : Stratégies d'alignement local et multiple (Clustal Omega, MAFFT) pour l'annotation fonctionnelle.
- Génomique Comparée : Analyse de synténie, identification d'orthologues et étude des variations génomiques.
Génomique & Assemblage Pratique
-
Pipelines d'Assemblage
Déploiement de pipelines SPAdes et Flye sous environnement Conda. Évaluation avec Quast et BUSCO.
-
Plateforme Galaxy
Création de workflows reproductibles pour les chercheurs ne pratiquant pas la ligne de commande.
Python pour la Génomique
- Automatisation & Biopython : Scripts de traitement de fichiers FASTA/SAM/VCF et analyse statistique de variants.