Niveau 01
Les Fondamentaux du Scientifique de Données
Linux (Bases)
- Navigation dans le terminal
- Gestion des fichiers et dossiers
- Permissions et environnement
Python (Bases)
- Variables et types de données
- Boucles et conditions
- Introduction aux listes
R (Bases)
- Installation et RStudio
- Vecteurs et Dataframes
- Lecture de fichiers CSV/Excel
Niveau 02
Expertise & Fonctions Avancées
Linux Avancé
Scripts Bash automatisés, installation d'outils bioinformatiques (Conda/Docker) et gestion de serveurs distants.
Python Avancé
Manipulation de données massives avec Pandas/NumPy, programmation orientée objet et BioPython.
R Avancé
Visualisation complexe avec ggplot2, Tidyverse avancé et création de dashboards interactifs (Shiny).
Niveau 03
Intelligence Artificielle & Machine Learning
Apprentissage Supervisé & Non-Supervisé
- Régression linéaire et logistique pour la santé
- Arbres de décision et Random Forest
- Clustering (K-means) pour la segmentation de patients
- Réduction de dimensionnalité (PCA)
Implémentation avec Python
Utilisation des bibliothèques standards de l'industrie pour construire des modèles prédictifs robustes :
Scikit-Learn
Matplotlib/Seaborn
Imbalanced-learn
Projet pratique : Création d'un modèle de prédiction du risque de paludisme grave.