UEs du parcours B3S (Biostatistique, Biomathématique, BioInformatique et Santé)

Responsables : Pr Pascal Roy (pascal.roy@chu-lyon.fr) et Dr Delphine Maucort-Boulch (delphine.maucort-boulch@chu-lyon.fr)

 
FICHE DE CHOIX D'UEs : FICHE DE CHOIX D'UEs PARCOURS B3S MSP.pdf
SEMESTRE 3 : 30 ECTS

Unités d'enseignement OBLIGATOIRES 18 ECTS (Tronc Commun) - 3 ECTS par UE 

1- Anglais pour la communication professionnelle Niveau 2 (V James) (3 ECTS)
2- Modèle Linéaire et Modèle Linéaire Généralisé (P Roy, V Viallon) (3 ECTS) 
4- Du Modèle Biologique au Modèle Statistique (F Gueyffier, R Ecochard) (3 ECTS)
5- Modèles linéaires généralisés et modèles de survie (D Maucort Boulch) (3 ECTS)
6- Modèles linéaires et non linéaires à effets mixtes (R Ecochard) (3 ECTS)
Mémoire bibliographique en contrôle continu avec présence obligatoire à 2 séminaires de Biostatistique (3 ECTS)
 
 Orientation Biostatistique-Biomathématique : 12 ECTS dont une UE OBLIGATOIRE de 3 ECTS

OBLIGATOIRE :  3- Inférence Fréquentiste et Bayésienne, Paramétrique et non Paramétrique (M Rabilloud, R Ecochard) (3 ECTS)

3 UEs OPTIONNELLES au choix parmi 

7- Modélisation diagnostique et pronostique. Qualité prédictive (M Rabilloud, D Maucort-Boulch) (3 ECTS)
8- Méthodologie statistique des essais cliniques (D Maucort-Boulch, F Subtil) (3 ECTS)

9- Statistique bayésienne et applications (ML Delignette, F Subtil) (3 ECTS) (UE de la filière BIM de l’INSA de Lyon)

10- Analyse de données génétiques et génomiques en Santé (P Roy, C Bardel) (3 ECTS)
11- Modélisation des systèmes complexes (N Kabachi) (3 ECTS)
UE libre provenant d'autres parcours de M2
 
 Orientation Bioinformatique : 12 ECTS dont une UE OBLIGATOIRE de 3 ECTS
OBLIGATOIRE : Analyse de données génétiques et génomiques en Santé (P Roy, C Bardel) (3 ECTS)
Une UE OPTIONNELLE de l'orientation Biostatistique-Biomathématique (3 ECTS) 

Et une UE OPTIONNELLE du Master Bioinfo  : Génétique et Génomique évolutive (C Vieira) 6 ECTS OU Méthodes pour l'analyse de données génomiques (M Bailly-Béchet) (6 ECTS)

 

SEMESTRE 4 : 30 ECTS DONT STAGE OBLIGATOIRE

Orientation Bostatistique-Biomathématique : STAGE 30 ECTS en Laboratoire ou dans l'industrie - Mémoire technique ou article scientifique avec soutenance orale

Orientation Bioinformatique : Une UE commune ECL-UCBL1 de 3 ECTs et le stage de 27 ECTS

       12- OBLIGATOIRE : UE Data mining et Big Date (C Helbert ECL, D Maucort-Boulch) 3 ECTS

       STAGE 27 ECTS en Laboratoire ou dans l'industrie - Mémoire technique ou article scientifique avec soutenance orale

PROGRAMME détaillé des UEs 

TRONC COMMUN : UEs OBLIGATOIRES  (18 ECTS)

1- Anglais pour la communication professionnelle Niveau 2 (V James) (3 ECTS) OBLIGATOIRE

Descriptif du cours : Atteindre au minimum le niveau B2 dans le Cadre Européen Commun de Référence.

Ecrit : Rédaction de correspondance professionnelle formelle et informelle, de rapports, de propositions professionnelles (profil de poste, lettre de recommandation etc.). Compréhension un article scientifique et être capable d’en rédiger un (la rédaction sera basée sur les travaux effectués en laboratoire et/ou en entreprise pour les alternants, si possible).

Oral : Préparation et participation active à une réunion professionnelle, pouvoir s'exprimer avec spontanéité. Préparation à un entretien de recrutement (en tant que recruteur et/ou candidat) pouvoir s'exprimer avec spontanéité dans une situation de travail (laboratoire, congrès…), maîtrise de la communication formelle et informelle dans la spécialité. Travail continu sur la compréhension orale. Etre capable de comprendre des discours assez longs et suivre une argumentation (conférences, débats…).

Communication : Pouvoir participer à un entretien de nature professionnelle, maîtrise de la communication formelle et informelle, pouvoir négocier, convaincre, expliquer, résumer. Etre capable de présenter (poster et/ou diaporama) ses travaux de recherche dans une situation similaire à une conférence scientifique.

30 H de TD - Modalités d'évaluation : 100 % Contrôle continu (PAS DE RATTRAPAGE)
 
2- Modèle linéaire et Modèle linéaire généralisé (P Roy et V Viallon) (3 ECTS)

Programme : L'objectif de cet enseignement est de familiariser les étudiants avec le concept de modélisation, régression, et d'estimation des paramètres de régression.

1. Modèle linéaire : Rappels sur le test de Student de comparaison de deux espérances / Analyse de variance à 1 facteur pour la comparaison de plusieurs espérances et l'étude de l'association entre une variable quantitative et une variable qualitative / Association entre deux variables quantitatives : régression linéaire simple / Estimation par la méthode des moindres carrés ordinaires / Corrélation / Test de la pente / Ecriture matricielle / Régression linéaire multiple et notion d’ajustement / Notion d’interaction / Notion de sélection de modèle / Validation du modèle par analyse des résidus.

2. Modèle linéaire généralisé : Notions de taux (incidence, mortalité), de risque et d’odds. Analyse de tableaux de contingence. Tests d’hypothèses, estimations. Régressions logistiques et de poisson. Algorithmes de maximisation de la vraisemblance. Contrastes, fonctions de lissage (modèles additifs généralisés). Modélisation des effets combinés, analyse des interactions. Application en épidémiologie descriptive (modélisation de l’incidence) et analytique (analyse des études cas-témoins).

20 H CM - 10 H de TP (Les étudiants mettront en pratique les notions abordées en cours à l’aide du logiciel R) - Modalités d'évaluation : Examen écrit

Compétences acquises : A partir de l’identification de la question de l’étude, les étudiants sauront proposer des  plans d’analyse adaptés.

 
4- Du Modèle Biologique au Modèle Statistique (R Ecochard, F Gueyffier) (3 ECTS

Programme : Cette U.E. prépare les étudiants aux métiers de la Recherche Fondamentale et Appliquée en Biologie dans lesquels la maîtrise de la biologie et des méthodes d’analyse sont un outil indispensable. Son objectif est de leur montrer comment, partant du modèle biologique, on recueille les données, ou au besoin on les simule, on choisit le modèle statistique et on analyse les résultats.

1. Eléments de Biologie : Les différentes sources de variabilité : génétique, phénotypique, biologique, erreur de mesure / De l’expression du gène à celle des protéines et autres composants biologiques / Exemples d’application : Introduction à l’utilisation de marqueurs moléculaire, détermination de Quantitative Trait Loci, etc.

2. Eléments d’analyse : Identification des distributions / Seuils de détection et phénomènes de saturation des mesures / Méthodes d’explorations des données : méthodes vectorielles, méthodes de classification, méthodes graphiques / Méthodes d’inférence : introduction aux spécificités des mesures biologiques

14 H de CM - 14 H de TD (Les TD seront consacrés à l’obtention de données et à leur analyse par les méthodes introduites lors des cours / Exercices illustratifs « Modélisation de systèmes complexes : analyse de cas publiés » - Modalités d'évaluation : Examen écrit

Compétences acquises : Les étudiants seront capables, face à un problème de biologie concret, de comprendre l’obtention de données, les difficultés propres aux données, et de proposer des méthodes d’analyse.

 
5- Modèles linéaires généralisés et Modèle de survie (D Maucort-Boulch, P Roy) (3 ECTS) 

1. Rappels sur le modèle linéaire. Modèle linéaire généralisé. Application à l’analyse des études cas-témoins. Les spécificités du modèle logistique sont soulignées lors de la prise en compte de variables explicatives catégorielles et continues, en mettant l’accent sur l’estimation de la relation entre le niveau d’exposition et le risque, et sur l’estimation de l’effet conjoint de plusieurs facteurs (analyse de l’interaction). Les propriétés des modèles permettant de décrire précisément la relation niveau d’exposition et risque (modèles additifs généralisés) sont présentées.

2. Notions de taux et de risque. Modèles de survie non paramétriques et paramétriques. Comparaison de distributions de survie. Propriétés des tests effectués sur les paramètres et les modèles. Modèles à taux proportionnels : modèle semi-paramétrique de Cox, modèle de survie relative d’Estève. Analyse de l’hypothèse des taux proportionnels. Analyse de la relation entre le niveau d’exposition et le risque, estimation de l’effet conjoint de plusieurs facteurs (étude de l’interaction).

 Application : Les étudiants proposeront un plan d’analyse et interpréteront les résultats de l’analyse d’une étude cas-témoins et/ou d’une analyse de la survie
18 H de CM - 12 H de TD - Modalités d'évaluation : Examen écrit, Rapport sur Modèle de survie

Compétences acquises : A l’issue du module, l’étudiant devra : Connaître les concepts d’incidence (taux) et de risque - Identifier les plans expérimentaux nécessitant ce type d’analyse - Savoir programmer l’analyse d’une étude cas-témoins - Savoir interpréter les résultats d’une étude pronostique - Pouvoir programmer les plans d’analyse correspondants.

 
6- Modèle linéaires et non linéaire à effets mixtes (R Ecochard) (3 ECTS)
1. Modélisation à effets mixtes. Aspects généraux (12h) : Exemples d'application des modèles à effets mixte / Plans expérimentaux bénéficiant de la modélisation à effets mixtes / Notions de modèles hiérarchiques et représentation par graphe orienté / ANOVA à effet aléatoire et à effet fixe  /Régression à ordonnée à l'origine aléatoire et pentes parallèles / Régression à ordonnée à l'origine et pente aléatoires  / Modélisation de la variance des effets aléatoires / Modélisation de la variance de l'écart entre les valeurs prédites et les valeurs observées / Modèle conditionnel et estimateurs du maximum de vraisemblance : Vraisemblance approximée- Vraisemblance exacte / Auto corrélation temporelle et spatiale / Démarche de construction, validation puis interprétation des modèles à effets mixtes.

Les TD consisteront en des séances d’exercices sur les modèles des applications en Sciences de la Vie et de la Santé : Exemples d’application des modèles linéaires mixtes (5 h)  / Exemples d’application des modèles linéaires généralisés mixtes (5 h) (Régression logistique-Modèles de survie (modèles de fragilité)-Modèles de Poisson) / Exemples d’application des modèles non-linéaires mixtes (8 h) (En pharmacologie : modèle PK-PD-Dans d’autres domaines)

12 H de CM - 18 H de TD - Modalités d'évaluation : Examen écrit
 

Mémoire BIBLIOGRAPHIQUE OBLIGATOIRE sous forme de rapport (3 ECTS) en contrôle continu avec présence obligatoire à 2 séminaires de Biostatistique

 

ORIENTATION BIOSTATISTIQUE-BIOMATHEMATIQUE (12 ECTS dont UNE UE OBLIGATOIRE)
3-  UE OBLIGATOIRE : Inférence fréquentiste et bayésienne, paramétrique et non paramétrique (M Rabilloud, R Ecochard) (3 ECTS)
Programme : Présentation des principes de l'inférence pour estimer et tester une hypothèse
1. Les différentes méthodes d'estimation : ·La méthode des moments ·La méthode du maximum de vraisemblance ·L'approche bayésienne combinant la distribution a priori du paramètre à estimer et les données observées pour converger vers la distribution a posteriori du paramètre

2. Les propriétés des estimateurs et les méthodes d'évaluation des estimateurs

3. Présentation des principaux algorithmes permettant d'obtenir des estimations du maximum de vraisemblance (Newton Raphson, algorithme EM) et des méthodes MCMC pour l'approche bayésienne.
4. Présentation des méthodes de construction d'intervalles de confiance pour l'approche fréquentiste et d'intervalle de crédibilité pour l'approche bayésienne.
5. Les principales méthodes pour tester une hypothèse en approche fréquentiste et bayésienne
11 H de CM - 13 H de TD (Les TD consisteront en des séances d'exercices visant à appliquer les méthodes présentées sur des exemples dans le domaine de la biologie et de la médecine) - 6 H de TP (Les TP consisteront en des séances d’exercices sur ordinateur visant à appliquer les méthodes présentées sur des exemples dans le domaine de la biologie et de la médecine) - Modalités d'évaluation : Examen écrit
 

3 UEs OPTIONNELLES (9 ECTS) au choix parmi les UEs ci-dessous à 3 ECTS et/ou 1 UE libre provenant d'autres parcours de M2

7- Modélisation diagnostique et pronostique. Qualité prédictive (M Rabilloud, D Maucort-Boulch) (3 ECTS)

Mesure des performances d’un test diagnostique ou pronostique : Savoir estimer et interpréter la sensibilité et la spécificité d’un test, la courbe ROC, les ratios de vraisemblances, les valeurs prédictives, l’aire sous la courbe ROC / Savoir comparer les performances de 2 tests sur données indépendantes et données corrélées / Savoir passer de la probabilité pré-test à la probabilité post-test de la maladie.

Evaluation des performances d’un test et biais potentiels : Comprendre et savoir quantifier l’influence des caractéristiques des malades sur les performances d’un test (spectrum bias), les conséquences de l’utilisation d’un gold standard imparfait, un biais de vérification / Comprendre les méthodes permettant d’estimer les performances d’un test en situation de gold standard imparfait / Savoir corriger un biais de vérification lorsque la probabilité de vérification ne dépend que du résultat du test.

Etudes d’évaluation d’un test diagnostique : Connaître les différentes phases d’évaluation et les différents schémas d’étude / Savoir choisir un schéma d’étude adapté au contexte /Savoir interpréter les résultats d’une méta-analyse.

Le test diagnostique outil  pour la décision médicale : Comprendre le concept d’utilité / Savoir déterminer les utilités attendues en cas de décision de traiter, de ne pas traiter ou de traiter selon le résultat du test / Comprendre et savoir calculer la probabilité seuil de traitement pour une maladie donnée, les probabilités seuil de la maladie délimitant la zone d’intérêt du test / Connaître les principes de l’estimation de la valeur seuil d’un test diagnostique / Savoir quantifier l’apport d’un test dans une démarche diagnostique.

Mesure de la qualité prédictive des modèles diagnostiques ou pronostiques combinant l’information apportée par plusieurs tests ou biomarqueurs / Notion d’information, de variance expliquée / Optimisme des modèles et méthodes de correction de l’optimisme / Régressions pénalisées.
22 H de CM - 2 H de TD - Modalités d'évaluation : Examen écrit
 
8- Méthodologie statistique des essais cliniques (D Maucort-Boulch, F Subtil) (3 ECTS)

Objectif : Cet enseignement vise à traiter les aspects statistiques de construction et d’analyse des essais thérapeutiques

Programme : Nombre de sujets nécessaires : théorie générale, méthodes pour les cas classiques, méthodes par simulation / Méthodes pour les comparaisons multiples (Bonferroni, Sidak, Simes, Holm, Hommel, Hochberg, FDR) / Méthodes d’analyse pour les designs d’essai particuliers : essai en plan croisé, essai en plan factoriel / Méthodes d’estimation de la dose optimale : méthodes classique et CRM / Designs séquentiels pour les essais de phase II : Fleming en 2 étapes, Simon, Bryant and Day / Designs séquentiels pour les essais de phase III : méthodes en groupes séquentiels, méthodes de dépense du risque, calculs de puissance conditionnelle / Designs adaptatifs / Essais et médecine personnalisée / Données manquantes / Plan d’analyse statistique détaillé et aspects réglementaires

20 H de CM - 8 H de TD - Modalités d'évaluation : Examen écrit
Compétences acquises : A l’issue de cette UE, les étudiants seront capables de construire un plan expérimental séquentiel et/ou adaptatif. Ils comprendront comment intégrer la biologie moderne dans des essais pour une médecine personnalisée. Ils sauront calcul un nombre de sujets nécessaires. Ils sauront écrire un plan d’analyse statistique détaillé et prévoir une méthode pertinente pour prendre en compte les données manquantes.
 
9- Statistique bayésienne et applications (ML Delignette, F Subtil) (3 ECTS) (UE de la filière BIM de l'INSA de Lyon)

Objectifs : L'objectif de ce cours est d'initier les étudiants à l'inférence bayésienne, ainsi qu'aux outils techniques nécessaires à son implémentation. A l'issue de ce module, l'étudiant sera capable de comprendre et d'expliciter les différences entre l'inférence bayésienne et l'inférence fréquentiste, ainsi que les forces et limites de chacune. Il devra également savoir implémenter et interpréter l’estimation des paramètres d’un modèle dans un cadre bayésien ainsi que valider ce modèle.

1/Théorie de l'inférence bayésienne : Principe de l’inférence bayésienne / Méthodes de l'inférence bayésienne : solutions explicites, algorithmes MCMC / Choix des lois a priori / Estimation des paramètres d’un modèle / Validation et comparaison de modèles. Chacune des parties sera illustrée par des études de cas.

2/ Mise en œuvre avec les outils de type « BUGS » : Formalisation d’un modèle sous la forme d’un graphe acyclique dirigé / Introduction aux outils de type « BUGS » : codage d'un modèle à partir du graphe acyclique dirigé, estimation de la loi a posteriori jointe des paramètres par MCMC, vérification de la convergence de l'algorithme, caractérisation des lois a posteriori, vérification de la valeur prédictive d’un modèle / Prise en main du logiciel JAGS à partir d'exemples simples

3/ Quelques applications réelles : Statistique bayésienne pour la méta-analyse de l’étude du lien entre concentration en anticorps et risque de grippe / Statistique bayésienne en criminalistique

20 H de CM - 8 H de TD - Modalités d'évaluation : Examen écrit
 
10- Analyse de données génétiques et génomiques en Santé (P Roy, C Bardel) (3 ECTS)
Programme : L’objectif de cette UE est de former les étudiants à l’analyse de données de grandes dimensions issues de la génétique, de la génomique et de la post-génomique (transcriptome, protéome)
Cours théoriquesTechnologie à haut débit, « omique ». Prétraitement des données. Analyse de variables multiples. Méthodes exploratoires : classification non supervisée, projection sur sous-espaces (ACP). Analyse univariée en situation d’hypothèses multiples. Correction selon Bonferroni, Sidak, FDR, FWER. Impact de la grande dimension sur la puissance. Notion de sélection de variable. Notion de biais. Extraction des variables (régression Partial Least Square). Sélection de variables (pénalisation de type L1, L2, sparse PLS). Intégration de variables clinico-biologiques classiques et de variables de type « omique » / Génétique. Génétique des populations. Equilibre d’Hardy Weinberg dans le cas de la transmission biallèlique et multiallélique. Notion de gène candidat. Études d’association génétique (études cas-témoins, méthode TDT).
TP : A partir de jeux de données publiques et de jeux de données dédiés à l’illustration, les différentes étapes de l’analyse de données de grandes dimensions seront réalisées par les étudiants (protéomique, transcriptomique) / Des illustrations d’étude d’association seront proposées.
20 H de CM - 10 H de TD - Modalités d'évaluation: Examen écrit
Compétences acquises : A l’issue du module, les étudiants connaîtront les particularités des données de grande dimension et sauront utiliser les méthodes utiles pour ce type de données. Ils sauront programmer l’analyse d’étude d’association en génétique, d’étude dans l’un ou l’autre des domaines de la « omique ».
 
11- Modélisation et simulation des systèmes complexes (N Kabachi) (3 ECTS)

Prérequis : Notions de base de probabilités (lois de probabilités), de statistiques, d’algèbre linéaire et de bases des données

Programme : Méthodes et outils de simulation : Introduction à la modélisation d’une simulation - Méthodologie de la simulation à évènements discrets et de la simulation continue - Les techniques de la modélisation d’une simulation / Les systèmes d’information médico-économique : Introduction - Les grandes bases existantes (PMSI, SNIIRAM…) / Extraction et représentation des connaissances : Introduction - Les réseaux de neurones - Les réseaux bayésiens – Les arbres de décision – Les règles d’association / Les systèmes multi-agents (SMA) : Notions d’Agent (perçoit, raisonne, communique et agit) et  de Société d’agents  (Communique, s’organise, coopère, négocie, …) - Ingénierie des SMA et plateformes de simulation (Jade, MadKit, Zeus, Manta, OpenStarlogo, Netlogo,…) - Modélisation et Simulation Multi-agents - Info BioInspirée : modélisation de comportements des Rats

15 H de CM - 10 H de TD -  5 H de TP - Modalités d'évaluation : Examen écrit

Compétences acquises : L’enseignement dispensé dans cette UE a pour objectif de sensibiliser des non spécialistes aux problèmes de la Modélisation des systèmes complexes dans le cadre de la santé. Ils devront acquérir une compétence leur permettant de traduire un problème posé en termes de modèle, connaître les étapes essentielles pour réaliser une simulation, savoir les erreurs à ne pas commettre et les pièges à éviter. Ils devront être capables de piloter un projet de mise en place d’un outil de simulation dans leur propre domaine d’activité. Par ailleurs, ils connaitront les contraintes méthodologiques et techniques pour mettre en place un SI médico-économique et auront acquis la maîtrise de différentes techniques d’extraction et de représentation des connaissances. Ils seront donc capables de mettre en œuvre ces techniques dans le cadre d'une étude d'évaluation et sauront également en interpréter les résultats.

 

OBLIGATOIRE SEMESTRE 4 ORIENTATION BIOSTATISTIQUE-BIOMATHEMATIQUE : STAGE (30 ECTS) en laboratoire ou dans l'industrie - Mémoire technique ou article scientifique avec soutenance orale

*.*.*.*.*.*.*.*.*.*.*.*.*.*.*

ORIENTATION BIOINFORMATIQUE (12 ECTS dont UNE UE OBLIGATOIRE)

10- UE OBLIGATOIRE : Analyse de données génétiques et génomiques en Santé (P Roy, C Bardel) (3 ECTS)

Programme : L’objectif de cette UE est de former les étudiants à l’analyse de données de grandes dimensions issues de la génétique, de la génomique et de la post-génomique (transcriptome, protéome)
Cours théoriquesTechnologie à haut débit, « omique ». Prétraitement des données. Analyse de variables multiples. Méthodes exploratoires : classification non supervisée, projection sur sous-espaces (ACP). Analyse univariée en situation d’hypothèses multiples. Correction selon Bonferroni, Sidak, FDR, FWER. Impact de la grande dimension sur la puissance. Notion de sélection de variable. Notion de biais. Extraction des variables (régression Partial Least Square). Sélection de variables (pénalisation de type L1, L2, sparse PLS). Intégration de variables clinico-biologiques classiques et de variables de type « omique » / Génétique. Génétique des populations. Equilibre d’Hardy Weinberg dans le cas de la transmission biallèlique et multiallélique. Notion de gène candidat. Études d’association génétique (études cas-témoins, méthode TDT).

TP : A partir de jeux de données publiques et de jeux de données dédiés à l’illustration, les différentes étapes de l’analyse de données de grandes dimensions seront réalisées par les étudiants (protéomique, transcriptomique) / Des illustrations d’étude d’association seront proposées.

20 H de CM - 10 H de TD - Modalités d'évaluation: Examen écrit
Compétences acquises : A l’issue du module, les étudiants connaîtront les particularités des données de grande dimension et sauront utiliser les méthodes utiles pour ce type de données. Ils sauront programmer l’analyse d’étude d’association en génétique, d’étude dans l’un ou l’autre des domaines de la « omique ».
 
1 UE OPTIONNELLE de l'orientation Biostatistique-Biomathématique (3 ECTS)
1 UE OPTIONNELLE de 6 ECTS au choix parmi les deux UEs proposées ci-dessous du Master BIOINFO (http://www.bee-lyon-univ.fr/master-1/)
Génétique et génomique évolutive (C Vieira) (6 ECTS)

Cette UE traite l’évolution des génomes en relation avec les traits d’histoire de vie. Elle vise à présenter les mécanismes moléculaires et populationnels associés à la dynamique des génomes et impliqués dans les processus d’adaptation. L’UE est ainsi structurée en deux grandes parties: la génomique évolutive (illustration des mécanismes évolutifs) et la génétique des populations (concepts et méthodes). Le cours est couplé à des TD et TP abordant les aspects pratiques de la génomique évolutive et de la génétique des populations. Des TD seront dédiés à des analyses d’articles scientifiques par les étudiants.

Génomique évolutive : Les mécanismes évolutifs responsables de la dynamique des génomes sont traités au travers d’exemples pertinents. Inversement, nous montrons que certains traits moléculaires sont des indicateurs puissants des processus évolutifs : Évolution composition en bases en relation avec les traits d’histoire de vie : biais mutationnel, pression de sélection et environnement, réarrangements chromosomiques. Évolution génomes symbiotes / Évolution par transposition / Sexe et recombinaison, évolution des chromosomes sexuels / Transition du génotype au phénotype

Génétique des populations : Le cours de génétique des populations est divisé en trois parties complémentaires auxquelles sont associés trois TP : Mesure de la diversité et de la structuration / Reconstruction de l’histoire évolutive des populations : théorie de la coalescence et méthodes ABC / Détection de sélection dans les populations : tests de neutralité, sélection sur l'ADN non codant / Analyse de la variabilité des traits quantitatifs en populations naturelles

33 H de CM - 3 H de TD - 18 H de TP - Modalités d'évaluation : Examen écrit

 

Méthodes pour l'analyse de données génomiques (M Bailly-Béchet) (6 ECTS)

Cette UE a pour objectif de permettre aux étudiants d'acquérir les connaissances théoriques et pratiques pour le traitement de données génomiques, et ce pour toutes les étapes allant de l'obtention des séquences brutes à leur analyse à l'échelle du génome.

Le cours se divise en trois volets :  1-Les différentes technologies d'acquisition de données génomiques et transcriptomiques, ainsi que leurs biais, seront présentés en lien avec des problématiques variées. L'accent sera mis sur les nouvelles technologies de séquençage et les plate-formes associées (e.g. Illumina, Roche, 454), mais aussi des technologies très récentes (e.g. Pacbio). Ces aspects technologiques seront mis en lien avec les spécificités biologiques dépendant de la nature des organismes (procaryotes ou eucaryotes) étudiés / 2- Les principaux algorithmes d'assemblage de reads ainsi que les statistiques associées aux test multiples seront présentés. / 3- Les méthodes d'annotation structurale (e.g. détection de gènes, d'éléments régulateurs) et fonctionnelle des génomes seront présentées

L'UE comporte deux TP long qui permettront aux étudiants de mettre en œuvre les techniques présentées en cours. Cette confrontera l'étudiant à deux situations classiques : i) un contexte de séquencage de novo / ii) Un contexte de reséquencage avec génome de référence. Les différentes techniques mises en œuvre seront vues lors de deux séries de TP: une  première série de TP sur le séquençage de novo de génome bactérien, enchaînant contrôle qualité des reads, assemblage et annotation fonctionnelle et structurelle par similarité des objets obtenus (du gène à la carte métabolique), et une deuxième série de TP de reséquençage sur des données humaines, allant du mapping à l'analyse des polymorphismes découverts par SNP calling. A cette occasion les étudiants développeront un pipeline Galaxy pour automatiser l'analyse dans des conditions très proches du milieu professionnel.

16 H de CM - 16 H de TD - 28 H de TP - Modalités d'évaluation : Examen écrit

 

OBLIGATOIRE SEMESTRE 4 ORIENTATION BIOINFORMATIQUE : UE OBLIGATOIRE DATA MINING (3 ECTS) et STAGE (27 ECTS) en laboratoire ou dans l'industrie - Mémoire technique ou article scientifique avec soutenance orale

12- Data mining et Big Data (C Helbert, D Maucort-Boulch) 3 ECTS - UE mutualisée avec la filière MIR (Mathématiques et Ingénierie du Risque) de l'option Mathématiques et D2cision de la 3ème année de l'Ecole Centrale)

 L’objectif du cours est de donner aux étudiants les outils pour aborder des problèmes statistiques du Big Data sous l’angle des problèmes d’apprentissage en grande dimension. La grande dimension pourra être vue sous l’angle de d’un grand nombre de variables et/ou d’un échantillon de grande taille (nombre d’individus important). Une conférence introductive permettra de donner les contours de ce qui relève du Big Data (1 h). Ensuite, les grandes classes de méthodes d’apprentissage seront étudiées : modèles linéaires pénalisés, modèles additifs généralisés, modèles à base d’arbres (CART, random forests, etc) (8h de CM + 6 h de TD).

11 H de CM - 10 H de TD - Modalités d'évaluation : Compte-rendu de TP, Moyenne des 3 compte-rendus de TP