Formations

  • 2019 Doctorat en bio-informatique - CRBM (CNRS), Montpellier
    Développement de méthodes bio-informatiques pour l’étude des régions non globulaires portées par les protéines et leur conservation au cours de l’évolution. Cette thèse a été financée sur 3 ans par une bourse ministérielle obtenue à l’issue du concours organisé par l’école doctorale CBS2. Puis sur un an par une allocation doctorale obtenue auprès de la Ligue contre le cancer. Le mémoire de thèse est actuellement non disponible.

  • 2015 Titre d’ingénieur en développement logiciel - ENSIBS (Université de Bretagne Sud), Vannes
    L’ENSIBS est une école d’ingénieur généraliste formant des spécialistes dans le domaine de l’architecture logicielle et de l’estimation de la qualité logicielle.

  • 2014 Semestre d’étude à l’étranger - Département d’ingénierie logicielle (Université du Québec à Chicoutimi), Chicoutimi Canada
    Ce semestre d’étude à l’étranger à été principalement centré sur l’architecture logicielle et la fouille de données.

  • 2012 Diplome universitaire de technologie d’analyste programmeur. - IUT de l’Université de Bretagne Sud, Vannes
    L’IUT de Vannes forme des analystes développeurs généralistes.

Compétences techniques

  • Langages de programmation :
    – Ruby pour le scripting de tous les jours, grâce à sa grande expressivité, plus rarement pour le développement d’application lourde à l’aide JRuby (qui permet la pseudo-compilation en jar du code ruby).
    – Java pour le développement d’applications lourdes, la verbosité et la forte structuration du langage en font un outil de choix pour l’écriture d’applications amenées à être maintenues sur longues durées.
    – SQL pour l’exploitation de base de données relationnelles
  • Autres langages de programmation :
    – Bash, bonnes notions, modifications de scripts existants, pour l’administration et le contrôle de tâches sur cluster de calcul
    – Python, bonnes notions : écriture de script basique et modifications de scripts existants
    – Perl, notions, modifications de scripts existants
    – R/Julia, bonnes notions : écriture de script basique pour l’analyse statistique et la visualisation de données.
  • Outils (au sens large) pour le développement :
    – UML/OCL, pour la modélisation d’application, comme outil de discussion lors de l’écriture logicielle
    – Git, pour la gestion de version et le travail collaboratif
  • Operating system – GNU/Linux sur cluster de calcul, serveur or ordinateur de bureau (distribution Debian et ses dérivés principalement)

Compétences techniques liè à la bio-informatique

  • Annotation de séquences protéiques Lors de mes travaux de thèse j’ai conçu un important pipeline pour l’annotation des séquences protéiques, utilisant l’état de l’art des prédicteurs, et traitant des régions suivantes : régions désordonnées, régions amyloïdogéniques, domaines (Pfam et CATH), régions transmembranaires, peptides signaux, motif (SLiM).

  • Création de bases de données relationnelles pour l’exploitation des données OMICS Dans le cadre de mes travaux de thèse j’ai développé une base de données relationnelles pour organiser les données que je traitais (~ 1.000.000 protéines et leurs annotations) et ainsi permettre leur exploitation (visualisation à travers une interface web, analyse statistique, machine learning…).


  • Prédiction des effets de mutations sur les structures des protéines Dans le cadre de mes travaux de thèse j’ai fait de la prédiction des effets de mutations ponctuelles ou “larges” (troncations) sur la structure de protéines.

Enseignement

  • Enseignement de l’UE de théorie des interfaces graphiques en IUT (plus de 30 heures par groupe de ~ 25 étudiants, 2 groupes) : comment recueillir les besoins des utilisateurs, comment produire une interface homme / machine répondant aux besoins exprimés, comment la faire évoluer. Plus théoriquement qu’est-ce qu’une bonne interface graphique (compte tenu des corps, de leur environnement direct et culturel).

Publications

  • Villain E, Nikekhin AA, Kajava AV.
    Porins and Amyloids are Coded by Similar Sequence Motifs.
    Proteomics. 2019 Mar;19(6):1800075.

  • Roche DB, Villain E, Kajava AV.
    Usage of a dataset of NMR resolved protein structures to test aggregation versus solubility prediction algorithms.
    Protein Science. 2017 Sep;26(9):1864-9.

Conférences

  • 2019 Séminaire de microbiologie, université Paris Sud XI campus d’Orsay :
    Relationship between protein’s disordered regions and organism thermal adaptation
    Villain E.

  • 2016 Journées ouvertes de biologie, informatique et mathématiques, avec la présentation :
    Large sacale analysis of amyloidogenic proteins in a dataset of 93 evolutionary diverses proteoms
    Villain E., Richard F., Fort P. and Kajava A.V.

Posters

  • 2020 JOBIM Montpellier :
    Pipeline for large scale analysis of amyloidogenic regions in proteomes.
    Falgarone T., Villain E., Leclercq J., Richard F. and Kajava A.V.

  • 2019 Winter workshop du COST action “Non-globular protein network” :
    Amyloidogenic regions selection over evolution, a proteome wide study.
    Villain E., Richard F., Fort P. and Kajava A.V.

Autres

  • Écriture de dossier de candidature à des financements : 3 candidatures à une extension de thèse écrites dont 2 furent couronnées de succès
  • Supervision d’étudiants : 2 étudiants de master II (stage de 6 mois), 1 étudiant de master I (stage de 3 mois)