2020-07-01, 01:48 PM
Bonjour,
Je propose une discussion / listing autour des différents algorithmes de clustering basé sur les graphes. J'invite toute personne a compléter / corriger le contenue de ce poste.
Le plus connu dans notre domaine est sans doute Phenograph (et son implémentation en R: Rphenograph) mais depuis peu il existe des variantes se basant sur les mêmes 3 étapes de cet algorithme pour optimiser le temps de calcul et la qualité des résultats.
Les trois étapes de ces algorithmes sont les mêmes dans le principe :
PS : j'éditerai ce poste pour ajouter des informations sur chaques algorithmes
Je propose une discussion / listing autour des différents algorithmes de clustering basé sur les graphes. J'invite toute personne a compléter / corriger le contenue de ce poste.
Le plus connu dans notre domaine est sans doute Phenograph (et son implémentation en R: Rphenograph) mais depuis peu il existe des variantes se basant sur les mêmes 3 étapes de cet algorithme pour optimiser le temps de calcul et la qualité des résultats.
Les trois étapes de ces algorithmes sont les mêmes dans le principe :
- Recherche des proches voisins par une métrique de distance
- Transformation en graphique avec une métrique (la plus utilisée étant l'index de Jaccard : https://fr.wikipedia.org/wiki/Indice_et_...de_Jaccard)
- Regroupement des nœuds du graphe en "communauté" (en cluster donc au final)
- Phenograph (utilisé dans cytofkit : https://pubmed.ncbi.nlm.nih.gov/26095251/ )
- PARC (https://www.biorxiv.org/content/10.1101/765628v1)
- FastPG (https://www.biorxiv.org/content/10.1101/...749v1.full)
- Rphenoannoy (https://github.com/stuchly/Rphenoannoy)
- i-cyto/RPhenograph (https://github.com/i-cyto/Rphenograph)
PS : j'éditerai ce poste pour ajouter des informations sur chaques algorithmes