Graph-Based Clustering -
Quentin - 2020-07-01
Bonjour,
Je propose une discussion / listing autour des différents algorithmes de clustering basé sur les graphes. J'invite toute personne a compléter / corriger le contenue de ce poste.
Le plus connu dans notre domaine est sans doute Phenograph (et son implémentation en R: Rphenograph) mais depuis peu il existe des variantes se basant sur les mêmes 3 étapes de cet algorithme pour optimiser le temps de calcul et la qualité des résultats.
Les trois étapes de ces algorithmes sont les mêmes dans le principe :
- Recherche des proches voisins par une métrique de distance
- Regroupement des nœuds du graphe en "communauté" (en cluster donc au final)
A l'heure actuelle j'ai noté 5 variantes de cette approche dont deux sans publications mais avec des liens github.
- Phenograph (utilisé dans cytofkit : https://pubmed.ncbi.nlm.nih.gov/26095251/ )
- PARC (https://www.biorxiv.org/content/10.1101/765628v1)
- FastPG (https://www.biorxiv.org/content/10.1101/2020.06.19.159749v1.full)
- Rphenoannoy (https://github.com/stuchly/Rphenoannoy)
- i-cyto/RPhenograph (https://github.com/i-cyto/Rphenograph)
PS : j'éditerai ce poste pour ajouter des informations sur chaques algorithmes