Quel est le but du développement du langage R++ ?

Le monde des statistiques est en pleine transformation. En effet, avec l’explosion des bases de données, les statisticiens ont besoin de techniques de plus en plus puissantes.

R est un langage et logiciel d’analyse statistique en pleine expansion grâce à ses nombreux avantages. Gratuit et open source, il permet une rapide intégration de nouvelles méthodes, et de nombreux packages sont disponibles. C’est pourquoi il est soutenu par une large communauté. Cependant ses performances restent limitées : la gestion de données de grande dimension avec R est compliquée et n’est pas intuitive, et le parallélisme (traitement d’informations de manière simultanée) n’est pas géré intrinsèquement. Ainsi, il paraît pertinent d’améliorer les performances de cet outil et de simplifier le fonctionnement pour les utilisateurs (statisticiens mais aussi économistes, médecins, psychologues, linguistes, sociologues…).

C’est justement le but de « R++ the Next Step », projet développant un langage (compilable et intégrant la gestion d’objets) et un logiciel nommés R++, constituant une nouvelle implémentation de R.

Mené par l’informaticien et statisticien Christophe Genolini, ce projet toujours en développement s’articule autour de trois axes :

- l’IHM (Interface Homme Machine). Les chercheurs souhaitent améliorer l’interaction entre l’homme et le logiciel, en perfectionnant l’ergonomie de l’outil.

- le Big Data. Les logiciels actuellement sur le marché peuvent traiter des données de l’ordre de 10 Gigaoctets. La finalité de R++ serait de pouvoir travailler sur des tailles bien plus élevées (de l’ordre de 50 Téraoctets).

- le parallélisme. R++ intégrerait en natif la gestion du parallélisme et s’intéresserait pour cela à trois sources exploitables sur les ordinateurs de bureaux récents : la carte graphique, le multi cœur et le cloud.

Ainsi, cette technologie pourrait traiter des volumes de données jusqu’à 800 fois plus rapide que les logiciels existants. En outre, c’est un logiciel métier accessible facilement et à destination d’utilisateurs non informaticiens.
R++ a donc probablement de beaux jours devant lui.