Il y a quelques semaines,JaiDécouvert lelogiciel OpenRefine, qui permet de réaliser des tâches dedata-curation , plus précisément dedata-cleaning — mais pas seulement.

JaimeraisUnJour prendre le temps d’essayer de nettoyer mes données Toggl avec OpenRefine.

Je lis ici que je peux manipuler plusieurs type de format de données :

From these sources, you can load any of the following file formats:

  • comma-separated values (CSV) or text-separated values (TSV)
  • Fixed-width columns
  • JSON

et

OpenRefine can connect to PostgreSQL, MySQL, MariaDB, and SQLite database systems


Je souhaite particulièrement tester la fonctionnalité cluster and edit de OpenRefine et surtout les différentes méthode de clustering.