# DONNEES PROJET EMOB

Les données jointes correspondent aux résultats de la 1e expérimentation du projet EMOB qui s'inscrit dans le [projet MobiDIC](https://limos.fr/news_project/275)

Dans le but de réaliser des prédictions de mouvements de faible intensité à l'aide de techniques de deep learning, des données de différents capteurs ont été récupérées, fusionnées, alignées puis étiquetées afin d'obtenir des datasets complets de données de capteurs

Ces datasets correspondent à environ 10 minutes d'activité d'une personne réalisant des gestes quotidiens

Ces datasets sont des fichiers CSV se trouvant dans les dossiers `capture_yyyy-mm-dd.csv`

Pour chaque dataset correspond la vidéo ayant servi de support pour la construction des données.

Le fichier metadata.md explicite les différents noms des colonnes des CSV

Les capteurs utilisés sont 

- **Qualisys** : placés sur plusieurs parties du corps, fournissant des données géomètriques (x, y, z) et permettant de reconstituer le squelette
- **Smartphone** (ou capteurs Favreau) : capteurs intégérés au smartphone, fournissant des données accéléromètriques, d'accélération linéaire et gyroscopiques.
- **Bergeret** : capteurs construits ad hoc par l'équipe d'Emmanuel BERGERET, fournissant des données accéléromètriques, gyroscopiques et de magnétomètre

De même, les vidéos des activités ont été récupérées dans le but de réaliser des étiquetages de données

Dautres capteurs (Withings, UKK, MBient, Empatica, Polar) recueillant aussi des données accéléromètriques ont été testés mais non retenus. 

## process de récupération des données

Une API a été montée sur un serveur (interface accessible sur [edol.limos.fr](https://edol.limos.fr)) permettant de récupérer les données sous différents formats et de les rentrer en base de données sous un format standardisé

Il est possible de visualiser ces données ou préparer une acquisition par cette interface

## Etiquetage des données

Un étiquetage manuel a été réalisé sur les données à partir des vidéos 

Une version du logiciel Tofu a été utilisée pour cet étiquetage en appliquant des règles strictes afin d'avoir un résultat homogène selon les personnes réalisant l'étiquetage (cf etiquetage.ods).

Les résultats des étiquetages (en CSV) ont été importés sur la plateforme et associés aux données capteur correspondantes

## Construction du dataset 

La librairie Pandas en Python a été utilisée pour réaliser des dataframes par capteur et les assembler afin de définir un dataset.

Les horloges des différents capteurs présentant quelques centièmes de secondes d'écart, les dataframes ont du être resynchronisés. 

Après resynchronisation, les données ont été lissées, puis les étiquetages ont été ajoutés