Aperçu de l’application
Récupération des données
Grâce à de nombreux fans qui ne dorment que très peu la nuit et qui scrutent chaque nouvelle sortie de set LEGO, obtenir des données s’est révelé beaucoup plus simple que ce que nous avions initialement imaginé.
Source | Méthode | Données récoltées | |
---|---|---|---|
![]() |
Brickset | API |
Informations sur tous les sets |
![]() |
Brickeconomy | Scraping |
Prix actuel des sets |
Par exemple, le site Brickset dispose d’une base de données complète des sets de 1970 à nos jours, avec de nombreux avis d’utilisateurs, des images, le nombre de minifigurines, etc. Une API gratuite est par ailleurs mise à disposition pour récupérer ces données.
Néanmoins, le prix, donnée la plus stratégique, n’est pas disponible dans l’API, d’où notre recours au scraping qui nous a permis non seulement d’obtenir le prix de vente, mais aussi le prix actuel moyen de revente sur le marché de l’occasion selon l’état, information Ô combien plus précieuse.
Note : Toutes ces données sont récupérées par an dans les formats parquet
et feather
, dérivés d’Apache Arrow, et sont ensuite agrégées au sein d’un dataframe sur .
Le comment de l’application
Les Building Blocks de l’application sont :
{shiny}
{bslib}
{golem}
En savoir plus
Github : ShinyBricks