Se connecter
Date limite de participation :
18 juin 2021

Prédiction des volumes de ventes des produits de grande consommation

Ce challenge consiste à fournir un modèle prédictif permettant d’estimer les volumes de ventes journaliers réalisés par différents points de vente pour divers produits de grande consommation (hors produits frais ou à poids variable).

Classement
1. (2) Romain Ayres Score 0.547809
2. (1) Pierre Nowak Score 0.548524
3. (9) Jacques PEETERS Score 0.550062
Ce challenge est terminé.

5 700

€ 

2665

contributions

657

participants

terminé
terminé

Il s’agit de fournir un modèle permettant d’estimer les volumes de ventes journaliers, réalisés par différents points de vente pour divers produits de grande consommation (hors produits frais ou à poids variable).

Le modèle doit pouvoir prédire ces volumes sur un horizon de 3 mois à la maille jour. Les candidats doivent restituer des modèles susceptibles d’être industrialisés à l’échelle et généralisables à d’autre produits et points de vente.

Les candidats disposent d’une base d’apprentissage contenant les ventes journalières, d’une sélection de produits, réalisées par un échantillon de points de vente sur l’année 2018. Les algorithmes seront évalués par rapport aux volumes réalisés sur le premier trimestre 2019.

L'utilisation de toute autre donnée en dehors de celles fournies dans le cadre du challenge est interdite.

Le règlement complet du challenge peut être téléchargé à cette adresse.

Dans le cadre de ce challenge, les soumissions seront évaluées sur la base de l'erreur \(\text{RMSLE}\) (Root Mean Squared Logarithmic Error) :

$$\text{RMSLE} = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (\log(\hat{y}_i + 1) - \log(y_i + 1))^2}$$

Où :

  • \(n\) est le nombre de prédictions attendues (cf. détails par la suite)
  • \(\hat{y}_i\) est la prédiction du volume de ventes
  • \(y_i\) est le volume réel de ventes

L'évaluation s'applique uniquement aux prédictions attendues, c.-à-d. pour lesquelles au moins une vente réelle (du produit par le point de vente en question) a bien été constatée le jour même ou dans les six jours précédents. Dans le cas contraire, la prédiction ne sera pas pénalisée et n'entrera pas dans le calcul du score.

Les prédictions de non-ventes (c.-à-d. prédictions de quantités nulles) sont considérées comme étant implicites. Autrement dit, lorsqu'une prédiction attendue est absente du fichier de soumission, cela est équivalent à avoir prédit 0 à la place.

L'exemple (simplifié) de la figure ci-dessous illustre ce processus d'évaluation.

Dans l'exemple, deux ventes réelles d'un article ont été constatées le 07/02/2019 et le 20/02/2019. Par conséquent, il y a 14 prédictions pénalisables (attendues) au total: celles du 7 au 13 février (relatives à la vente du 7 février et aux non-ventes des six jours suivants) et celles du 20 au 26 février (correspondant au 20 février et aux non-ventes des six jours suivants).

Le fichier de soumission contient quant à lui trois prédictions de vente.

La première prédiction entre dans le calcul du score, puisqu'elle correspond à un jour où une vente réelle s'est produite.

La deuxième prédiction n'est, quant à elle, pas pénalisée car elle ne fait pas partie des prédictions attendues (aucune vente réelle le jour même ou sur les six jours précédents).

En l'absence d'une prédiction explicite pour le 20 février, celle-ci est considérée comme une prédiction nulle (de non-vente) et elle est prise en compte dans le calcul du score.

Enfin, la dernière prédiction entre en compte pour le calcul du score, puisqu'elle fait partie des 14 prédictions attendues.

Format des soumissions

Le fichier soumis doit contenir deux colonnes, la première (id) correspondant à l'identifiant de la prédiction et la deuxième (qte) à la quantité prédite.

L'identifiant de la prédiction (colonne id) est obtenu par concaténation de l'identifiant du point de vente, suivi par celui du produit puis par la date au format YYYYMMDD en utilisant le symbole de trait de soulignement (_) comme séparateur : <id_point_de_vente>_<id_produit>_<date>.

Toutes les quantités prédites (colonne qte) doivent obligatoirement être exprimées sous forme de nombres entiers.

Le fichier doit avoir un en-tête et utiliser la virgule (,) comme séparateur. Il doit ressembler à l'exemple suivant :

id,qte
1_1_20190101,3
1_2_20190101,1
1_3_20190101,6
...

Le non respect du format attendu (noms des colonnes, séparateur, ...) pourra provoquer le rejet de la contribution, qui ne sera alors pas évaluée.

Compte tenu du volume des données manipulées, il est fortement conseillé de compresser votre fichier (format .zip) avant de le soumettre.

Dates clés:

  • 6 mai 2021 : lancement du challenge.
  • 18 juin 2021 (minuit) : clôture du challenge.
  • Du 20 au 27 juin 2021 : mise à disposition des codes sources par les 10 premiers du classement du challenge.
  • 30 juin 2021 : annonce des gagnants.
Lot 1Chèque de 3000 euros
Lot 2Chèque de 1500 euros
Lot 3Chèque de 500 euros
Lot 4Un bon d’achat d’une valeur de 100 euros d’une durée de validité de 12 mois valable dans les points de vente sous enseigne INTERMARCHE
Lot 5Un bon d’achat d’une valeur de 100 euros d’une durée de validité de 12 mois valable dans les points de vente sous enseigne INTERMARCHE
Lot 6Un bon d’achat d’une valeur de 100 euros d’une durée de validité de 12 mois valable dans les points de vente sous enseigne INTERMARCHE
Lot 7Un bon d’achat d’une valeur de 100 euros d’une durée de validité de 12 mois valable dans les points de vente sous enseigne INTERMARCHE
Lot 8Un bon d’achat d’une valeur de 100 euros d’une durée de validité de 12 mois valable dans les points de vente sous enseigne INTERMARCHE
Lot 9Un bon d’achat d’une valeur de 100 euros d’une durée de validité de 12 mois valable dans les points de vente sous enseigne INTERMARCHE
Lot 10Un bon d’achat d’une valeur de 100 euros d’une durée de validité de 12 mois valable dans les points de vente sous enseigne INTERMARCHE
1. (2) Romain Ayres 82 contributions 18/06/21 18:06 Score 0.547809
2. (1) Pierre Nowak 78 contributions 18/06/21 09:37 Score 0.548524
3. (9) Jacques PEETERS 33 contributions 18/06/21 19:28 Score 0.550062
4. (3) Raphael Sourty 97 contributions 17/06/21 13:25 Score 0.554181
5. (6) Dan Emery 93 contributions 18/06/21 22:13 Score 0.554676
6. (4) Changyi SONG 102 contributions 18/06/21 17:05 Score 0.554753
7. (5) Florian Laroumagne 84 contributions 16/06/21 20:34 Score 0.556010
8. (7) Mathurin Aché 81 contributions 18/06/21 23:23 Score 0.556652
9. (17) Pierre Tisseur 58 contributions 18/06/21 22:15 Score 0.557630
10. (8) Max Halford 43 contributions 07/06/21 09:27 Score 0.558817
11. (12) Elodie Quandalle 8 contributions 16/06/21 22:51 Score 0.561751
12. (11) Romain A. 48 contributions 16/06/21 11:56 Score 0.562920
13. (10) Wendyy 47 contributions 18/06/21 15:26 Score 0.562920
14. (13) DATATEST 69 contributions 07/06/21 21:25 Score 0.565966
15. (14) Noamane CHALLIOUI 62 contributions 29/05/21 15:58 Score 0.567051
16. (15) Olivier Grellier 44 contributions 24/05/21 10:04 Score 0.567933
17. (16) DataExMachina 19 contributions 27/05/21 00:19 Score 0.568863
18. (27) Elie Salem 28 contributions 18/06/21 23:25 Score 0.569282
19. (25) Julien 68 contributions 18/06/21 23:10 Score 0.569638
20. (18) Christophe Goudet 28 contributions 12/06/21 19:48 Score 0.570164
21. (19) Loulou l 24 contributions 08/06/21 13:13 Score 0.571032
22. (20) AWA 38 contributions 11/06/21 11:01 Score 0.571761
23. (21) H 16 contributions 24/05/21 19:15 Score 0.572216
24. (22) Guillaume Schaller 16 contributions 05/06/21 12:16 Score 0.573462
25. (23) RTS 56 contributions 11/06/21 17:00 Score 0.573750
26. (24) tms.ai 37 contributions 02/06/21 08:43 Score 0.573821
27. (26) Nicolas Vandeput 49 contributions 07/06/21 13:40 Score 0.576476
28. (28) RF 38 contributions 05/06/21 21:59 Score 0.579930
29. (29) pierrelouisbescond 50 contributions 12/06/21 05:19 Score 0.580033
30. (30) Laouer 27 contributions 05/06/21 20:25 Score 0.580095
31. (31) Henri Perillat 32 contributions 24/05/21 11:41 Score 0.581041
32. (32) Luc Magnat 18 contributions 24/05/21 12:26 Score 0.581044
33. (33) sinichi 10 contributions 23/05/21 19:57 Score 0.582055
34. Salomé Chalony 5 contributions 18/06/21 21:24 Score 0.582970
35. (48) nbdls 11 contributions 18/06/21 23:53 Score 0.582970
36. (34) pikachu pikachu 12 contributions 22/05/21 23:03 Score 0.583074
37. (35) louis LSTM 7 contributions 22/05/21 23:12 Score 0.583263
38. (36) Xgboost a 6 contributions 22/05/21 22:34 Score 0.584001
39. (37) leroux arnaud 15 contributions 22/05/21 22:23 Score 0.584228
40. (38) .predict 27 contributions 19/05/21 22:20 Score 0.585895
41. (39) François 1 contribution 21/05/21 09:15 Score 0.590222
42. (40) snake _ 13 contributions 21/05/21 13:41 Score 0.592625
43. (41) Nicolas Martin 6 contributions 30/05/21 16:20 Score 0.592909
44. (42) Romain Loury Polarys 22 contributions 13/06/21 23:34 Score 0.594606
45. (58) TJUS 6 contributions 17/06/21 22:47 Score 0.594623
46. (43) Vincent Levorato 4 contributions 20/05/21 17:28 Score 0.595061
47. (44) jean sak polarys 4 contributions 29/05/21 23:15 Score 0.596770
48. (45) Nicolas Cazard 12 contributions 01/06/21 14:35 Score 0.597743
49. (46) Cessna 6 contributions 16/05/21 16:53 Score 0.598161
50. (47) Prakash & Sri 10 contributions 14/06/21 18:01 Score 0.598736
51. (49) Team Challenge Accepted 11 contributions 23/05/21 18:27 Score 0.614002
52. (50) bern jean 4 contributions 12/06/21 00:00 Score 0.614636
53. (51) SparseCat 14 contributions 24/05/21 18:15 Score 0.614724
54. (52) C julien 26 contributions 31/05/21 22:35 Score 0.615592
55. (61) Eliot 34 contributions 17/06/21 09:42 Score 0.616824
56. (53) flog 37 contributions 27/05/21 22:41 Score 0.617759
57. (54) cosmic ai 2 contributions 26/05/21 12:05 Score 0.621279
58. (91) JAMILA REJEB 13 contributions 16/06/21 09:21 Score 0.627980
59. (55) Docteur panda 4 contributions 22/05/21 20:23 Score 0.641631
60. (56) DataMountain 18 contributions 08/06/21 20:12 Score 0.642377
61. (57) Adrien ANDRE 13 contributions 28/05/21 10:01 Score 0.643503
62. (59) Unlimited TS 2 contributions 09/05/21 12:57 Score 0.656618
63. (60) EB 14 contributions 11/06/21 23:43 Score 0.660249
64. (64) Kdata 19 contributions 18/06/21 16:47 Score 0.665968
65. (62) Lina 8 contributions 12/06/21 01:28 Score 0.666626
66. (63) gleg 7 contributions 18/05/21 21:39 Score 0.667768
67. Komla Senyo AMUZU 5 contributions 15/06/21 17:17 Score 0.675606
68. (65) Elie Alex Kameni Ngangue 1 contribution 23/05/21 11:55 Score 0.676753
69. (66) Thibault 3 contributions 10/06/21 10:15 Score 0.677080
70. (67) Thomas Charuel 9 contributions 30/05/21 11:45 Score 0.679876
71. Moustapha AI 2 contributions 16/06/21 11:38 Score 0.692013
72. (68) KB19 5 contributions 14/06/21 17:07 Score 0.693763
73. (69) Ryu Sei 6 contributions 25/05/21 17:07 Score 0.698368
74. (70) JaiDuBonData 5 contributions 25/05/21 12:29 Score 0.699839
75. (71) Stevens05 33 contributions 02/06/21 09:35 Score 0.705451
76. (72) oussama sahli 8 contributions 04/06/21 12:41 Score 0.705761
77. (73) N.Hans your data 5 contributions 12/06/21 10:13 Score 0.709362
78. (74) charde ML 1 contribution 24/05/21 22:04 Score 0.710723
79. (75) Psqrt PS 12 contributions 27/05/21 13:23 Score 0.717119
80. (76) Red 1 2 contributions 04/06/21 15:18 Score 0.719026
81. (77) Corentin MADRE 11 contributions 04/06/21 10:16 Score 0.719077
82. (86) digitalfox 8 contributions 14/06/21 09:23 Score 0.721381
83. (78) RDP 5 contributions 03/06/21 22:00 Score 0.722134
84. (79) ZeusOnFire 21 contributions 16/05/21 01:23 Score 0.725209
85. (80) datavader 6 contributions 16/05/21 23:14 Score 0.725740
86. (81) Yann LETERRIER 20 contributions 17/05/21 17:30 Score 0.726159
87. (82) No One 2 contributions 19/05/21 16:41 Score 0.726978
88. (83) Cokral 14 contributions 26/05/21 20:29 Score 0.730552
89. (84) kk 8 contributions 01/06/21 09:38 Score 0.732303
90. (85) FDA 18 contributions 29/05/21 22:15 Score 0.734073
91. (87) Camille 5 contributions 15/05/21 19:44 Score 0.744253
92. (88) iLearn Luce 18 contributions 17/05/21 00:28 Score 0.744253
93. (89) Marwan Boughzala Polarys 5 contributions 01/06/21 23:57 Score 0.744253
94. (90) Barrett Layman 2 contributions 08/06/21 13:40 Score 0.744253
95. (92) Locust2520 2 contributions 11/05/21 14:42 Score 0.745645
96. (93) Quentin 2 contributions 15/05/21 20:20 Score 0.748539
97. (94) Ball 15 contributions 21/05/21 17:39 Score 0.764830
98. (95) AltTim 10 contributions 18/05/21 16:14 Score 0.776872
99. (96) Geoff 5 contributions 31/05/21 13:12 Score 0.783044
100. GT 2 contributions 17/06/21 21:28 Score 0.783044
101. (97) ineed ram 2 contributions 07/06/21 01:14 Score 0.783281
102. (99) THOMIAS Christopher 41 contributions 18/06/21 23:54 Score 0.783691
103. (98) DataBias 6 contributions 18/05/21 12:24 Score 0.789741
104. (100) Zamal 2 contributions 03/06/21 17:06 Score 0.810576
105. (101) diss0lution 1 contribution 12/05/21 21:22 Score 0.810578
106. (102) Tonio 2 contributions 13/05/21 19:54 Score 0.810578
107. (103) Nicolas Julien 7 contributions 31/05/21 23:42 Score 0.810578
108. (104) SAP 2 contributions 14/05/21 04:05 Score 0.813765
109. (105) NN 1 contribution 19/05/21 00:24 Score 0.820584
110. (106) Alexis_vl 1 contribution 19/05/21 23:13 Score 0.822397
111. (107) Jules Afresne 3 contributions 10/06/21 21:37 Score 0.846929
112. (108) ZOS 2 contributions 21/05/21 23:24 Score 0.847273
113. (109) AdriDut 5 contributions 27/05/21 17:48 Score 0.849164
114. (110) AdAstra 2 contributions 23/05/21 21:54 Score 0.867464
115. (111) Simon 3 contributions 15/05/21 21:42 Score 0.904765
116. Marwan Manai 3 contributions 16/06/21 14:15 Score 0.912695
117. (112) John Sibony 1 contribution 17/05/21 10:12 Score 0.928278
118. (113) cho7tom F. 1 contribution 16/05/21 11:47 Score 0.939847
119. (114) Julien Durand 9 contributions 29/05/21 19:53 Score 0.948230
120. Mdrc 2 contributions 18/06/21 20:03 Score 0.976492
121. David MAGNY 1 contribution 18/06/21 21:43 Score 0.985950
122. CAH 5 contributions 17/06/21 21:04 Score 1.014555
Discussions
loading... Chargement...