Category en

Estimating when a message will be consumed in Kafka

At Cdiscount we use Kafka for a wide variety of applications. From a simple buffer in front of spiky workload, to the distribution of events between services, to the real-time...

Cdiscount image dataset for visual search and product classification

12M images of 7M products classified into 5K categories Images from a large e-retailer Recent advances in artificial intelligence and image recognition allow a whole new set of services to...

Ensure cross-datacenter guaranteed message delivery and resilience with Apache Pulsar

At Cdiscount, we process large volumes of real-time data through distributed messaging systems. For our event broadcasting needs, we currently use Kafka and for our queuing needs, we use RabbitMQ....

Link Prediction In Large-Scale Networks

A comparison of supervised and unsupervised approaches to infer missing links from an observed network by Guillaume Le Floch (Data Scientist at Cdiscount)

How Prometheus helped roll out with confidence our new mobile site to millions of customers

At Cdiscount, we always love finding new tools and technologies that can help us oversee our platform, understand what’s happening and prevent outages. Last year while working on our new...

A brief overview of Automatic Machine Learning solutions (AutoML)

Julien Jouganous, Data Scientist at Cdiscount Romain Savidan, Data Scientist at Cdiscount Axel Bellec, Data Scientist at Cdiscount

A quick experience feedback about the Cdiscount image classification Kaggle competition

Introduction: Three months ago, we launched a data science competition on the famous Kaggle platform. The aim was to develop a product classifier based on image analysis. Indeed, our catalog...

Visual search

It might sometimes be complicated for a customer to translate his tastes or purchase intents into words to be typed into a search engine. That’s particularly true for non technical...

Part-of-Speech tagging tutorial with the Keras Deep Learning library

In this tutorial, you will see how you can use a simple Keras model to train and evaluate an artificial neural network for multi-class classification problems. Part-of-Speech tagging is a...

Python profiling

Sometimes, computational performances become a crucial point in production algorithms. That’s especially true in data science where proof of concept pieces of code can have a poor scalability in terms...

Our participation to the Kaggle challenge: Quora Question Pairs

So, we decided to spend a little of our time on a Kaggle challenge, namely, Quora Question Pairs. (By “we”, I mean the data scientists of Cdiscount.) The purpose of...

Category data science

Cdiscount image dataset for visual search and product classification

12M images of 7M products classified into 5K categories Images from a large e-retailer Recent advances in artificial intelligence and image recognition allow a whole new set of services to...

Link Prediction In Large-Scale Networks

A comparison of supervised and unsupervised approaches to infer missing links from an observed network by Guillaume Le Floch (Data Scientist at Cdiscount)

A brief overview of Automatic Machine Learning solutions (AutoML)

Julien Jouganous, Data Scientist at Cdiscount Romain Savidan, Data Scientist at Cdiscount Axel Bellec, Data Scientist at Cdiscount

A quick experience feedback about the Cdiscount image classification Kaggle competition

Introduction: Three months ago, we launched a data science competition on the famous Kaggle platform. The aim was to develop a product classifier based on image analysis. Indeed, our catalog...

Visual search

It might sometimes be complicated for a customer to translate his tastes or purchase intents into words to be typed into a search engine. That’s particularly true for non technical...

Part-of-Speech tagging tutorial with the Keras Deep Learning library

In this tutorial, you will see how you can use a simple Keras model to train and evaluate an artificial neural network for multi-class classification problems. Part-of-Speech tagging is a...

Python profiling

Sometimes, computational performances become a crucial point in production algorithms. That’s especially true in data science where proof of concept pieces of code can have a poor scalability in terms...

Our participation to the Kaggle challenge: Quora Question Pairs

So, we decided to spend a little of our time on a Kaggle challenge, namely, Quora Question Pairs. (By “we”, I mean the data scientists of Cdiscount.) The purpose of...

Category cloud

Estimating when a message will be consumed in Kafka

At Cdiscount we use Kafka for a wide variety of applications. From a simple buffer in front of spiky workload, to the distribution of events between services, to the real-time...

Remplacer un tracking côté client par un tracking côté serveur avec Puppeteer

Le tracking fait maintenant partie intégrante du web. Tous les sites web disposent de scripts qui permettent de suivre les actions de ses utilisateurs afin d’améliorer leur expérience, de comprendre...

Garantir la livraison des messages et la résilience sur plusieurs datacenters avec Apache Pulsar

Chez Cdiscount, nous traitons d’importants volumes de données en temps réel grâce à des systèmes de messaging distribués. Pour nos besoins de diffusion d’événements, nous utilisons actuellement Kafka et pour...

Ensure cross-datacenter guaranteed message delivery and resilience with Apache Pulsar

At Cdiscount, we process large volumes of real-time data through distributed messaging systems. For our event broadcasting needs, we currently use Kafka and for our queuing needs, we use RabbitMQ....

Détection de bots

Pourquoi avons-nous conçu un détecteur de bots pour notre site de e-commerce ?

How Prometheus helped roll out with confidence our new mobile site to millions of customers

At Cdiscount, we always love finding new tools and technologies that can help us oversee our platform, understand what’s happening and prevent outages. Last year while working on our new...

Category fr

Préservez vos ressources et boostez la performance avec la programmation réactive

Si ce genre de considération ne se posait peut-être pas il y a quelques dizaines d’années, nos applications web modernes doivent aujourd’hui, de par leur dynamisme et leur interactivité accrus,...

Pourquoi l’engineering ?

Il est incontestable que le COVID-19 a été l’agent principal de transformation digitale des entreprises. Les habitudes de travail, la proximité sociale, et jusqu’aux mécaniques de supply chain ont été...

Remplacer un tracking côté client par un tracking côté serveur avec Puppeteer

Le tracking fait maintenant partie intégrante du web. Tous les sites web disposent de scripts qui permettent de suivre les actions de ses utilisateurs afin d’améliorer leur expérience, de comprendre...

Garantir la livraison des messages et la résilience sur plusieurs datacenters avec Apache Pulsar

Chez Cdiscount, nous traitons d’importants volumes de données en temps réel grâce à des systèmes de messaging distribués. Pour nos besoins de diffusion d’événements, nous utilisons actuellement Kafka et pour...

Encaisser des centaines de millions de Hit : les soldes chez Cdiscount

Les soldes, un des moments forts de la vie du e-commerce Cdiscount vit au rythme des grands évènements commerciaux de l’année : soldes d’hiver, french days, soldes d’été, black friday,...

Détection de bots

Pourquoi avons-nous conçu un détecteur de bots pour notre site de e-commerce ?

Meetup Deezer

Cdiscount sera présent dans les nouveaux locaux de Deezer à Bordeaux jeudi 29 novembre 2018 pour une session de 3 talks orientés infrastructure.

Category events

Encaisser des centaines de millions de Hit : les soldes chez Cdiscount

Les soldes, un des moments forts de la vie du e-commerce Cdiscount vit au rythme des grands évènements commerciaux de l’année : soldes d’hiver, french days, soldes d’été, black friday,...

Meetup Deezer

Cdiscount sera présent dans les nouveaux locaux de Deezer à Bordeaux jeudi 29 novembre 2018 pour une session de 3 talks orientés infrastructure.

Category web

Remplacer un tracking côté client par un tracking côté serveur avec Puppeteer

Le tracking fait maintenant partie intégrante du web. Tous les sites web disposent de scripts qui permettent de suivre les actions de ses utilisateurs afin d’améliorer leur expérience, de comprendre...

Category kafka

Estimating when a message will be consumed in Kafka

At Cdiscount we use Kafka for a wide variety of applications. From a simple buffer in front of spiky workload, to the distribution of events between services, to the real-time...

Category messaging

Estimating when a message will be consumed in Kafka

At Cdiscount we use Kafka for a wide variety of applications. From a simple buffer in front of spiky workload, to the distribution of events between services, to the real-time...

Category engineering

Pourquoi l’engineering ?

Il est incontestable que le COVID-19 a été l’agent principal de transformation digitale des entreprises. Les habitudes de travail, la proximité sociale, et jusqu’aux mécaniques de supply chain ont été...

Category change

Pourquoi l’engineering ?

Il est incontestable que le COVID-19 a été l’agent principal de transformation digitale des entreprises. Les habitudes de travail, la proximité sociale, et jusqu’aux mécaniques de supply chain ont été...

Category mindset

Pourquoi l’engineering ?

Il est incontestable que le COVID-19 a été l’agent principal de transformation digitale des entreprises. Les habitudes de travail, la proximité sociale, et jusqu’aux mécaniques de supply chain ont été...

Category acceleration

Pourquoi l’engineering ?

Il est incontestable que le COVID-19 a été l’agent principal de transformation digitale des entreprises. Les habitudes de travail, la proximité sociale, et jusqu’aux mécaniques de supply chain ont été...

Category digital transformation

Pourquoi l’engineering ?

Il est incontestable que le COVID-19 a été l’agent principal de transformation digitale des entreprises. Les habitudes de travail, la proximité sociale, et jusqu’aux mécaniques de supply chain ont été...

Category programmation

Préservez vos ressources et boostez la performance avec la programmation réactive

Si ce genre de considération ne se posait peut-être pas il y a quelques dizaines d’années, nos applications web modernes doivent aujourd’hui, de par leur dynamisme et leur interactivité accrus,...