Jun 1, 2020
The abstract in French 🇫🇷:
Le serving de modèle de Machine Learning pour la prédiction en temps réel présente des défis tant en Data Engineering qu’en Data Science. Comment construire un pipeline moderne qui permet de réaliser des prédictions en continu ? Dans le cas d’un exercice supervisé, comment allier tracing et tracking des performances ?
Nov 28, 2019
The abstract (in French 🇫🇷):
Le serving de modèle de Machine Learning pour la prédiction en temps réel présente des défis tant en Data Engineering qu’en Data Science. Comment construire un pipeline moderne qui permet de réaliser des prédictions en continu ? Dans le cas d’un exercice supervisé, comment allier tracing et tracking des performances ?
Jun 4, 2019
The abstract (in French 🇫🇷):
L’ Auto Scaling c’est l’argument phare d’un bon nombre de technologies en Data Engineering. Parmi les outils du moment, on retrouve Kafka-Streams. Avec sa forte intégration au bus de message Apache Kafka, il est pensé pour être un framework distribué capable de passer à l’échelle. Pourtant, dans la pratique, sa seule utilisation est limitée.
Apr 18, 2019
The abstract (in French 🇫🇷):
Kafka-Streams, la librairie de traitement de données en temps réel de Apache Kafka permet de traiter une grande quantité de messages avec de très faibles latences. Les messages peuvent avoir des formats différents, des schémas différents et même être sérialisés de manières différentes. Alors que se passe-t-il quand un message indésirable se retrouve dans un flux ?
Apr 15, 2019
There are many reasons for working on community contributions such as a blog post, a demo, or a talk. Sometimes, you produce those contributions to share something that you’ve learned at work. But sometimes, the contribution itself can be a way to learn and experiment something new. I was in the second case when I worked on the article Kafka Streams: a road to Autoscaling via Kubernetes.
Nov 20, 2018
The abstract:
Apache Kafka’s Streams API lets us process messages from different topics with very low latency. Messages may have different formats, schemas and may even be serialised in different ways. What happens when an undesirable message comes in the flow? When an error occurs, real-time applications can’t always wait for manual recovery and need to handle such failures.
Mar 12, 2018
The abstract (in French 🇫🇷):
Complexe et fastidieuse, la Processor API est souvent mise de côté. C’est dommage, surtout quand on apprend que les plus grandes fonctionnalités de Kafka Streams s’y cachent. Notamment les stateful operations et interactives queries. Malgré cela c’est Stream DSL, l’API haut niveau, qui a su séduire les développeurs.
Nov 30, 2017
The abstract (in French 🇫🇷):
De plus en plus d’initiatives Data Science sont rendues possibles grâce à la mise en place de DataLakes. Les modèles de Machine Learning inclus dans ces projets sont, comme toute application, sujets à évolutions. Le suivi de ces évolutions peut-il être automatisé ? Les standards de déploiement pour ces applications sont-ils toujours de rigueur ?
Apr 10, 2017
Software Engineers frequently engage themself into new learning paths. We keep learning skills related to our field such as programming languages; libraries or even how new data systems work. This idea is one of the 4 company values of @PubSapientEng, and they named it: Sharing Knowledge. Why “sharing”? Besides the idea to keep up with tech, it’s a good way to extends your skills and get new perspectives on the job you do every day.