Soirée Big Data – Mercredi 29 octobre 2014

Pour ce mois d’octobre nous avons choisi de faire une soirée thématique autour du Big Data avec trois présentations introduisant trois technologies incontournables dans le paysage du Big Data d’aujourd’hui : Hadoop, Spark et Storm.

Le programme de la soirée

1 – Introduction à Hadoop

Pour notre première présentation de la soirée, David Morin va nous faire une introduction à Hadoop :

Apache Hadoop

Hadoop, Mapreduce, Yarn, Pig et tant d’autres avec surtout le fameux “Big Data” qu’il est de bon ton de placer en soirée pour faire bonne impression 🙂

Bref. Revenons au commencement : Comment et pourquoi Hadoop est né ? Quelles sont les bases techniques ? Nous ferons un tour d’horizon de Hadoop, son histoire, son intérêt et ses principes, sur le désormais célèbre map-reduce et la parallélisation massive, sur ses enjeux. On verra ensuite comment la plateforme a évolué ces dernières années, gagnant en flexibilité et possibilités.

David Morin, Solutions Engineer chez Cityzen Data

2 – Introduction à Spark

Ensuite ça sera le tour de Ludwine Probst qui nous présentera Apache Spark :

Dans l’écosystème Big Data, Hadoop et MapReduce sont largement utilisés pour gérer le traitement des données à grande échelle. Cependant le modèle MapReduce montre des limites pour certains traitements, notamment des algorithmes itératifs utilisés en Machine Learning.

Spark est un outil de traitement de données en mémoire offrant plus de flexibilité de programmation et de meilleures performances qu’Hadoop.

Ce talk a pour but d’introduire Spark via un exemple de Machine Learning et de montrer en quoi il se différencie d’Hadoop. Nous terminerons par un tour d’horizon de l’écosystème de Spark.

Ludwine Probst, Data Engineer chez Cityzen Data et membre de la team Duchess France

3 – Introduction à Storm

Et pour finir la soirée, Steven Le Roux nous parlera d’Apache Storm :

Apache Storm

Apache Storm is a free and open source distributed realtime computation system. Storm makes it easy to reliably process unbounded streams of data, doing for realtime processing what Hadoop did for batch processing. Storm is simple, can be used with any programming language, and is a lot of fun to use!

Storm has many use cases: realtime analytics, online machine learning, continuous computation, distributed RPC, ETL, and more. Storm is fast: a benchmark clocked it at over a million tuples processed per second per node. It is scalable, fault-tolerant, guarantees your data will be processed, and is easy to set up and operate.

Steven Le Roux, Network Engineer chez OVH

Informations pratiques

La soirée se passera le mecredi 29 octobre à La Cantine Brest, dans les locaux de la Faculté des Lettres et Sciences Humaines (20 rue Duquesne, au centre ville de Brest), à partir de 18h30.

L’entrée est libre et gratuite, comme d’habitude, mais nous vous demandons de vos inscrire à l’avance pour nous aider à gérer l’aspect logistique (et l’apéro, bien entendu). Le tirage au sort de la licence IntelliJ se fera parmi les personnes inscrites, bien entendu.

Le tirage au sort ?

Et oui, vous le savez bien, grâce à notre partenariat avec JetBrains nous avons une licence de IntelliJ Idea à offrir pendant la soirée. IntelliJ est considéré par beaucoup de développeurs comme le meilleur éditeur Java actuel. Sa version Community est gratuite, et elle permet de voir pourquoi tant de développeurs aiment cet IDE (d’ailleurs, le nouveau éditeur Android, Android Studio est basé sur cette version Community d’IntelliJ).

Inscriptions

Les inscriptions à l’événement se font via EventBrite :

Il y a aussi un Evénement G+ sur lequel pour pouvez vous inscrire, si vous préférez ce système.

Venez nombreux, passez l’information autour de vous. Aidez-nous à que toutes les personnes potentiellement intéressées reçoivent l’information !