Slides de la soirée Big Data

Big Data au FinistJUG

Comme promis, voici un petit billet de suivi avec quelques informations et les slides des présentations de la soirée Big Data de la semaine dernière.

Étant donné qu’il y avait des nombreux nouveaux dans la soirée, on compte envoyer un petit questionnaire à tous les inscrits pour avoir un retour sur quel type de sujet ils seraient intéressés pour voir dans des futures soirées. Si vous avez quelques minutes, je vous prie donc de le remplir, ça nous aidera à que des futures événements du JUG soient encore plus pertinents.

Je profite de l’occasion aussi pour vous dire que, en plus des photos postés par Mik (même si celle où je suis avec mon téléphone ne reflète pas de tout la réalité…), vous avez d’autres photos disponibles sur la page Google+ de la soirée.

Passons donc aux slides :


Présentation des speakers et du sujet, par Sébastien Lambour


Introduction à Hadoop, par David Morin


Présentation de Spark, par Ludwine Probst


Kafka et Storm au service de la lutte antiDDoS à OVH, par Steven Le Roux


Encore une fois, merci à tous d’être venus si nombreux à cette soirée Big Data. J’espère vus revoir pour notre prochaine soirée, le 25 novembre, dédiée à Groovy.

Photos soirée Big Data

Merci à tous les participants de notre soirée Big Data, et plus particulièrement à David, Ludwine et Steven. Avec un peu moins de 80 personnes, ce fut un très joli succès. Voici quelques photos :

Soirée Big Data – Mercredi 29 octobre 2014

FinistJUG

Pour ce mois d’octobre nous avons choisi de faire une soirée thématique autour du Big Data avec trois présentations introduisant trois technologies incontournables dans le paysage du Big Data d’aujourd’hui : Hadoop, Spark et Storm.


Le programme de la soirée

1 – Introduction à Hadoop

Pour notre première présentation de la soirée, David Morin va nous faire une introduction à Hadoop :

Apache Hadoop

Hadoop, Mapreduce, Yarn, Pig et tant d’autres avec surtout le fameux “Big Data” qu’il est de bon ton de placer en soirée pour faire bonne impression 🙂

Bref. Revenons au commencement : Comment et pourquoi Hadoop est né ? Quelles sont les bases techniques ? Nous ferons un tour d’horizon de Hadoop, son histoire, son intérêt et ses principes, sur le désormais célèbre map-reduce et la parallélisation massive, sur ses enjeux. On verra ensuite comment la plateforme a évolué ces dernières années, gagnant en flexibilité et possibilités.

David Morin, Solutions Engineer chez Cityzen Data

2 – Introduction à Spark

Ensuite ça sera le tour de Ludwine Probst qui nous présentera Apache Spark :

Apache Spark

Dans l’écosystème Big Data, Hadoop et MapReduce sont largement utilisés pour gérer le traitement des données à grande échelle. Cependant le modèle MapReduce montre des limites pour certains traitements, notamment des algorithmes itératifs utilisés en Machine Learning.

Spark est un outil de traitement de données en mémoire offrant plus de flexibilité de programmation et de meilleures performances qu’Hadoop.

Ce talk a pour but d’introduire Spark via un exemple de Machine Learning et de montrer en quoi il se différencie d’Hadoop. Nous terminerons par un tour d’horizon de l’écosystème de Spark.

Ludwine Probst, Data Engineer chez Cityzen Data et membre de la team Duchess France

3 – Introduction à Storm

Et pour finir la soirée, Steven Le Roux nous parlera d’Apache Storm :

Apache Storm

Apache Storm is a free and open source distributed realtime computation system. Storm makes it easy to reliably process unbounded streams of data, doing for realtime processing what Hadoop did for batch processing. Storm is simple, can be used with any programming language, and is a lot of fun to use!

Storm has many use cases: realtime analytics, online machine learning, continuous computation, distributed RPC, ETL, and more. Storm is fast: a benchmark clocked it at over a million tuples processed per second per node. It is scalable, fault-tolerant, guarantees your data will be processed, and is easy to set up and operate.

Steven Le Roux, Network Engineer chez OVH

Informations pratiques

La Cantine

La soirée se passera le mecredi 29 octobre à La Cantine Brest, dans les locaux de la Faculté des Lettres et Sciences Humaines (20 rue Duquesne, au centre ville de Brest), à partir de 18h30.

L’entrée est libre et gratuite, comme d’habitude, mais nous vous demandons de vos inscrire à l’avance pour nous aider à gérer l’aspect logistique (et l’apéro, bien entendu). Le tirage au sort de la licence IntelliJ se fera parmi les personnes inscrites, bien entendu.

Le tirage au sort ?

JetBrains

Et oui, vous le savez bien, grâce à notre partenariat avec JetBrains nous avons une licence de IntelliJ Idea à offrir pendant la soirée. IntelliJ est considéré par beaucoup de développeurs comme le meilleur éditeur Java actuel. Sa version Community est gratuite, et elle permet de voir pourquoi tant de développeurs aiment cet IDE (d’ailleurs, le nouveau éditeur Android, Android Studio est basé sur cette version Community d’IntelliJ).

Inscriptions

Les inscriptions à l’événement se font via EventBrite :

Il y a aussi un Evénement G+ sur lequel pour pouvez vous inscrire, si vous préférez ce système.

Venez nombreux, passez l’information autour de vous. Aidez-nous à que toutes les personnes potentiellement intéressées reçoivent l’information !