News Search Services
Big Data et data mining – tour au zoo d’Hadoop - ToulouseJug
Share this event

(L'article sur le blog du ToulouseJug).
Programme de la soirée :

  • La vie du JUG
  • Les news du monde Java,
  • le quiz pendant lequel nous ferons gagner des goodies,

Puis, place aux speakers : François Royer et Nicolas Lalevée.

Big Data et data mining – tour au zoo d’Hadoop.

Hadoop est devenu un socle incontournable pour la fouille de données: ETL, distribution de tâches, collecte et aggrégation, on peut tout faire avec, ou presque.

Nous commencerons par présenter la technologie: l’algorithme MapReduce, son architecture, son déploiement, son utilisation via un eco-système de projets fourmillant autour.

Puis nous entrerons dans un exemple concret d’utilisation: le calcul de statistiques web ala google analytics dans Scoop.it avec Hive. Nous verrons le cas d’utilisation, l’implémentation, l’utilisation, les problématiques de déploiement, de performance.

Puis nous élargirons avec le data mining. Nous passerons en revue les différents algorithmes “MapReduce-able” et verrons pourquoi implémenter soi-même un join sous Hadoop n’est pas une très bonne idée. Des exemples en traitement du langage avec Python et Cascalog seront donnés.

---------
Le Toulouse JUG est sponsorisé par Valtech, Objet Direct et FastConnect.

Merci à eux de leur soutien.

Merci aussi à l'Epitech pour l’hébergement !

Start: 12/13/12 06:30 PM
End: 12/13/12 11:30 PM
Location:
Toulouse - Ecole Epitech

19 Rue Bayard
Toulouse

Ligne A : Métro Jean-Jaurès
Ligne B : Métro Jeanne d’Arc

Contact: Toulouse Jug CA
Speakers
Picture of Nicolas Lalevée