TP Business Intelligence PDF [PDF]

  • 0 0 0
  • Gefällt Ihnen dieses papier und der download? Sie können Ihre eigene PDF-Datei in wenigen Minuten kostenlos online veröffentlichen! Anmelden
Datei wird geladen, bitte warten...
Zitiervorschau

TP Business Intelligence

2ème GLSI Année Universitaire 2013/2014

Université El Manar De Tunis Institut Supérieur d’Informatique

Module : Business Intelligence Support de TP N°1

Documents Fournis : -

Documentation sur les composants du Talend, Une Démonstration

Exemple 1 : Créer un Job pour le tri des données. Le but est de créer un processus permettant : -

de lire les données à partir d'un fichier délimité, d’écrire dans un fichier temporaire, de remplacer le fichier source avec le fichier temp.

Exemple 2 : Configurez le composant tMap pour transformer des données -

utiliser un fichier customer.csv avec les informations client faire une jointure avec un fichier répertoriant tous états de l’États-Unis utiliser le composant tMap pour faire la jointure.

Exemple 3 : Talend Open Studio pour l'intégration de données -

Apprendre les caractéristiques tMap en joignant un fichier d'entrée et une table de base de données. Faire des transformations sur les colonnes. Transformer les données pour créer une table de base de données.

2ème GLSI Année Universitaire 2013/2014

Université El Manar De Tunis Institut Supérieur d’Informatique

Module : Business Intelligence Support de TP N°2

BUT : Alimenter un cube Palo avec Talend Open Studio 0. L'installation du composant PALO L'installation du composant PALO au sein de Talend Open Studio consiste à déplacer les DLL situées dans \plugins\org.talend.designer.components.localprovider_xxx\components\t PaloOutput \paloIX.dll ; C:\programFiles\Jdox\ : libpalo2.dll et libpalo_ng.dll ; dans votre répertoire Windows/system32 ou bien à la racine de votre TOS_Install_Dir. 1. Création d'une base de données et d'un cube avec 2 dimensions. Nom de la base de données: n2 Nom du Cube: comp Les 2 Dimensions: Lastname, State

2. Création du processus d’extraction-transformation-chargement (ETL) -

Utiliser un fichier client au format CSV (customers.csv) comme entrée. Filtrer tout d'abord les colonnes à l'aide du tFilterColumn pour ne retenir que les Lastname, Revenue et State.

-

Regrouper les clients par état (State) et nom (LastName) pour effectuer une somme sur les revenus par client et par état, via le composant tAgregateRow.

3. Chargement des données dans le cub Palo Le composant tPaloOutput permet de réaliser l'intégration des données au sein de Palo. Prenez soin de bien sélectionner la mesure (Revenue) et que l'ordre des colonnes dans le schéma talend corresponde à l'ordre des colonnes dans le cube. Une case à cocher "Create Element if not exist" (non cochée dans cet exemple) permet de réaliser un pré-traitement avant l'intégration des données.

4. Exécution

Lancer le job et visualiser à l'aide d'Excel que les données sont correctement écrites et accessibles au sein du cube.