Pentaho Data Integration FR

Transcription

Pentaho Data Integration FR
DATASHEET
Pentaho Data Integration
Big Data et autres: Capacité d’accéder à des
sources de données multiples, de les préparer et regrouper plus rapidement
Avec Pentaho, gérer la diversité et les volumes croissants
de données reçues par les entreprises devient simple. La
plate-forme complète d’intégration des données de Pentaho fournit aux utilisateurs finaux des données « adaptées
à l’analytique » 15 fois plus rapidement avec des outils
visuels qui réduisent la durée et la complexité. Au lieu de
recourir à la programmation SQL ou à l’écriture MapReduce, les entreprises peuvent immédiatement tirer profit
de leurs données, à partir de sources de données comme
Hadoop, NoSQL et des bases de données relationnelles
avec un outil de conception graphique.
Transformer les Big Data en données analytiques fonctionnelles
Pentaho permet l’accès, l’exploration et l’organisation des
données provenant de tous types de sources, notamment
• Un outil de conception intuitive par drag & drop
• Une vaste bibliothèque de composants prédéfinis
• Transformations dynamiques pour déterminer les
règles de mapping, la validation et l’enrichissement
des champs utilisant des variables
• Débogueur intégré à des fins de test et de
personalisation de l’exécution des tâches
Intégration des Big Data et traitement
des données volumineuses
Pentaho accélère le traitement et réduit la complexité
d’intégration avec les sources de Big Data. L’outil de
conception graphique intuitif de Pentaho fournit:
• Une connectivité native à Hadoop, NoSQL et aux
bases de données analytiques
• Un concepteur visuel pour les tâches MapReduce permettant de diviser par 15 le temps de développement
• Préparation, modélisation et exploration d’ensembles
de données non structurées
à Hadoop, à NoSQL et aux bases de données analytiques,
Le puissant moteur d’intégration de données de
afin de réaliser des analyses approfondies.
Pentaho fournit:
Fournir des données à un large éventail
d’applications
Les fonctions prêtes à l’emploi de standardisation,
d’enrichissement et de qualité des données de Pentaho
fournissent des informations aux Editeurs de SaaS et aux
ISV sous la forme la plus adaptées à leurs applications.
Intégrer et regrouper les Big Data avec
les données existante de l’Entreprise
Avec une large connectivité à tous et une exécution hute
performance dansHadoop, Pentaho simplifie et accélère le
processus d’intégration des bases de données existantes
aux nouvelles sources de données.
L’outil de conception graphique de Pentaho Data Integration comprend:
• Un moteur multitâches pour une exécution rapide
• Le support du mode cluster, permettant le traitement
distribué des tâches sur plusieurs nœuds
• Exécution in-Hadoop unique permettant d’atteindre
de hautes performances
Connectivité et distribution des données
Pentaho Data Integration offre une grande connectivité
avec des données très diverses, notamment les sources de
données structurées, non structurées et semi-structurées
les plus courantes. Par exemple:
• Bases de données relationnelles standard, Oracle,
DB2, MySQL, SQL Server
• Hadoop, Apache Hadoop, Cloudera, HortonWorks
et MapR
• Bases de données NoSQL, MongoDB, Cassandra
et HBase
• Bases de données analytiques, Vertica, Greenplum et
Teradata
• Sources de données spécialisées, Splunk, Amazon Redshift
Pentaho offre des fonctions de profilage des données
comme le nombre de lignes, les fonctions mathématiques
et l’identification de valeurs nulles, ainsi que des opérateurs de qualité des données comme les manipulateurs de
• Solutions applicatives d’entreprise, SAP
chaînes, les fonctions de mappage, le filtrage et le tri. Pour
• Applications cloud et SaaS, Salesforce, services Web
les fonctions de vérification du nom et de l’adresse, Pen-
Amazon
• Fichiers, XML, Excel, fichier plat et API de service Web
Pour augmenter la performance des processus d’extraction,
de chargement et de diffusion des données, Pentaho offre
les fonctions suivantes:
• Connectivité native et chargement de masse vers les
sources de données les plus courantes
• Distribution des données dans un format multidimensionnel à des fins d’analyse
• Distribution des données au moyen de services en temps
réel pour des applications tierces opérationnelles
Travail d’équipe et collaboration pour les
développeurs
Pentaho Data Integration repose sur un référentiel centralisé dans lequel l’ensemble des équipes d’un projet
d’intégration de données partagent des flux de données et
collaborent à leur développement. Pentaho fournit:
• Un référentiel partagé permettant la collaboration entre
les analystes, les développeurs et les dépositaires de données
• Gestion de contenu, gestion de versions et verrouillage
pour gérer facilement les développements et restaurer
une version antérieure
Puissante gestion et administration
Pentaho Data Integration offre des fonctionnalités prêtes à
l’emploi pour gérer les opérations d’un projet d’intégration
de données. Ces fonctionnalités comprennent:
• Gestion des droits d’accès pour utilisateurs
• Intégration dans la stratégie de sécurité LDAP et Active
Directory existante
• Définition d’autorisations afin de contrôler les actions
des utilisateurs : lecture, exécution ou création
taho s’intègre aux produits d’éditeurs de logiciels de qualité
des données de premier plan, comme Human Inference et
Melissa Data. Les fonctions de profilage des données et de
qualité des données permettent:
• Identification des données qui ne respectent pas les
règles de gestion et les normes
• Déduplication et nettoyage des données incohérentes e
t redondantes
• Validation, standardisation et correction des données
relatives au nom, à l’adresse e-mail et postale et
au téléphone
POURQUOI FAIRE CONFIANCE À
PENTAHO DATA INTEGRATION?
• Orchestration et intégration puissantes des
données Big Data: Intégration de toutes les
données (Hadoop, NoSQL et relationnelles) en
une seule plate-forme ; exécution in-Hadoop et
agglomérée du traitement des données pour
une évolutivité optimale
• Facilité d’utilisation: Configuration aisée; outil
de conception graphique intuitif; aucun code
supplémentaire généré; plus de 100 objets de
mappage prêts à l’emploi, notamment un outil
de conception visuel MapReduce pour Hadoop
• Évolutivité: Java 100 % pour le déploiement multi
plate-forme; architecture permettant l’ajout de
connecteurs, les évolutions fonctionnelleset de
nouvelles expressions de besoins utilisateurs
• Rapport qualité-prix:
Aucun frais initial;
modèle de licence
par abonnement
• Planification des flux d’intégration de données
sans frais de licence
• Contrôle et analyse de la performance des processus
développeur/
d’intégration des données
Spoon - mongo_data_merge (changed)
Perspective:
View
Design
Welcome
Data Integration
4:09 PM
pentaho
Model
Visualize
mongo_data_merge
100%
Steps
Big Data
Cassandra Input
Cassandra Output
Hadoop File Input
HBase Input
Calc Mn/Yr
Sales Data
Hadoop File Output
HBase Input
HBase Output
MapReduce Input
MapReduce Output
Add Count
Sort country/date
Group by country/date
Lookup Sales
Table output
MongoDb Input
MongoDb Output
Input
Output
Transform
utilisateur; aucun
frais de maintenance
Be social
with Pentaho:
Copyright ©2015 Pentaho Corporation. All rights reserved. Worldwide +1 (866) 660 7555.
015-127v2
pentaho.fr/contact | +1 (866) 660-7555