Pentaho Data Integration FR
Transcription
Pentaho Data Integration FR
DATASHEET Pentaho Data Integration Big Data et autres: Capacité d’accéder à des sources de données multiples, de les préparer et regrouper plus rapidement Avec Pentaho, gérer la diversité et les volumes croissants de données reçues par les entreprises devient simple. La plate-forme complète d’intégration des données de Pentaho fournit aux utilisateurs finaux des données « adaptées à l’analytique » 15 fois plus rapidement avec des outils visuels qui réduisent la durée et la complexité. Au lieu de recourir à la programmation SQL ou à l’écriture MapReduce, les entreprises peuvent immédiatement tirer profit de leurs données, à partir de sources de données comme Hadoop, NoSQL et des bases de données relationnelles avec un outil de conception graphique. Transformer les Big Data en données analytiques fonctionnelles Pentaho permet l’accès, l’exploration et l’organisation des données provenant de tous types de sources, notamment • Un outil de conception intuitive par drag & drop • Une vaste bibliothèque de composants prédéfinis • Transformations dynamiques pour déterminer les règles de mapping, la validation et l’enrichissement des champs utilisant des variables • Débogueur intégré à des fins de test et de personalisation de l’exécution des tâches Intégration des Big Data et traitement des données volumineuses Pentaho accélère le traitement et réduit la complexité d’intégration avec les sources de Big Data. L’outil de conception graphique intuitif de Pentaho fournit: • Une connectivité native à Hadoop, NoSQL et aux bases de données analytiques • Un concepteur visuel pour les tâches MapReduce permettant de diviser par 15 le temps de développement • Préparation, modélisation et exploration d’ensembles de données non structurées à Hadoop, à NoSQL et aux bases de données analytiques, Le puissant moteur d’intégration de données de afin de réaliser des analyses approfondies. Pentaho fournit: Fournir des données à un large éventail d’applications Les fonctions prêtes à l’emploi de standardisation, d’enrichissement et de qualité des données de Pentaho fournissent des informations aux Editeurs de SaaS et aux ISV sous la forme la plus adaptées à leurs applications. Intégrer et regrouper les Big Data avec les données existante de l’Entreprise Avec une large connectivité à tous et une exécution hute performance dansHadoop, Pentaho simplifie et accélère le processus d’intégration des bases de données existantes aux nouvelles sources de données. L’outil de conception graphique de Pentaho Data Integration comprend: • Un moteur multitâches pour une exécution rapide • Le support du mode cluster, permettant le traitement distribué des tâches sur plusieurs nœuds • Exécution in-Hadoop unique permettant d’atteindre de hautes performances Connectivité et distribution des données Pentaho Data Integration offre une grande connectivité avec des données très diverses, notamment les sources de données structurées, non structurées et semi-structurées les plus courantes. Par exemple: • Bases de données relationnelles standard, Oracle, DB2, MySQL, SQL Server • Hadoop, Apache Hadoop, Cloudera, HortonWorks et MapR • Bases de données NoSQL, MongoDB, Cassandra et HBase • Bases de données analytiques, Vertica, Greenplum et Teradata • Sources de données spécialisées, Splunk, Amazon Redshift Pentaho offre des fonctions de profilage des données comme le nombre de lignes, les fonctions mathématiques et l’identification de valeurs nulles, ainsi que des opérateurs de qualité des données comme les manipulateurs de • Solutions applicatives d’entreprise, SAP chaînes, les fonctions de mappage, le filtrage et le tri. Pour • Applications cloud et SaaS, Salesforce, services Web les fonctions de vérification du nom et de l’adresse, Pen- Amazon • Fichiers, XML, Excel, fichier plat et API de service Web Pour augmenter la performance des processus d’extraction, de chargement et de diffusion des données, Pentaho offre les fonctions suivantes: • Connectivité native et chargement de masse vers les sources de données les plus courantes • Distribution des données dans un format multidimensionnel à des fins d’analyse • Distribution des données au moyen de services en temps réel pour des applications tierces opérationnelles Travail d’équipe et collaboration pour les développeurs Pentaho Data Integration repose sur un référentiel centralisé dans lequel l’ensemble des équipes d’un projet d’intégration de données partagent des flux de données et collaborent à leur développement. Pentaho fournit: • Un référentiel partagé permettant la collaboration entre les analystes, les développeurs et les dépositaires de données • Gestion de contenu, gestion de versions et verrouillage pour gérer facilement les développements et restaurer une version antérieure Puissante gestion et administration Pentaho Data Integration offre des fonctionnalités prêtes à l’emploi pour gérer les opérations d’un projet d’intégration de données. Ces fonctionnalités comprennent: • Gestion des droits d’accès pour utilisateurs • Intégration dans la stratégie de sécurité LDAP et Active Directory existante • Définition d’autorisations afin de contrôler les actions des utilisateurs : lecture, exécution ou création taho s’intègre aux produits d’éditeurs de logiciels de qualité des données de premier plan, comme Human Inference et Melissa Data. Les fonctions de profilage des données et de qualité des données permettent: • Identification des données qui ne respectent pas les règles de gestion et les normes • Déduplication et nettoyage des données incohérentes e t redondantes • Validation, standardisation et correction des données relatives au nom, à l’adresse e-mail et postale et au téléphone POURQUOI FAIRE CONFIANCE À PENTAHO DATA INTEGRATION? • Orchestration et intégration puissantes des données Big Data: Intégration de toutes les données (Hadoop, NoSQL et relationnelles) en une seule plate-forme ; exécution in-Hadoop et agglomérée du traitement des données pour une évolutivité optimale • Facilité d’utilisation: Configuration aisée; outil de conception graphique intuitif; aucun code supplémentaire généré; plus de 100 objets de mappage prêts à l’emploi, notamment un outil de conception visuel MapReduce pour Hadoop • Évolutivité: Java 100 % pour le déploiement multi plate-forme; architecture permettant l’ajout de connecteurs, les évolutions fonctionnelleset de nouvelles expressions de besoins utilisateurs • Rapport qualité-prix: Aucun frais initial; modèle de licence par abonnement • Planification des flux d’intégration de données sans frais de licence • Contrôle et analyse de la performance des processus développeur/ d’intégration des données Spoon - mongo_data_merge (changed) Perspective: View Design Welcome Data Integration 4:09 PM pentaho Model Visualize mongo_data_merge 100% Steps Big Data Cassandra Input Cassandra Output Hadoop File Input HBase Input Calc Mn/Yr Sales Data Hadoop File Output HBase Input HBase Output MapReduce Input MapReduce Output Add Count Sort country/date Group by country/date Lookup Sales Table output MongoDb Input MongoDb Output Input Output Transform utilisateur; aucun frais de maintenance Be social with Pentaho: Copyright ©2015 Pentaho Corporation. All rights reserved. Worldwide +1 (866) 660 7555. 015-127v2 pentaho.fr/contact | +1 (866) 660-7555