Quels que soient les sujets data en cours dans votre organisation, il est prudent d’admettre que, globalement, la data est de plus en plus distribuée, complexe et en constante évolution. Les silos de données continuent d’exister, malgré notre quête perpétuelle d’obtenir une seule et unique source de stockage « single source of truth ». Les Data Lakes et Data Warehouses d’ancienne génération, tels qu’Hadoop et Teradata, ont tenté de relever ce défi en imposant la migration de l’ensemble des données au sein de leurs systèmes. Mais ces concepts ont rendus complexe la mission des Data Analysts de lancer des requêtes interactives sur de si vastes ensembles de données et d’obtenir des résultats pertinents à chaque fois.
La solution Trino, auparavant PrestoSQL, a vu le jour en 2012 chez Facebook pour apporter une réponse à ces problématiques. Elle a permis à Facebook d’analyser son Data Lake Hive/Hadoop de plusieurs pétaoctets sans avoir à migrer inutilement ses données au prix fort. Mais le déploiement à grande échelle de Trino, à l’instar d’autres produits open source, nécessite des ressources et un support technique continu.
C’est la raison pour laquelle les développeurs de Trino ont fondé Starburst, afin d’aider les entreprises à tirer pleinement parti de leurs investissements sur Trino. Starburst met à disposition une plateforme d’analyse des Data Lakes intégrant des fonctionnalités complètes et s’appuyant sur le moteur open source Trino. Grâce à Starburst, vos équipes peuvent accéder à l’ensemble de leurs données, avec des coûts d’infrastructures moindres puisqu’elles peuvent continuer à utiliser les outils adaptés à leurs besoins spécifiques, tout en s’affranchissent de toute sur dépendance vis-à-vis d’un fournisseur de stockage unique.
Dans ce guide, découvrez :