Databricks sur la Plateforme fédérale de données scientifiques
Azure Databricks est une plateforme d'analyse de données volumineuses basée sur le nuage. Elle offre un environnement collaboratif permettant aux scientifiques des données, aux ingénieurs des données et aux analystes commerciaux de travailler ensemble sur des projets de données volumineuses. Azure Databricks sur la Plateforme fédérale de données scientifiques (PFDS) combine la puissance d'Apache Spark avec une interface de bloc-notes collaborative, ce qui facilite la création et le déploiement de pipelines de données, de modèles d'apprentissage automatique et d'applications d'analyse.
Azure Databricks est idéal pour:
- Traiter de grands ensembles de données
- Construire des modèles d'apprentissage automatique
- Exécuter des requêtes interactives
- Collaborer sur des projets de données
La PFDS vous permet de provisionner Azure Databricks pour vos recherches, ce qui permet aux chercheurs d'analyser leurs données à grande échelle.
Apprenez à:
- Provisionner Databricks sur la PFDS: Demander, configurer et supprimer des outils dans votre espace de travail
- Commencer avec Databricks: Databricks 101
- Gérer les clusters Databricks: Politiques de cluster Databricks
- Utiliser Git ou un autre contrôle de version avec Databricks: Intégration Git de Databricks
- Utiliser Visual Studio Code avec Databricks: Extension VS Code pour Databricks
- Créer des tableaux de bord dans Databricks: Comparaison des outils de tableau de bord de Databricks
- Comparer Databricks avec d'autres outils de tableau de bord: Comparaison des outils de tableau de bord
- Utiliser les flux de travail dans Databricks: Flux de travail Databricks
- Exécuter des expériences AutoML dans Databricks: AutoML de Databricks
- Ajouter des packages Conda, PyPI ou CRAN aux clusters Databricks: Bibliothèques personnalisées de Databricks