Databricks removes the siloed style of ML pipeline through a unified platform

Databricks brings a simplified approach for managing ML models from experimentation to production extended to CI/CD

Request Demo

Implement a simple ML Pipeline with Apache Spark MLLib / Databricks

An ML pipeline’s efficiency is best when it’s in a unified environment

Intro to MLLib

Built on top of Spark, Databricks MLlib provides common machine learning algorithms and evaluation metrics (APIs). Spark MLLib is integrated in Databricks runtime and this library is programmable in Java, Scala, and Python languages.

Pipeline

A Pipeline is a sequence of stages , with a Transformer or an Estimator present at each stage. These stages are run as sequence for transforming the input DataFrame

DataFrame

This ML API fetches DataFrame from Spark SQL as an ML dataset, which may contain different types of values like text, feature vectors, labels, and predictions.

Transformer

A Transformer is defined as an algorithm that transforms a features-based DataFrame into a predictions-based DataFrame.

Estimator

An Estimator is a learning algorithm that trains on a DataFrame to produce a ML model.

ML Monitoring metrics for Databricks-MLLib

List of Metrics for different Classification and Regression Models

Binary Classification Metrics

Precision (Positive Predictive Value), Recall (True Positive Rate), F-measure, Receiver Operating Characteristic (ROC), Area Under ROC Curve, Area Under Precision-Recall Curve.

Multi-class Classification Metrics

Confusion Matrix, Accuracy, Weighted precision, Weighted recall, Weighted F-measure

Multi-label Classification Metrics

Precision, Recall, Accuracy, Precision by label, Recall by label, F1-measure by label, Hamming Loss, Subset Accuracy, F1 Measure, Micro Precision, Micro recall, Micro F1 measure.

Ranking Systems Metrics

Precision at k, Mean Average Precision, Normalized Discounted Cumulative Gain.

Regression Model Metrics

Mean Squared Error (MSE), Root Mean Squared Error (RMSE), Mean Absolute Error (MAE), Coefficient of Determination, Explained Variance.

The widespread adoption of Spark in ML based applications has made Databricks a preferred environment for ML monitoring

Qualdo™ ensures to give as many analysis and visualizations as possible formonitoring ML performance

Please feel free to schedule a demo for understanding how Qualdo does ML model monitoring rapidly

Qualdo-DRX Data Quality Edition

Free-trial

available

Data Quality Metrics
Data Profiling
Data Anomalies
Data Drifts
All KQIs
Quality Gates
Advanced Visualizations
APIs

Request a Demo

Qualdo-MQX Model Monitoring Edition

Free-trial

available

Bulk Add Models to Qualdo
Data Drifts
Feature & Response Decays
Data Quality Metrics
Data Anomalies
Model Failure Metrics
Alerts & Notifications
Advanced Visualizations
APIs

Start Now

Enterprise Edition

Email Us

Installation in your Infrastructure
All Data Quality Metrics
All ML Monitoring Metrics
Custom DB Integrations
Custom ML Integrations
Custom Notifications
Custom Visualizations
APIs

Request a Demo

Qualdo™ & MLlib : The open-source framework from Databricks with rich capabilities for continuous model monitoring

Qualdo™ leverages on the speed of Databricks Spark’s distributed computation and by having it super-optimized
for cloud through Azure and AWS Sagemaker. Qualdo easily plugs into Databricks-MLlib
to monitor model metrics on Databricks.

Databricks removes the siloed style of ML pipeline through a unified platform

Implement a simple ML Pipeline with Apache Spark MLLib / Databricks

Intro to MLLib

Pipeline

DataFrame

Transformer

Estimator

ML Monitoring metrics for Databricks-MLLib

Binary Classification Metrics

Multi-class Classification Metrics

Multi-label Classification Metrics

Ranking Systems Metrics

Regression Model Metrics

The widespread adoption of Spark in ML based applications has made Databricks a preferred environment for ML monitoring

Qualdo™ ensures to give as many analysis and visualizations as possible formonitoring ML performance

available

available

Qualdo™ & MLlib : The open-source framework from Databricks with rich capabilities for continuous model monitoring

Sign-up for a 14-day free-trial today!

Request Submitted

Qualdo-DRX: Data Reliability

Qualdo-MQX: Model Monitoring

Data Reliability on Azure

Data Quality on Google Cloud

Data Observability on AWS

Databricks removes the siloed style of ML pipeline through a unified platform

Implement a simple ML Pipeline with Apache Spark MLLib / Databricks

Intro to MLLib

Pipeline

DataFrame

Transformer

Estimator

ML Monitoring metrics for Databricks-MLLib

Binary Classification Metrics

Multi-class Classification Metrics

Multi-label Classification Metrics

Ranking Systems Metrics

Regression Model Metrics

The widespread adoption of Spark in ML based applications has made Databricks a preferred environment for ML monitoring

Qualdo™ ensures to give as many analysis and visualizations as possible formonitoring ML performance

available

available

Qualdo™ & MLlib : The open-source framework from Databricks with rich capabilities for continuous model monitoring

Sign-up for a 14-day free-trial today!

Request Submitted