`from cluster_experiments.inference.analysis_plan import *`¶

`AnalysisPlan` ¶

A class used to represent an Analysis Plan with a list of hypothesis tests and a list of variants. All the hypothesis tests in the same analysis plan will be analysed with the same dataframe, which will need to be passed in the analyze() method.

Attributes¶

tests : List[HypothesisTest] A list of HypothesisTest instances variants : List[Variant] A list of Variant instances variant_col : str name of the column with the experiment groups alpha : float significance level used to construct confidence intervals

Source code in cluster_experiments/inference/analysis_plan.py

class AnalysisPlan:
    """
    A class used to represent an Analysis Plan with a list of hypothesis tests and a list of variants.
    All the hypothesis tests in the same analysis plan will be analysed with the same dataframe, which will need to be passed in the analyze() method.

    Attributes
    ----------
    tests : List[HypothesisTest]
        A list of HypothesisTest instances
    variants : List[Variant]
        A list of Variant instances
    variant_col : str
        name of the column with the experiment groups
    alpha : float
        significance level used to construct confidence intervals
    """

    def __init__(
        self,
        tests: List[HypothesisTest],
        variants: List[Variant],
        variant_col: str = "treatment",
        alpha: float = 0.05,
    ):
        """
        Parameters
        ----------
        tests : List[HypothesisTest]
            A list of HypothesisTest instances
        variants : List[Variant]
            A list of Variant instances
        variant_col : str
            The name of the column containing the variant names.
        alpha : float
            significance level used to construct confidence intervals
        """

        self.tests = tests
        self.variants = variants
        self.variant_col = variant_col
        self.alpha = alpha

        self._validate_inputs()

    def _validate_inputs(self):
        """
        Validates the inputs for the AnalysisPlan class.

        Raises
        ------
        TypeError
            If tests is not a list of HypothesisTest instances or if variants is not a list of Variant instances.
        ValueError
            If tests or variants are empty lists.
        """
        if not isinstance(self.tests, list) or not all(
            isinstance(test, HypothesisTest) for test in self.tests
        ):
            raise TypeError("Tests must be a list of HypothesisTest instances")
        if not isinstance(self.variants, list) or not all(
            isinstance(variant, Variant) for variant in self.variants
        ):
            raise TypeError("Variants must be a list of Variant instances")
        if not isinstance(self.variant_col, str):
            raise TypeError("Variant_col must be a string")
        if not self.tests:
            raise ValueError("Tests list cannot be empty")
        if not self.variants:
            raise ValueError("Variants list cannot be empty")

    def analyze(
        self,
        exp_data: pd.DataFrame,
        pre_exp_data: Optional[pd.DataFrame] = None,
        verbose: bool = False,
    ) -> AnalysisPlanResults:
        """
        Method to run the experiment analysis.
        """

        # Validate input data at the beginning
        self._validate_data(exp_data, pre_exp_data)

        analysis_results = AnalysisPlanResults()

        for test in self.tests:
            exp_data = test.add_covariates(exp_data, pre_exp_data)

            for treatment_variant in self.treatment_variants:
                for dimension in test.dimensions:
                    for dimension_value in dimension.iterate_dimension_values():

                        if verbose:
                            logger.info(
                                f"Metric: {test.metric.alias}, "
                                f"Treatment: {treatment_variant.name}, "
                                f"Dimension: {dimension.name}, "
                                f"Value: {dimension_value}"
                            )

                        test_results = test.get_test_results(
                            exp_data=exp_data,
                            control_variant=self.control_variant,
                            treatment_variant=treatment_variant,
                            variant_col=self.variant_col,
                            dimension=dimension,
                            dimension_value=dimension_value,
                            alpha=self.alpha,
                        )

                        analysis_results = analysis_results + test_results

        return analysis_results

    def _validate_data(
        self, exp_data: pd.DataFrame, pre_exp_data: Optional[pd.DataFrame] = None
    ):
        """
        Validates the input dataframes for the analyze method.

        Parameters
        ----------
        exp_data : pd.DataFrame
            The experimental data
        pre_exp_data : Optional[pd.DataFrame]
            The pre-experimental data (optional)

        Raises
        ------
        ValueError
            If exp_data is not a DataFrame or is empty
            If pre_exp_data is provided and is not a DataFrame or is empty
        """
        if not isinstance(exp_data, pd.DataFrame):
            raise ValueError("exp_data must be a pandas DataFrame")
        if exp_data.empty:
            raise ValueError("exp_data cannot be empty")
        if pre_exp_data is not None:
            if not isinstance(pre_exp_data, pd.DataFrame):
                raise ValueError("pre_exp_data must be a pandas DataFrame if provided")
            if pre_exp_data.empty:
                raise ValueError("pre_exp_data cannot be empty if provided")

    @property
    def control_variant(self) -> Variant:
        """
        Returns the control variant from the list of variants. Raises an error if no control variant is found.

        Returns
        -------
        Variant
            The control variant

        Raises
        ------
        ValueError
            If no control variant is found
        """
        for variant in self.variants:
            if variant.is_control:
                return variant
        raise ValueError("No control variant found")

    @property
    def treatment_variants(self) -> List[Variant]:
        """
        Returns the treatment variants from the list of variants. Raises an error if no treatment variants are found.

        Returns
        -------
        List[Variant]
            A list of treatment variants

        Raises
        ------
        ValueError
            If no treatment variants are found
        """
        treatments = [variant for variant in self.variants if not variant.is_control]
        if not treatments:
            raise ValueError("No treatment variants found")
        return treatments

    @classmethod
    def from_metrics(
        cls,
        metrics: List[Metric],
        variants: List[Variant],
        variant_col: str = "treatment",
        alpha: float = 0.05,
        dimensions: Optional[List[Dimension]] = None,
        analysis_type: str = "default",
        analysis_config: Optional[Dict[str, Any]] = None,
        custom_analysis_type_mapper: Optional[Dict[str, ExperimentAnalysis]] = None,
    ) -> "AnalysisPlan":
        """
        Creates a simplified AnalysisPlan instance from a list of metrics. It will create HypothesisTest objects under the hood.
        This shortcut does not support cupac, and uses the same dimensions, analysis type and analysis config for all metrics.

        Parameters
        ----------
        metrics : List[Metric]
            A list of Metric instances
        variants : List[Variant]
            A list of Variant instances
        variant_col : str
            The name of the column containing the variant names.
        alpha : float
            Significance level used to construct confidence intervals
        dimensions : Optional[List[Dimension]]
            A list of Dimension instances (optional)
        analysis_type : str
            The type of analysis to be conducted (default: "default")
        analysis_config : Optional[Dict[str, Any]]
            A dictionary containing analysis configuration options (optional)
        custom_analysis_type_mapper : Optional[Dict[str, ExperimentAnalysis]]
            An optional dictionary mapping the names of custom analysis types to the corresponding ExperimentAnalysis classes

        Returns
        -------
        AnalysisPlan
            An instance of AnalysisPlan
        """
        tests = [
            HypothesisTest(
                metric=metric,
                dimensions=dimensions or [],
                analysis_type=analysis_type,
                analysis_config=analysis_config or {},
                custom_analysis_type_mapper=custom_analysis_type_mapper or {},
            )
            for metric in metrics
        ]

        return cls(
            tests=tests,
            variants=variants,
            variant_col=variant_col,
            alpha=alpha,
        )

    @classmethod
    def from_metrics_config(cls, config: AnalysisPlanConfig) -> "AnalysisPlan":
        """
        Creates an AnalysisPlan instance from a configuration object.

        Parameters
        ----------
        config : AnalysisPlanConfig
            An instance of AnalysisPlanConfig

        Returns
        -------
        AnalysisPlan
            An instance of AnalysisPlan
        """
        metrics = [
            Metric.from_metrics_config(metric_config)
            for metric_config in config.metrics
        ]
        variants = [
            Variant.from_metrics_config(variant_config)
            for variant_config in config.variants
        ]
        dimensions = [
            Dimension.from_metrics_config(dimension_config)
            for dimension_config in config.dimensions
        ]
        return cls.from_metrics(
            metrics=metrics,
            variants=variants,
            variant_col=config.variant_col,
            alpha=config.alpha,
            dimensions=dimensions,
            analysis_type=config.analysis_type,
            analysis_config=config.analysis_config,
            custom_analysis_type_mapper=config.custom_analysis_type_mapper,
        )

    @classmethod
    def from_metrics_dict(cls, d: Dict[str, Any]) -> "AnalysisPlan":
        """
        Creates an AnalysisPlan instance from a dictionary.

        Parameters
        ----------
        d : Dict[str, Any]
            A dictionary containing the analysis plan configuration

        Returns
        -------
        AnalysisPlan
            An instance of AnalysisPlan
        """
        config = AnalysisPlanConfig(**d)
        return cls.from_metrics_config(config)

`control_variant: Variant` `property` ¶

Returns the control variant from the list of variants. Raises an error if no control variant is found.

Returns¶

Variant The control variant

Raises¶

ValueError If no control variant is found

`treatment_variants: List[Variant]` `property` ¶

Returns the treatment variants from the list of variants. Raises an error if no treatment variants are found.

Returns¶

List[Variant] A list of treatment variants

Raises¶

ValueError If no treatment variants are found

`init(tests, variants, variant_col='treatment', alpha=0.05)` ¶

Parameters¶

tests : List[HypothesisTest] A list of HypothesisTest instances variants : List[Variant] A list of Variant instances variant_col : str The name of the column containing the variant names. alpha : float significance level used to construct confidence intervals

Source code in cluster_experiments/inference/analysis_plan.py

def __init__(
    self,
    tests: List[HypothesisTest],
    variants: List[Variant],
    variant_col: str = "treatment",
    alpha: float = 0.05,
):
    """
    Parameters
    ----------
    tests : List[HypothesisTest]
        A list of HypothesisTest instances
    variants : List[Variant]
        A list of Variant instances
    variant_col : str
        The name of the column containing the variant names.
    alpha : float
        significance level used to construct confidence intervals
    """

    self.tests = tests
    self.variants = variants
    self.variant_col = variant_col
    self.alpha = alpha

    self._validate_inputs()

`analyze(exp_data, pre_exp_data=None, verbose=False)` ¶

Method to run the experiment analysis.

Source code in cluster_experiments/inference/analysis_plan.py

def analyze(
    self,
    exp_data: pd.DataFrame,
    pre_exp_data: Optional[pd.DataFrame] = None,
    verbose: bool = False,
) -> AnalysisPlanResults:
    """
    Method to run the experiment analysis.
    """

    # Validate input data at the beginning
    self._validate_data(exp_data, pre_exp_data)

    analysis_results = AnalysisPlanResults()

    for test in self.tests:
        exp_data = test.add_covariates(exp_data, pre_exp_data)

        for treatment_variant in self.treatment_variants:
            for dimension in test.dimensions:
                for dimension_value in dimension.iterate_dimension_values():

                    if verbose:
                        logger.info(
                            f"Metric: {test.metric.alias}, "
                            f"Treatment: {treatment_variant.name}, "
                            f"Dimension: {dimension.name}, "
                            f"Value: {dimension_value}"
                        )

                    test_results = test.get_test_results(
                        exp_data=exp_data,
                        control_variant=self.control_variant,
                        treatment_variant=treatment_variant,
                        variant_col=self.variant_col,
                        dimension=dimension,
                        dimension_value=dimension_value,
                        alpha=self.alpha,
                    )

                    analysis_results = analysis_results + test_results

    return analysis_results

`from_metrics(metrics, variants, variant_col='treatment', alpha=0.05, dimensions=None, analysis_type='default', analysis_config=None, custom_analysis_type_mapper=None)` `classmethod` ¶

Creates a simplified AnalysisPlan instance from a list of metrics. It will create HypothesisTest objects under the hood. This shortcut does not support cupac, and uses the same dimensions, analysis type and analysis config for all metrics.

Parameters¶

metrics : List[Metric] A list of Metric instances variants : List[Variant] A list of Variant instances variant_col : str The name of the column containing the variant names. alpha : float Significance level used to construct confidence intervals dimensions : Optional[List[Dimension]] A list of Dimension instances (optional) analysis_type : str The type of analysis to be conducted (default: "default") analysis_config : Optional[Dict[str, Any]] A dictionary containing analysis configuration options (optional) custom_analysis_type_mapper : Optional[Dict[str, ExperimentAnalysis]] An optional dictionary mapping the names of custom analysis types to the corresponding ExperimentAnalysis classes

Returns¶

AnalysisPlan An instance of AnalysisPlan

Source code in cluster_experiments/inference/analysis_plan.py

@classmethod
def from_metrics(
    cls,
    metrics: List[Metric],
    variants: List[Variant],
    variant_col: str = "treatment",
    alpha: float = 0.05,
    dimensions: Optional[List[Dimension]] = None,
    analysis_type: str = "default",
    analysis_config: Optional[Dict[str, Any]] = None,
    custom_analysis_type_mapper: Optional[Dict[str, ExperimentAnalysis]] = None,
) -> "AnalysisPlan":
    """
    Creates a simplified AnalysisPlan instance from a list of metrics. It will create HypothesisTest objects under the hood.
    This shortcut does not support cupac, and uses the same dimensions, analysis type and analysis config for all metrics.

    Parameters
    ----------
    metrics : List[Metric]
        A list of Metric instances
    variants : List[Variant]
        A list of Variant instances
    variant_col : str
        The name of the column containing the variant names.
    alpha : float
        Significance level used to construct confidence intervals
    dimensions : Optional[List[Dimension]]
        A list of Dimension instances (optional)
    analysis_type : str
        The type of analysis to be conducted (default: "default")
    analysis_config : Optional[Dict[str, Any]]
        A dictionary containing analysis configuration options (optional)
    custom_analysis_type_mapper : Optional[Dict[str, ExperimentAnalysis]]
        An optional dictionary mapping the names of custom analysis types to the corresponding ExperimentAnalysis classes

    Returns
    -------
    AnalysisPlan
        An instance of AnalysisPlan
    """
    tests = [
        HypothesisTest(
            metric=metric,
            dimensions=dimensions or [],
            analysis_type=analysis_type,
            analysis_config=analysis_config or {},
            custom_analysis_type_mapper=custom_analysis_type_mapper or {},
        )
        for metric in metrics
    ]

    return cls(
        tests=tests,
        variants=variants,
        variant_col=variant_col,
        alpha=alpha,
    )

`from_metrics_config(config)` `classmethod` ¶

Creates an AnalysisPlan instance from a configuration object.

Parameters¶

config : AnalysisPlanConfig An instance of AnalysisPlanConfig

Returns¶

AnalysisPlan An instance of AnalysisPlan

Source code in cluster_experiments/inference/analysis_plan.py

@classmethod
def from_metrics_config(cls, config: AnalysisPlanConfig) -> "AnalysisPlan":
    """
    Creates an AnalysisPlan instance from a configuration object.

    Parameters
    ----------
    config : AnalysisPlanConfig
        An instance of AnalysisPlanConfig

    Returns
    -------
    AnalysisPlan
        An instance of AnalysisPlan
    """
    metrics = [
        Metric.from_metrics_config(metric_config)
        for metric_config in config.metrics
    ]
    variants = [
        Variant.from_metrics_config(variant_config)
        for variant_config in config.variants
    ]
    dimensions = [
        Dimension.from_metrics_config(dimension_config)
        for dimension_config in config.dimensions
    ]
    return cls.from_metrics(
        metrics=metrics,
        variants=variants,
        variant_col=config.variant_col,
        alpha=config.alpha,
        dimensions=dimensions,
        analysis_type=config.analysis_type,
        analysis_config=config.analysis_config,
        custom_analysis_type_mapper=config.custom_analysis_type_mapper,
    )

`from_metrics_dict(d)` `classmethod` ¶

Creates an AnalysisPlan instance from a dictionary.

Parameters¶

d : Dict[str, Any] A dictionary containing the analysis plan configuration

Returns¶

AnalysisPlan An instance of AnalysisPlan

Source code in cluster_experiments/inference/analysis_plan.py

@classmethod
def from_metrics_dict(cls, d: Dict[str, Any]) -> "AnalysisPlan":
    """
    Creates an AnalysisPlan instance from a dictionary.

    Parameters
    ----------
    d : Dict[str, Any]
        A dictionary containing the analysis plan configuration

    Returns
    -------
    AnalysisPlan
        An instance of AnalysisPlan
    """
    config = AnalysisPlanConfig(**d)
    return cls.from_metrics_config(config)

from cluster_experiments.inference.analysis_plan import *¶

AnalysisPlan ¶

Attributes¶

control_variant: Variant property ¶

Returns¶

Raises¶

treatment_variants: List[Variant] property ¶

Returns¶

Raises¶

__init__(tests, variants, variant_col='treatment', alpha=0.05) ¶

Parameters¶

analyze(exp_data, pre_exp_data=None, verbose=False) ¶

from_metrics(metrics, variants, variant_col='treatment', alpha=0.05, dimensions=None, analysis_type='default', analysis_config=None, custom_analysis_type_mapper=None) classmethod ¶

Parameters¶

Returns¶

from_metrics_config(config) classmethod ¶

Parameters¶

Returns¶

from_metrics_dict(d) classmethod ¶

Parameters¶

Returns¶

`from cluster_experiments.inference.analysis_plan import *`¶

`AnalysisPlan` ¶

`control_variant: Variant` `property` ¶

`treatment_variants: List[Variant]` `property` ¶

`init(tests, variants, variant_col='treatment', alpha=0.05)` ¶

`analyze(exp_data, pre_exp_data=None, verbose=False)` ¶

`from_metrics(metrics, variants, variant_col='treatment', alpha=0.05, dimensions=None, analysis_type='default', analysis_config=None, custom_analysis_type_mapper=None)` `classmethod` ¶

`from_metrics_config(config)` `classmethod` ¶

`from_metrics_dict(d)` `classmethod` ¶