`ITMO_FS.filters.multivariate`.generalizedCriteria¶

ITMO_FS.filters.multivariate.generalizedCriteria(selected_features, free_features, X, y, beta, gamma)¶

This feature scoring criteria is a linear combination of all relevance, redundancy, conditional dependency Given set of already selected features and set of remaining features on dataset X with labels y selects next feature.

Parameters:

selected_features (list of ints,) – already selected features
free_features (list of ints) – free features
X (array-like, shape (n_samples, n_features)) – The training input samples.
y (array-like, shape (n_samples, )) – The target values.
beta (float,) – coeficient for redundancy term
gamma (float,) – coeficient for conditional dependancy term

Notes

See the original paper [1] for more details.

References

[1]	Brown, Gavin et al. “Conditional Likelihood Maximisation: A Unifying Framework for Information

Theoretic Feature Selection.” JMLR 2012.

Examples

>>> from ITMO_FS.filters.multivariate import CFR
>>> from sklearn.preprocessing import KBinsDiscretizer
>>> import numpy as np
>>> est = KBinsDiscretizer(n_bins=10, encode='ordinal')
>>> X = np.array([[1, 2, 3, 3, 1],[2, 2, 3, 3, 2], [1, 3, 3, 1, 3],[3, 1, 3, 1, 4],[4, 4, 3, 1, 5]], dtype = np.integer)
>>> y = np.array([1, 2, 3, 4, 5], dtype=np.integer)
>>> est.fit(X)
KBinsDiscretizer(encode='ordinal', n_bins=10)
>>> X = est.transform(X)
>>> selected_features = [1, 2]
>>> other_features = [i for i in range(0, X.shape[1]) if i not in selected_features]
>>> generalizedCriteria(np.array(selected_features), np.array(other_features), X, y, 0.4, 0.3)
array([0.91021097, 0.403807  , 1.0765663 ])

ITMO_FS.filters.multivariate.generalizedCriteria¶

`ITMO_FS.filters.multivariate`.generalizedCriteria¶