Scikit-learn (muchas veces reverenciada como sklearn) es posiblemente la librería de Aprendizaje Automático más popular actualmente en Python. Lo que se debe a la cantidad de modelos que implementa y su sencillez. En la mayoría de los objetos de esta librería se encuentran implementados los métodos fit()
, predict()
y fit_predict()
usados para entrenar y realizar predicciones con los modelos.
Para que se utiliza fit()
, predict()
y fit_predict()
En las clases de Scikit-learn los métodos fit()
, predict()
y fit_predict()
se emplean para lo siguiente:
fit()
: Este método se utiliza para entrenar los modelos con los datos de entrenamiento. Es decir, se utiliza para obtener los parámetros del modelo con los que se minimiza el error de predicción en los datos de entrenamiento. Debido a que se emplea para entrenar el modelofit()
se suele usar sobre los datos de entrenamiento.predict()
: Este método se utiliza para realizar obtener las predicciones de un modelo sobre un conjunto de datos de entrada desconocidos. Es decir, una vez entrenado el modelo, se puede utilizar el métodopredict()
saber los valores o etiquetas que asigna el modelo a una conjunto de datos. Dada la finalidad de este método, suele usarse con los datos de test o cualquier conjunto desconocido.fit_predict()
: Este método se utiliza para ajustar un modelo con los datos de entrenamiento y obtener las predicciones que realiza el modelo sobre estos. Básicamente combina en un único paso los métodosfit()
ypredict()
sobre el conjunto de datos de entrenamiento. Es habitual emplear este método en los modelos de aprendizaje no supervisado donde no existe una valor o etiqueta objetivo y la finalidad del modelo suele ser agrupar los datos.
Resumiendo, fit()
se utiliza para entrenar los modelos, predict()
para obtener predicciones y fit_predict()
cuando se desea entrenar y obtener una predicción para el modelo
Los métodos transform()
y fit_transform()
para transformers
En las clases transformer, las que transforma los datos en lugar de ajustarlas a un modelo como puede ser StandardScaler
, no existen los métodos predict()
ni fit_predict()
, en su lugar existen transform()
y fit_transform()
. En estas clases se utilidad es:
transform()
: Este método se utiliza para transformar los datos con un transformer ya entrenado. Al igual que los clasificadores los transformer se ajustan con un conjunto de datos de referencia mediante el métodofit()
. Por lo tanto,transform()
es el equivalente depredict()
en los transformers.fit_transform()
: Este método se utiliza para ajustar y obtener los valores transformados con un transformer. Su uso es bastante habitual dado que normalmente el entrenamiento de estos objetos se realiza para transformar los datos.
Conclusiones
En esta ocasión se han repasado las diferencias que existe entre los métodos fit()
, predict()
y fit_predict()
de Scikit-learn. Tres métodos que son muy utilizados cuando se trabaja con esta librería. También se ha visto los métodos equivalentes que existen en los transformers.
Imagen de macroworlds en Pixabay
Deja una respuesta