adimyth · January 19, 2021 11:30
diff --git a/stratifiedkfold_regression.py b/stratifiedkfold_regression.py
 import numpy as np
 import pandas as pd
 from sklearn.model_selection import StratifiedKFold

 df = pd.read_csv(path_to_data)
 n_bins = 1+np.log2(df.shape[0])	# Sturge's rule
 df["bins"] = pd.cut(df.target, n_bins, labels=False)

 n_folds = 5
 skf = StratifiedKFold(n_splits=n_folds)
 df["fold"] = -1
 for fold, (train_idx, valid_idx) in enumerate(skf.split(df.bins, df.bins)):
 	df.loc[valid_idx, "fold"] = fold
	import numpy as np
	import pandas as pd
	from sklearn.model_selection import StratifiedKFold

	df = pd.read_csv(path_to_data)
	n_bins = 1+np.log2(df.shape[0]) # Sturge's rule
	df["bins"] = pd.cut(df.target, n_bins, labels=False)

	n_folds = 5
	skf = StratifiedKFold(n_splits=n_folds)
	df["fold"] = -1
	for fold, (train_idx, valid_idx) in enumerate(skf.split(df.bins, df.bins)):
	df.loc[valid_idx, "fold"] = fold