v0.0.60

bartzbeielstein · bartzbeielstein · commit 2fb07911a9b1 · 2023-05-07T17:53:41.000+02:00
diff --git a/pyproject.toml b/pyproject.toml
@@ -7,7 +7,7 @@ build-backend = "setuptools.build_meta"
 
 [project]
 name = "spotPython"
-version = "0.0.58"
+version = "0.0.60"
 authors = [
   { name="T. Bartz-Beielstein", email="tbb@bartzundbartz.de" }
 ]
diff --git a/src/spotPython/torch/netcifar10.py b/src/spotPython/torch/netcifar10.py
@@ -1,9 +1,9 @@
 from torch import nn
 import torch.nn.functional as F
-import spotPython.torch.netcorecv as netcorecv
+import spotPython.torch.netcore as netcore
 
 
-class Net_CIFAR10(netcorecv.Net_Core_CV):
+class Net_CIFAR10(netcore.Net_Core):
     def __init__(self, l1, l2, lr, batch_size, epochs, k_folds):
         super(Net_CIFAR10, self).__init__(lr=lr, batch_size=batch_size, epochs=epochs, k_folds=k_folds)
         self.conv1 = nn.Conv2d(3, 6, 5)
diff --git a/src/spotPython/torch/netcore.py b/src/spotPython/torch/netcore.py
@@ -7,134 +7,15 @@
 from torch.utils.data import random_split
 
 
-class Net_Core_CV(nn.Module):
+class Net_Core(nn.Module):
     def __init__(self, lr, batch_size, epochs, k_folds):
-        super(Net_Core_CV, self).__init__()
+        super(Net_Core, self).__init__()
         self.lr = lr
         self.batch_size = batch_size
         self.epochs = epochs
         self.k_folds = k_folds
         self.results = {}
 
-    # def evaluate_cv_old(self, dataset, shuffle=False):
-    #     try:
-    #         device = getDevice()
-    #         self.to(device)
-    #         if torch.cuda.device_count() > 1:
-    #             self = nn.DataParallel(self)
-    #         criterion = nn.CrossEntropyLoss()
-    #         optimizer = optim.SGD(self.parameters(), lr=self.lr, momentum=0.9)
-    #         # TODO:
-    #         # if checkpoint_dir:
-    #         #     model_state, optimizer_state = torch.load(os.path.join(checkpoint_dir, "checkpoint"))
-    #         #     model.load_state_dict(model_state)
-    #         #     optimizer.load_state_dict(optimizer_state)
-    #         # TODO:
-    #         # trainset, testset = load_data(data_dir)
-    #         # dataset = fun_control["train"]
-    #         kfold = KFold(n_splits=self.k_folds, shuffle=shuffle)
-
-    #         # test_abs = int(len(dataset) * 0.6)
-    #         # train_subset, val_subset = random_split(dataset, [test_abs, len(dataset) - test_abs])
-    #         for fold, (train_ids, val_ids) in enumerate(kfold.split(dataset)):
-    #             print(f"Fold {fold}")
-    #             # Sample elements randomly from a given list of ids, no replacement.
-    #             train_subsampler = torch.utils.data.SubsetRandomSampler(train_ids)
-    #             val_subsampler = torch.utils.data.SubsetRandomSampler(val_ids)
-    #             # Define data loaders for training and testing data in this fold
-    #             trainloader = torch.utils.data.DataLoader(dataset,
-    #               batch_size=self.batch_size, sampler=train_subsampler)
-    #             valloader = torch.utils.data.DataLoader(dataset,
-    #               batch_size=self.batch_size, sampler=val_subsampler)
-    #             self.reset_weights()
-    #             # Define best_score, counter, and patience for early stopping:
-    #             best_score = None
-    #             counter = 0
-    #             patience = 10
-    #             # path = os.path.join(".", "checkpoint")
-    #             for epoch in range(self.epochs):  # loop over the dataset multiple times
-    #                 running_loss = 0.0
-    #                 epoch_steps = 0
-    #                 for i, data in enumerate(trainloader, 0):
-    #                     # get the inputs; data is a list of [inputs, labels]
-    #                     inputs, labels = data
-    #                     inputs, labels = inputs.to(device), labels.to(device)
-
-    #                     # zero the parameter gradients
-    #                     optimizer.zero_grad()
-
-    #                     # forward + backward + optimize
-    #                     outputs = self(inputs)
-    #                     loss = criterion(outputs, labels)
-    #                     loss.backward()
-    #                     optimizer.step()
-
-    #                     # print statistics
-    #                     running_loss += loss.item()
-    #                     epoch_steps += 1
-    #                     if i % 2000 == 1999:  # print every 2000 mini-batches
-    #                         print("[%d, %5d] loss: %.3f" % (epoch + 1, i + 1, running_loss / epoch_steps))
-    #                         running_loss = 0.0
-
-    #             # Validation loss
-    #             val_loss = 0.0
-    #             val_steps = 0
-    #             total = 0
-    #             correct = 0
-    #             for i, data in enumerate(valloader, 0):
-    #                 with torch.no_grad():
-    #                     inputs, labels = data
-    #                     inputs, labels = inputs.to(device), labels.to(device)
-
-    #                     outputs = self(inputs)
-    #                     _, predicted = torch.max(outputs.data, 1)
-    #                     total += labels.size(0)
-    #                     correct += (predicted == labels).sum().item()
-    #                     loss = criterion(outputs, labels)
-    #                     val_loss += loss.cpu().numpy()
-    #                     val_steps += 1
-    #             # Print accuracy
-    #             print("Accuracy for fold %d: %d %%" % (fold, 100.0 * correct / total))
-    #             print("--------------------------------")
-    #             self.results[fold] = 100.0 * (correct / total)
-    #             # early stopping:
-    #             # https://stackoverflow.com/questions/60200088/
-    #                   how-to-make-early-stopping-in-image-classification-pytorch
-    #             if best_score is None:
-    #                 best_score = val_loss
-    #             else:
-    #                 # Check if val_loss improves or not.
-    #                 if val_loss < best_score:
-    #                     # val_loss improves, we update the latest best_score,
-    #                     # and save the current model
-    #                     best_score = val_loss
-    #                     # TODO:
-    #                     # torch.save({'state_dict':self.state_dict()}, path)
-    #                 else:
-    #                     # val_loss does not improve, we increase the counter,
-    #                     # stop training if it exceeds the amount of patience
-    #                     counter += 1
-    #                     if counter >= patience:
-    #                         break
-    #             # TODO:
-    #             # torch.save((self.state_dict(), optimizer.state_dict()), path)
-    #         # Print fold results
-    #         print(f"k-fold CV results for {self.k_folds} folds")
-    #         print("--------------------------------")
-    #         sum = 0.0
-    #         for key, value in self.results.items():
-    #             print(f"Fold {key}: {value} %")
-    #             sum += value
-    #         avg = sum / len(self.results.items())
-    #         print(f"Average: {avg} %")
-    #         df_eval = avg
-    #         df_preds = np.nan
-    #     except Exception as err:
-    #         print(f"Error in Net_Core. Call to evaluate() failed. {err=}, {type(err)=}")
-    #         df_eval = np.nan
-    #         df_preds = np.nan
-    #     return df_eval, df_preds
-
     def reset_weights(self):
         for layer in self.children():
             if hasattr(layer, "reset_parameters"):
@@ -195,7 +76,7 @@ def evaluate_cv(self, dataset, shuffle=False):
             df_eval = sum(self.results.values()) / len(self.results.values())
             df_preds = np.nan
         except Exception as err:
-            print(f"Error in Net_Core_CV. Call to evaluate_cv() failed. {err=}, {type(err)=}")
+            print(f"Error in Net_Core. Call to evaluate_cv() failed. {err=}, {type(err)=}")
             df_eval = np.nan
             df_preds = np.nan
         return df_eval, df_preds
@@ -213,16 +94,30 @@ def evaluate_hold_out(self, dataset, shuffle, test_dataset=None):
             else:
                 trainloader, valloader = self.create_train_test_data_loaders(dataset, shuffle, test_dataset)
             scheduler = torch.optim.lr_scheduler.StepLR(optimizer, step_size=30, gamma=0.1)
+            # Early stopping parameters
+            patience = 5
+            best_val_loss = float("inf")
+            counter = 0
             for epoch in range(epochs):
                 self.train_hold_out(trainloader, criterion, optimizer, device=device, epoch=epoch)
                 scheduler.step()
-            val_accuracy, val_loss = self.validate_hold_out(valloader=valloader, criterion=criterion, device=device)
-            df_eval = val_loss
+                # Early stopping check
+                val_accuracy, val_loss = self.validate_hold_out(valloader=valloader, criterion=criterion, device=device)
+                if val_loss < best_val_loss:
+                    best_val_loss = val_loss
+                    counter = 0
+                else:
+                    counter += 1
+                    if counter >= patience:
+                        print(f"Early stopping at epoch {epoch}")
+                        break
+            df_eval = best_val_loss
             df_preds = np.nan
         except Exception as err:
-            print(f"Error in Net_Core_CV. Call to evaluate_hold_out() failed. {err=}, {type(err)=}")
+            print(f"Error in Net_Core. Call to evaluate_hold_out() failed. {err=}, {type(err)=}")
             df_eval = np.nan
             df_preds = np.nan
+        print(f"Returned to Spot: Best validation loss: {df_eval}")
         return df_eval, df_preds
 
     def create_train_val_data_loaders(self, dataset, shuffle):
@@ -260,8 +155,11 @@ def train_hold_out(self, trainloader, criterion, optimizer, device, epoch):
             # print statistics
             running_loss += loss.item()
             epoch_steps += 1
-            if i % 2000 == 1999:  # print every 2000 mini-batches
-                print("[%d, %5d] loss: %.3f" % (epoch + 1, i + 1, running_loss / epoch_steps))
+            if i % 1000 == 999:  # print every 1000 mini-batches
+                print(
+                    "Epoch: %d, Batch: %5d. Batch Size: %d. Training Loss: %.3f"
+                    % (epoch + 1, i + 1, int(self.batch_size), running_loss / epoch_steps)
+                )
                 running_loss = 0.0
 
     def validate_hold_out(self, valloader, criterion, device):
@@ -284,6 +182,6 @@ def validate_hold_out(self, valloader, criterion, device):
                 val_steps += 1
         accuracy = correct / total
         loss = val_loss / val_steps
-        print(f"Accuracy on hold-out set: {accuracy}")
         print(f"Loss on hold-out set: {loss}")
+        print(f"Accuracy on hold-out set: {accuracy}")
         return accuracy, loss
diff --git a/src/spotPython/torch/netcvfashionMNIST.py b/src/spotPython/torch/netcvfashionMNIST.py
@@ -1,8 +1,8 @@
 from torch import nn
-import spotPython.torch.netcorecv as netcorecv
+import spotPython.torch.netcore as netcore
 
 
-class Net_CV_fashionMNIST(netcorecv.Net_Core_CV):
+class Net_CV_fashionMNIST(netcore.Net_Core):
     def __init__(self, l1, l2, lr, batch_size, epochs, k_folds):
         super(Net_CV_fashionMNIST, self).__init__(lr=lr, batch_size=batch_size, epochs=epochs, k_folds=k_folds)
         self.flatten = nn.Flatten()

Original file line number	Diff line number	Diff line change
`@@ -7,7 +7,7 @@ build-backend = "setuptools.build_meta"`
`7`	`7`
`8`	`8`	`[project]`
`9`	`9`	`name = "spotPython"`
`10`		`-version = "0.0.58"`
	`10`	`+version = "0.0.60"`
`11`	`11`	`authors = [`
`12`	`12`	`{ name="T. Bartz-Beielstein", email="tbb@bartzundbartz.de" }`
`13`	`13`	`]`