v0.0.41

bartzbeielstein · bartzbeielstein · commit 24c0a68bb0c9 · 2023-04-26T12:55:01.000+02:00
diff --git a/notebooks/11_spot_hpt_torch.ipynb b/notebooks/11_spot_hpt_torch.ipynb
@@ -32,7 +32,7 @@
     {
      "data": {
       "text/plain": [
-       "'10-sklearn_maans05_1min_10init_2023-04-26_09-52-27'"
+       "'10-sklearn_maans05_1min_10init_2023-04-26_12-27-51'"
       ]
      },
      "execution_count": 2,
@@ -112,7 +112,19 @@
    "cell_type": "code",
    "execution_count": 5,
    "metadata": {},
-   "outputs": [],
+   "outputs": [
+    {
+     "ename": "ModuleNotFoundError",
+     "evalue": "No module named 'spotPython.torch'",
+     "output_type": "error",
+     "traceback": [
+      "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m",
+      "\u001b[0;31mModuleNotFoundError\u001b[0m                       Traceback (most recent call last)",
+      "Cell \u001b[0;32mIn[5], line 53\u001b[0m\n\u001b[1;32m     51\u001b[0m \u001b[39mfrom\u001b[39;00m \u001b[39mspotPython\u001b[39;00m\u001b[39m.\u001b[39;00m\u001b[39mutils\u001b[39;00m\u001b[39m.\u001b[39;00m\u001b[39mconvert\u001b[39;00m \u001b[39mimport\u001b[39;00m get_Xy_from_df\n\u001b[1;32m     52\u001b[0m \u001b[39mfrom\u001b[39;00m \u001b[39mspotPython\u001b[39;00m\u001b[39m.\u001b[39;00m\u001b[39mplot\u001b[39;00m\u001b[39m.\u001b[39;00m\u001b[39mvalidation\u001b[39;00m \u001b[39mimport\u001b[39;00m plot_cv_predictions, plot_roc, plot_confusion_matrix\n\u001b[0;32m---> 53\u001b[0m \u001b[39mfrom\u001b[39;00m \u001b[39mspotPython\u001b[39;00m\u001b[39m.\u001b[39;00m\u001b[39mtorch\u001b[39;00m\u001b[39m.\u001b[39;00m\u001b[39mnet\u001b[39;00m \u001b[39mimport\u001b[39;00m Net_CIFAR10\n\u001b[1;32m     55\u001b[0m \u001b[39mfrom\u001b[39;00m \u001b[39msklearn\u001b[39;00m\u001b[39m.\u001b[39;00m\u001b[39mpreprocessing\u001b[39;00m \u001b[39mimport\u001b[39;00m OneHotEncoder , MinMaxScaler, StandardScaler\n\u001b[1;32m     56\u001b[0m \u001b[39mfrom\u001b[39;00m \u001b[39msklearn\u001b[39;00m\u001b[39m.\u001b[39;00m\u001b[39mpreprocessing\u001b[39;00m \u001b[39mimport\u001b[39;00m OrdinalEncoder\n",
+      "\u001b[0;31mModuleNotFoundError\u001b[0m: No module named 'spotPython.torch'"
+     ]
+    }
+   ],
    "source": [
     "from tabulate import tabulate\n",
     "import copy\n",
@@ -200,7 +212,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 8,
+   "execution_count": null,
    "metadata": {},
    "outputs": [],
    "source": [
@@ -225,7 +237,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 7,
+   "execution_count": null,
    "metadata": {},
    "outputs": [],
    "source": [
@@ -253,7 +265,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 8,
+   "execution_count": null,
    "metadata": {},
    "outputs": [],
    "source": [
@@ -274,7 +286,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 9,
+   "execution_count": null,
    "metadata": {},
    "outputs": [],
    "source": [
@@ -310,7 +322,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 4,
+   "execution_count": null,
    "metadata": {},
    "outputs": [],
    "source": [
@@ -328,7 +340,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 5,
+   "execution_count": null,
    "metadata": {},
    "outputs": [],
    "source": [
@@ -349,7 +361,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 6,
+   "execution_count": null,
    "metadata": {},
    "outputs": [
     {
@@ -381,7 +393,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 13,
+   "execution_count": null,
    "metadata": {},
    "outputs": [
     {
@@ -410,7 +422,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 14,
+   "execution_count": null,
    "metadata": {},
    "outputs": [],
    "source": [
@@ -433,7 +445,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 11,
+   "execution_count": null,
    "metadata": {},
    "outputs": [],
    "source": [
@@ -459,18 +471,51 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 22,
+   "execution_count": 23,
    "metadata": {},
-   "outputs": [],
+   "outputs": [
+    {
+     "ename": "NameError",
+     "evalue": "name 'RidgeCV' is not defined",
+     "output_type": "error",
+     "traceback": [
+      "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m",
+      "\u001b[0;31mNameError\u001b[0m                                 Traceback (most recent call last)",
+      "Cell \u001b[0;32mIn[23], line 1\u001b[0m\n\u001b[0;32m----> 1\u001b[0m core_model  \u001b[39m=\u001b[39m RidgeCV\n\u001b[1;32m      2\u001b[0m \u001b[39m#core_model = Net_CIFAR10\u001b[39;00m\n\u001b[1;32m      3\u001b[0m fun_control \u001b[39m=\u001b[39m add_core_model_to_fun_control(core_model\u001b[39m=\u001b[39mcore_model,\n\u001b[1;32m      4\u001b[0m                               fun_control\u001b[39m=\u001b[39mfun_control,\n\u001b[1;32m      5\u001b[0m                               hyper_dict\u001b[39m=\u001b[39mSklearnHyperDict,\n\u001b[1;32m      6\u001b[0m                               filename\u001b[39m=\u001b[39m\u001b[39mNone\u001b[39;00m)\n",
+      "\u001b[0;31mNameError\u001b[0m: name 'RidgeCV' is not defined"
+     ]
+    }
+   ],
    "source": [
-    "# core_model  = RidgeCV\n",
-    "core_model = Net_CIFAR10\n",
+    "core_model  = RidgeCV\n",
+    "#core_model = Net_CIFAR10\n",
     "fun_control = add_core_model_to_fun_control(core_model=core_model,\n",
     "                              fun_control=fun_control,\n",
     "                              hyper_dict=SklearnHyperDict,\n",
     "                              filename=None)"
    ]
   },
+  {
+   "cell_type": "code",
+   "execution_count": 24,
+   "metadata": {},
+   "outputs": [
+    {
+     "ename": "NameError",
+     "evalue": "name 'core_model' is not defined",
+     "output_type": "error",
+     "traceback": [
+      "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m",
+      "\u001b[0;31mNameError\u001b[0m                                 Traceback (most recent call last)",
+      "Cell \u001b[0;32mIn[24], line 1\u001b[0m\n\u001b[0;32m----> 1\u001b[0m core_model\u001b[39m.\u001b[39m\u001b[39m__name__\u001b[39m\n",
+      "\u001b[0;31mNameError\u001b[0m: name 'core_model' is not defined"
+     ]
+    }
+   ],
+   "source": [
+    "core_model.__name__"
+   ]
+  },
   {
    "attachments": {},
    "cell_type": "markdown",
@@ -549,6 +594,8 @@
     "weight_coeff = 1.0\n",
     "\n",
     "fun_control.update({\n",
+    "               \"data_dir\": None,\n",
+    "               \"checkpoint_dir\": None,\n",
     "               \"horizon\": horizon,\n",
     "               \"oml_grace_period\": oml_grace_period,\n",
     "               \"weights\": weights,\n",
diff --git a/pyproject.toml b/pyproject.toml
@@ -7,7 +7,7 @@ build-backend = "setuptools.build_meta"
 
 [project]
 name = "spotPython"
-version = "0.0.40"
+version = "0.0.41"
 authors = [
   { name="T. Bartz-Beielstein", email="tbb@bartzundbartz.de" }
 ]
diff --git a/src/spotPython/data/torch_hyper_dict.json b/src/spotPython/data/torch_hyper_dict.json
@@ -0,0 +1,65 @@
+{
+    "Net_CIFAR10":
+    {
+        "lr": {
+            "type": "float",
+            "default": 1e-03,
+            "transform": "None",
+            "lower": 1e-04,
+            "upper": 1e-01},
+        "l1": {
+            "type": "int",
+            "default": 5,
+            "transform": "transform_power_2_int",
+            "lower": 2,
+            "upper": 9},
+        "l2": {
+            "type": "int",
+            "default": 5,
+            "transform": "transform_power_2_int",
+            "lower": 2,
+            "upper": 9},
+        "batch_size": {
+                "type": "int",
+                "default": 4,
+                "transform": "transform_power_2_int",
+                "lower": 1,
+                "upper": 4}    
+    },
+    "Template":
+    {
+            "integer_hyperparameter": {
+                "type": "int",
+                "default": 200,
+                "transform": "None",
+                "lower": 10,
+                "upper": 1000},
+            "integer_hyperparameter_with_transformation": {
+                "type": "int",
+                "default": 20,
+                "transform": "transform_power_2_int",
+                "lower": 2,
+                "upper": 20},
+            "float_hyperparameter": {
+                "type": "float",
+                "default": 1e-07,
+                "transform": "None",
+                "lower": 1e-08,
+                "upper": 1e-06},
+            "factor_hyperparameter": {
+                "levels": ["mc", "nb", "nba"],
+                "type": "factor",
+                "default": "nba",
+                "transform": "None",
+                "core_model_parameter_type": "str",
+                "lower": 0,
+                "upper": 2},
+            "bool_hyperparameter": {
+                    "levels": [0, 1],
+                    "type": "factor",
+                    "default": 0, "transform": "None",
+                    "core_model_parameter_type": "bool",
+                    "lower": 0,
+                    "upper": 1}
+    }
+}
diff --git a/src/spotPython/fun/hypertorch.py b/src/spotPython/fun/hypertorch.py
@@ -3,6 +3,12 @@
 from numpy import array
 from sklearn.pipeline import make_pipeline
 from spotPython.utils.convert import get_Xy_from_df
+from spotPython.utils.data import load_data
+import torch.nn as nn
+import torch.optim as optim
+import torch
+import os
+from torch.utils.data import random_split
 
 
 from spotPython.hyperparameters.values import assign_values
@@ -64,23 +70,100 @@ def check_X_shape(self, X):
             raise Exception
 
     def evaluate_model(self, model, fun_control):
+        # TODO: config anpassen
         try:
+            lr = fun_control["lr"]
+            checkpoint_dir = fun_control["checkpoint_dir"]
+            data_dir = fun_control["data_dir"]
+
             X_train, y_train = get_Xy_from_df(fun_control["train"], fun_control["target_column"])
             X_test, y_test = get_Xy_from_df(fun_control["test"], fun_control["target_column"])
             model.fit(X_train, y_train)
-            
-            
-            
-            
-            
             df_preds = model.predict(X_test)
             df_eval = fun_control["metric_sklearn"](y_test, df_preds)
+            #
+            device = "cpu"
+            # if torch.cuda.is_available():
+            #     device = "cuda:0"
+            #     if torch.cuda.device_count() > 1:
+            #         net = nn.DataParallel(net)
+            model.to(device)
+
+            criterion = nn.CrossEntropyLoss()
+            optimizer = optim.SGD(model.parameters(), lr=lr, momentum=0.9)
+
+            if checkpoint_dir:
+                model_state, optimizer_state = torch.load(os.path.join(checkpoint_dir, "checkpoint"))
+                model.load_state_dict(model_state)
+                optimizer.load_state_dict(optimizer_state)
+
+            trainset, testset = load_data(data_dir)
+
+            test_abs = int(len(trainset) * 0.8)
+            train_subset, val_subset = random_split(trainset, [test_abs, len(trainset) - test_abs])
+
+            trainloader = torch.utils.data.DataLoader(
+                train_subset, batch_size=int(config["batch_size"]), shuffle=True, num_workers=8
+            )
+            valloader = torch.utils.data.DataLoader(
+                val_subset, batch_size=int(config["batch_size"]), shuffle=True, num_workers=8
+            )
+
+            for epoch in range(10):  # loop over the dataset multiple times
+                running_loss = 0.0
+                epoch_steps = 0
+                for i, data in enumerate(trainloader, 0):
+                    # get the inputs; data is a list of [inputs, labels]
+                    inputs, labels = data
+                    inputs, labels = inputs.to(device), labels.to(device)
+
+                    # zero the parameter gradients
+                    optimizer.zero_grad()
+
+                    # forward + backward + optimize
+                    outputs = model(inputs)
+                    loss = criterion(outputs, labels)
+                    loss.backward()
+                    optimizer.step()
+
+                    # print statistics
+                    running_loss += loss.item()
+                    epoch_steps += 1
+                    if i % 2000 == 1999:  # print every 2000 mini-batches
+                        print("[%d, %5d] loss: %.3f" % (epoch + 1, i + 1, running_loss / epoch_steps))
+                        running_loss = 0.0
+
+                # Validation loss
+                val_loss = 0.0
+                val_steps = 0
+                total = 0
+                correct = 0
+                for i, data in enumerate(valloader, 0):
+                    with torch.no_grad():
+                        inputs, labels = data
+                        inputs, labels = inputs.to(device), labels.to(device)
+
+                        outputs = model(inputs)
+                        _, predicted = torch.max(outputs.data, 1)
+                        total += labels.size(0)
+                        correct += (predicted == labels).sum().item()
+
+                        loss = criterion(outputs, labels)
+                        val_loss += loss.cpu().numpy()
+                        val_steps += 1
+
+                # TODO:
+                # with tune.checkpoint_dir(epoch) as checkpoint_dir:
+                path = os.path.join(checkpoint_dir, "checkpoint")
+                torch.save((model.state_dict(), optimizer.state_dict()), path)
+            df_eval = val_loss / val_steps
+            df_preds = np.nan
+            # accuracy = correct / total
         except Exception as err:
             print(f"Error in fun_sklearn(). Call to evaluate_model failed. {err=}, {type(err)=}")
             df_eval = np.nan
-            df_eval = np.nan
+            df_preds = np.nan
         return df_eval, df_preds
-  
 
     def get_sklearn_df_eval_preds(self, model):
         try:
@@ -92,7 +175,7 @@ def get_sklearn_df_eval_preds(self, model):
             df_preds = np.nan
         return df_eval, df_preds
 
-    def fun_sklearn(self, X, fun_control=None):
+    def fun_torch(self, X, fun_control=None):
         z_res = np.array([], dtype=float)
         self.fun_control.update(fun_control)
         self.check_X_shape(X)
diff --git a/src/spotPython/torch/net.py b/src/spotPython/torch/net.py
diff --git a/src/spotPython/utils/file.py b/src/spotPython/utils/file.py

Original file line number	Diff line number	Diff line change
`@@ -7,7 +7,7 @@ build-backend = "setuptools.build_meta"`
`7`	`7`
`8`	`8`	`[project]`
`9`	`9`	`name = "spotPython"`
`10`		`-version = "0.0.40"`
	`10`	`+version = "0.0.41"`
`11`	`11`	`authors = [`
`12`	`12`	`{ name="T. Bartz-Beielstein", email="tbb@bartzundbartz.de" }`
`13`	`13`	`]`