Added support for model optimization using RMSProp algorithm. (migueldeicaza#413)

zeahmed · migueldeicaza · commit cebc0741d8c8 · 2019-04-01T14:22:53.000-04:00
* Setting variable shared_name property to avoid variables sharing.

* Added SGD and MomentumSGD optimizers together with relevant tests.

* Tests added for momentum and Nesterov SGD with and without lr decay.

* Added MNIST multilayer test.

* Added MNIST GPU test in disabled mode.

* Added support to place an operation on a specific device.

* Disabled 'DevicePlacementTest' because it requires GPUs.

* Added MNIST multilayer test.

* Updated comments.

* Disabled MnistGPU test.

* Removed uncessary files.

* Added Adagrad optimization algorithm.

* Added RMSProp optimization algorithm.
diff --git a/TensorFlowSharp/Optimizer.cs b/TensorFlowSharp/Optimizer.cs
diff --git a/tests/TensorFlowSharp.Tests.CSharp/OptimizerTests.cs b/tests/TensorFlowSharp.Tests.CSharp/OptimizerTests.cs
@@ -669,5 +669,117 @@ public void LinearRegresionTrainingWithAdagradDecayTest()
                 }
             }
         }
+
+        [Fact]
+        public void LinearRegresionTrainingWithRMSPropTest()
+        {
+            Console.WriteLine("Linear regression");
+            // Parameters
+            var learning_rate = 0.01f;
+            var training_epochs = 5;
+
+            // Training data
+            var train_x = new float[] {
+                3.3f, 4.4f, 5.5f, 6.71f, 6.93f, 4.168f, 9.779f, 6.182f, 7.59f, 2.167f,
+                7.042f, 10.791f, 5.313f, 7.997f, 5.654f, 9.27f, 3.1f
+            };
+            var train_y = new float[] {
+                1.7f, 2.76f,2.09f,3.19f,1.694f,1.573f,3.366f,2.596f,2.53f,1.221f,
+                 2.827f,3.465f,1.65f,2.904f,2.42f,2.94f,1.3f
+            };
+            var n_samples = train_x.Length;
+            using (var graph = new TFGraph())
+            {
+                var rng = new Random(0);
+                // tf Graph Input
+
+                var X = graph.Placeholder(TFDataType.Float, TFShape.Scalar);
+                var Y = graph.Placeholder(TFDataType.Float, TFShape.Scalar);
+
+                var W = graph.Variable(graph.Const(0.1f), operName: "weight");
+                var b = graph.Variable(graph.Const(0.1f), operName: "bias");
+                var pred = graph.Add(graph.Mul(X, W.Read, "x_w"), b.Read);
+
+                var cost = graph.Div(graph.ReduceSum(graph.Pow(graph.Sub(pred, Y), graph.Const(2f))), graph.Mul(graph.Const(2f), graph.Const((float)n_samples), "2_n_samples"));
+
+                var sgd = new RMSProp(graph, learning_rate, initialAccumulatorValue: 1.0f);
+                var updateOps = sgd.Minimize(cost);
+
+                using (var sesssion = new TFSession(graph))
+                {
+                    sesssion.GetRunner().AddTarget(graph.GetGlobalVariablesInitializer()).Run();
+
+                    var expectedLines = File.ReadAllLines(Path.Combine(_testDataPath, "RMSProp", "expected.txt"));
+                    for (int i = 0; i < training_epochs; i++)
+                    {
+                        for (int j = 0; j < n_samples; j++)
+                        {
+                            var tensors = sesssion.GetRunner()
+                                .AddInput(X, new TFTensor(train_x[j]))
+                                .AddInput(Y, new TFTensor(train_y[j]))
+                                .AddTarget(updateOps).Fetch(cost, W.Read, b.Read, pred).Run();
+                            var output = $"loss: {tensors[0].GetValue():F4}, W: {tensors[1].GetValue():F4}, b: {tensors[2].GetValue():F4}";
+                            Assert.Equal(expectedLines[i * n_samples + j], output);
+                        }
+                    }
+                }
+            }
+        }
+
+        [Fact]
+        public void LinearRegresionTrainingWithRMSPropDecayTest()
+        {
+            Console.WriteLine("Linear regression");
+            // Parameters
+            var learning_rate = 0.01f;
+            var training_epochs = 5;
+
+            // Training data
+            var train_x = new float[] {
+                3.3f, 4.4f, 5.5f, 6.71f, 6.93f, 4.168f, 9.779f, 6.182f, 7.59f, 2.167f,
+                7.042f, 10.791f, 5.313f, 7.997f, 5.654f, 9.27f, 3.1f
+            };
+            var train_y = new float[] {
+                1.7f, 2.76f,2.09f,3.19f,1.694f,1.573f,3.366f,2.596f,2.53f,1.221f,
+                 2.827f,3.465f,1.65f,2.904f,2.42f,2.94f,1.3f
+            };
+            var n_samples = train_x.Length;
+            using (var graph = new TFGraph())
+            {
+                var rng = new Random(0);
+                // tf Graph Input
+
+                var X = graph.Placeholder(TFDataType.Float, TFShape.Scalar);
+                var Y = graph.Placeholder(TFDataType.Float, TFShape.Scalar);
+
+                var W = graph.Variable(graph.Const(0.1f), operName: "weight");
+                var b = graph.Variable(graph.Const(0.1f), operName: "bias");
+                var pred = graph.Add(graph.Mul(X, W.Read, "x_w"), b.Read);
+
+                var cost = graph.Div(graph.ReduceSum(graph.Pow(graph.Sub(pred, Y), graph.Const(2f))), graph.Mul(graph.Const(2f), graph.Const((float)n_samples), "2_n_samples"));
+
+                var sgd = new RMSProp(graph, learning_rate, decay: 0.5f, initialAccumulatorValue: 1.0f);
+                var updateOps = sgd.Minimize(cost);
+
+                using (var sesssion = new TFSession(graph))
+                {
+                    sesssion.GetRunner().AddTarget(graph.GetGlobalVariablesInitializer()).Run();
+
+                    var expectedLines = File.ReadAllLines(Path.Combine(_testDataPath, "RMSPropTimeDecay", "expected.txt"));
+                    for (int i = 0; i < training_epochs; i++)
+                    {
+                        for (int j = 0; j < n_samples; j++)
+                        {
+                            var tensors = sesssion.GetRunner()
+                               .AddInput(X, new TFTensor(train_x[j]))
+                               .AddInput(Y, new TFTensor(train_y[j]))
+                               .AddTarget(updateOps).Fetch(sgd.Iterations.Read, cost, W.Read, b.Read, sgd.LearningRate.Read).Run();
+                            var output = $"step: {tensors[0].GetValue():D}, loss: {tensors[1].GetValue():F4}, W: {tensors[2].GetValue():F4}, b: {tensors[3].GetValue():F4}, lr: {tensors[4].GetValue():F8}";
+                            Assert.Equal(expectedLines[i * n_samples + j], output);
+                        }
+                    }
+                }
+            }
+        }
     }
 }
diff --git a/tests/TensorFlowSharp.Tests.CSharp/TensorFlowSharp.Tests.CSharp.csproj b/tests/TensorFlowSharp.Tests.CSharp/TensorFlowSharp.Tests.CSharp.csproj
@@ -104,6 +104,12 @@
     <None Include="TestData\Momentum\optimizer_lr_test.py">
       <CopyToOutputDirectory>PreserveNewest</CopyToOutputDirectory>
     </None>
+    <None Include="TestData\RMSPropTimeDecay\optimizer_lr_test.py">
+      <CopyToOutputDirectory>PreserveNewest</CopyToOutputDirectory>
+    </None>
+    <None Include="TestData\RMSProp\optimizer_lr_test.py">
+      <CopyToOutputDirectory>PreserveNewest</CopyToOutputDirectory>
+    </None>
     <None Include="TestData\SGDMnist\optimizer_lr_test.py">
       <CopyToOutputDirectory>PreserveNewest</CopyToOutputDirectory>
     </None>
@@ -147,6 +153,12 @@
     <Content Include="TestData\Momentum\expected.txt">
       <CopyToOutputDirectory>PreserveNewest</CopyToOutputDirectory>
     </Content>
+    <Content Include="TestData\RMSPropTimeDecay\expected.txt">
+      <CopyToOutputDirectory>PreserveNewest</CopyToOutputDirectory>
+    </Content>
+    <Content Include="TestData\RMSProp\expected.txt">
+      <CopyToOutputDirectory>PreserveNewest</CopyToOutputDirectory>
+    </Content>
     <Content Include="TestData\SGDMnistGPU\expected.txt">
       <CopyToOutputDirectory>PreserveNewest</CopyToOutputDirectory>
     </Content>
diff --git a/tests/TensorFlowSharp.Tests.CSharp/TestData/RMSProp/expected.txt b/tests/TensorFlowSharp.Tests.CSharp/TestData/RMSProp/expected.txt
@@ -0,0 +1,85 @@
+loss: 0.0474, W: 0.1000, b: 0.1000
+loss: 0.1434, W: 0.1026, b: 0.1008
+loss: 0.0568, W: 0.1088, b: 0.1022
+loss: 0.1587, W: 0.1139, b: 0.1032
+loss: 0.0156, W: 0.1242, b: 0.1049
+loss: 0.0257, W: 0.1277, b: 0.1054
+loss: 0.1157, W: 0.1305, b: 0.1062
+loss: 0.0751, W: 0.1440, b: 0.1079
+loss: 0.0478, W: 0.1511, b: 0.1093
+loss: 0.0173, W: 0.1581, b: 0.1105
+loss: 0.0746, W: 0.1594, b: 0.1112
+loss: 0.0695, W: 0.1682, b: 0.1129
+loss: 0.0097, W: 0.1807, b: 0.1146
+loss: 0.0515, W: 0.1832, b: 0.1152
+loss: 0.0437, W: 0.1917, b: 0.1168
+loss: 0.0289, W: 0.1975, b: 0.1184
+loss: 0.0087, W: 0.2053, b: 0.1197
+loss: 0.0237, W: 0.2068, b: 0.1205
+loss: 0.0866, W: 0.2096, b: 0.1219
+loss: 0.0175, W: 0.2170, b: 0.1246
+loss: 0.0734, W: 0.2212, b: 0.1258
+loss: 0.0001, W: 0.2319, b: 0.1286
+loss: 0.0068, W: 0.2316, b: 0.1285
+loss: 0.0266, W: 0.2338, b: 0.1294
+loss: 0.0269, W: 0.2441, b: 0.1314
+loss: 0.0071, W: 0.2509, b: 0.1334
+loss: 0.0084, W: 0.2553, b: 0.1345
+loss: 0.0229, W: 0.2568, b: 0.1358
+loss: 0.0065, W: 0.2647, b: 0.1380
+loss: 0.0001, W: 0.2714, b: 0.1392
+loss: 0.0102, W: 0.2719, b: 0.1394
+loss: 0.0145, W: 0.2787, b: 0.1411
+loss: 0.0007, W: 0.2846, b: 0.1433
+loss: 0.0021, W: 0.2869, b: 0.1438
+loss: 0.0107, W: 0.2882, b: 0.1447
+loss: 0.0520, W: 0.2916, b: 0.1469
+loss: 0.0023, W: 0.3017, b: 0.1518
+loss: 0.0291, W: 0.3045, b: 0.1529
+loss: 0.0126, W: 0.3162, b: 0.1570
+loss: 0.0005, W: 0.3081, b: 0.1542
+loss: 0.0010, W: 0.3092, b: 0.1548
+loss: 0.0075, W: 0.3128, b: 0.1557
+loss: 0.0001, W: 0.3192, b: 0.1582
+loss: 0.0041, W: 0.3184, b: 0.1579
+loss: 0.0050, W: 0.3202, b: 0.1600
+loss: 0.0015, W: 0.3270, b: 0.1624
+loss: 0.0014, W: 0.3211, b: 0.1610
+loss: 0.0012, W: 0.3182, b: 0.1596
+loss: 0.0056, W: 0.3224, b: 0.1610
+loss: 0.0022, W: 0.3291, b: 0.1641
+loss: 0.0006, W: 0.3220, b: 0.1620
+loss: 0.0065, W: 0.3233, b: 0.1632
+loss: 0.0389, W: 0.3280, b: 0.1671
+loss: 0.0000, W: 0.3426, b: 0.1767
+loss: 0.0149, W: 0.3431, b: 0.1769
+loss: 0.0272, W: 0.3568, b: 0.1834
+loss: 0.0000, W: 0.3398, b: 0.1745
+loss: 0.0005, W: 0.3396, b: 0.1744
+loss: 0.0035, W: 0.3360, b: 0.1730
+loss: 0.0018, W: 0.3423, b: 0.1767
+loss: 0.0030, W: 0.3366, b: 0.1740
+loss: 0.0020, W: 0.3388, b: 0.1777
+loss: 0.0056, W: 0.3449, b: 0.1810
+loss: 0.0023, W: 0.3304, b: 0.1754
+loss: 0.0005, W: 0.3256, b: 0.1716
+loss: 0.0044, W: 0.3290, b: 0.1734
+loss: 0.0038, W: 0.3366, b: 0.1791
+loss: 0.0004, W: 0.3253, b: 0.1736
+loss: 0.0059, W: 0.3266, b: 0.1755
+loss: 0.0366, W: 0.3321, b: 0.1828
+loss: 0.0000, W: 0.3485, b: 0.1992
+loss: 0.0127, W: 0.3480, b: 0.1988
+loss: 0.0310, W: 0.3625, b: 0.2090
+loss: 0.0001, W: 0.3430, b: 0.1942
+loss: 0.0009, W: 0.3424, b: 0.1934
+loss: 0.0030, W: 0.3372, b: 0.1906
+loss: 0.0022, W: 0.3434, b: 0.1959
+loss: 0.0026, W: 0.3368, b: 0.1912
+loss: 0.0017, W: 0.3390, b: 0.1966
+loss: 0.0062, W: 0.3449, b: 0.2012
+loss: 0.0025, W: 0.3292, b: 0.1925
+loss: 0.0005, W: 0.3241, b: 0.1867
+loss: 0.0042, W: 0.3276, b: 0.1893
+loss: 0.0039, W: 0.3351, b: 0.1973
+loss: 0.0003, W: 0.3234, b: 0.1895
diff --git a/tests/TensorFlowSharp.Tests.CSharp/TestData/RMSProp/optimizer_lr_test.py b/tests/TensorFlowSharp.Tests.CSharp/TestData/RMSProp/optimizer_lr_test.py
@@ -0,0 +1,35 @@
+# This script is used to create data file (expected.txt)
+# which is used to compare the output from TensorFlowSharp optimizer tests.
+
+import tensorflow as tf
+
+# Training data
+train_x =[
+    3.3, 4.4, 5.5, 6.71, 6.93, 4.168, 9.779, 6.182, 7.59, 2.167,
+    7.042, 10.791, 5.313, 7.997, 5.654, 9.27, 3.1
+]
+train_y = [
+    1.7, 2.76,2.09,3.19,1.694,1.573,3.366,2.596,2.53,1.221,
+        2.827,3.465,1.65,2.904,2.42,2.94,1.3
+]
+n_samples = len(train_x)
+learning_rate = 0.01
+X = tf.placeholder(tf.float32)
+Y = tf.placeholder(tf.float32)
+
+W = tf.Variable(tf.constant(0.1), dtype=tf.float32)
+b = tf.Variable(tf.constant(0.1), dtype=tf.float32)
+
+pred = tf.add(tf.multiply(X,W), b)
+
+cost = tf.divide(tf.reduce_sum(tf.pow(tf.subtract(pred, Y), 2.0)), tf.multiply(2.0, n_samples))
+optimizer = tf.train.RMSPropOptimizer(learning_rate, momentum=0.0,epsilon=1e-7).minimize(cost, name = "RMSPropOptimizer")
+
+init = tf.global_variables_initializer()
+with tf.Session() as session:
+    session.run(init)
+    for e in range(5):
+        for i in range(n_samples):
+            _, cost_v, W_v, b_v, pred_v = session.run([optimizer, cost, W, b, pred], feed_dict = {X: train_x[i], Y: train_y[i]})
+            print(f"loss: {cost_v:.4f}, W: {W_v:.4f}, b: {b_v:.4f}")
+            #print("Prediction: %f == Actual: %f" % (pred_v, train_y[i]))
diff --git a/tests/TensorFlowSharp.Tests.CSharp/TestData/RMSPropTimeDecay/expected.txt b/tests/TensorFlowSharp.Tests.CSharp/TestData/RMSPropTimeDecay/expected.txt
@@ -0,0 +1,85 @@
+step: 1, loss: 0.0474, W: 0.1000, b: 0.1000, lr: 0.01000000
+step: 2, loss: 0.1434, W: 0.1026, b: 0.1008, lr: 0.00666667
+step: 3, loss: 0.0578, W: 0.1067, b: 0.1017, lr: 0.00500000
+step: 4, loss: 0.1630, W: 0.1093, b: 0.1022, lr: 0.00400000
+step: 5, loss: 0.0190, W: 0.1135, b: 0.1029, lr: 0.00333333
+step: 6, loss: 0.0289, W: 0.1147, b: 0.1031, lr: 0.00285714
+step: 7, loss: 0.1337, W: 0.1156, b: 0.1033, lr: 0.00250000
+step: 8, loss: 0.0906, W: 0.1192, b: 0.1038, lr: 0.00222222
+step: 9, loss: 0.0669, W: 0.1209, b: 0.1041, lr: 0.00200000
+step: 10, loss: 0.0213, W: 0.1225, b: 0.1044, lr: 0.00181818
+step: 11, loss: 0.1015, W: 0.1227, b: 0.1046, lr: 0.00166667
+step: 12, loss: 0.1198, W: 0.1244, b: 0.1049, lr: 0.00153846
+step: 13, loss: 0.0223, W: 0.1267, b: 0.1052, lr: 0.00142857
+step: 14, loss: 0.0933, W: 0.1272, b: 0.1054, lr: 0.00133333
+step: 15, loss: 0.0741, W: 0.1286, b: 0.1057, lr: 0.00125000
+step: 16, loss: 0.0786, W: 0.1294, b: 0.1059, lr: 0.00117647
+step: 17, loss: 0.0183, W: 0.1307, b: 0.1062, lr: 0.00111111
+step: 18, loss: 0.0397, W: 0.1309, b: 0.1063, lr: 0.00105263
+step: 19, loss: 0.1268, W: 0.1313, b: 0.1065, lr: 0.00100000
+step: 20, loss: 0.0465, W: 0.1320, b: 0.1068, lr: 0.00095238
+step: 21, loss: 0.1415, W: 0.1326, b: 0.1070, lr: 0.00090909
+step: 22, loss: 0.0128, W: 0.1337, b: 0.1073, lr: 0.00086957
+step: 23, loss: 0.0242, W: 0.1340, b: 0.1075, lr: 0.00083333
+step: 24, loss: 0.1112, W: 0.1343, b: 0.1076, lr: 0.00080000
+step: 25, loss: 0.0801, W: 0.1356, b: 0.1079, lr: 0.00076923
+step: 26, loss: 0.0566, W: 0.1363, b: 0.1082, lr: 0.00074074
+step: 27, loss: 0.0196, W: 0.1369, b: 0.1084, lr: 0.00071429
+step: 28, loss: 0.0904, W: 0.1371, b: 0.1085, lr: 0.00068966
+step: 29, loss: 0.1027, W: 0.1378, b: 0.1088, lr: 0.00066667
+step: 30, loss: 0.0190, W: 0.1389, b: 0.1091, lr: 0.00064516
+step: 31, loss: 0.0832, W: 0.1391, b: 0.1093, lr: 0.00062500
+step: 32, loss: 0.0679, W: 0.1398, b: 0.1096, lr: 0.00060606
+step: 33, loss: 0.0688, W: 0.1403, b: 0.1098, lr: 0.00058824
+step: 34, loss: 0.0167, W: 0.1410, b: 0.1101, lr: 0.00057143
+step: 35, loss: 0.0372, W: 0.1411, b: 0.1102, lr: 0.00055556
+step: 36, loss: 0.1210, W: 0.1413, b: 0.1104, lr: 0.00054054
+step: 37, loss: 0.0423, W: 0.1417, b: 0.1108, lr: 0.00052632
+step: 38, loss: 0.1329, W: 0.1421, b: 0.1110, lr: 0.00051282
+step: 39, loss: 0.0104, W: 0.1427, b: 0.1114, lr: 0.00050000
+step: 40, loss: 0.0220, W: 0.1429, b: 0.1115, lr: 0.00048780
+step: 41, loss: 0.1012, W: 0.1431, b: 0.1117, lr: 0.00047619
+step: 42, loss: 0.0748, W: 0.1439, b: 0.1121, lr: 0.00046512
+step: 43, loss: 0.0514, W: 0.1443, b: 0.1124, lr: 0.00045455
+step: 44, loss: 0.0186, W: 0.1447, b: 0.1126, lr: 0.00044444
+step: 45, loss: 0.0844, W: 0.1448, b: 0.1128, lr: 0.00043478
+step: 46, loss: 0.0936, W: 0.1453, b: 0.1131, lr: 0.00042553
+step: 47, loss: 0.0170, W: 0.1460, b: 0.1135, lr: 0.00041667
+step: 48, loss: 0.0773, W: 0.1462, b: 0.1137, lr: 0.00040816
+step: 49, loss: 0.0642, W: 0.1466, b: 0.1140, lr: 0.00040000
+step: 50, loss: 0.0630, W: 0.1469, b: 0.1143, lr: 0.00039216
+step: 51, loss: 0.0156, W: 0.1474, b: 0.1146, lr: 0.00038462
+step: 52, loss: 0.0355, W: 0.1475, b: 0.1148, lr: 0.00037736
+step: 53, loss: 0.1171, W: 0.1476, b: 0.1150, lr: 0.00037037
+step: 54, loss: 0.0396, W: 0.1479, b: 0.1154, lr: 0.00036364
+step: 55, loss: 0.1273, W: 0.1482, b: 0.1156, lr: 0.00035714
+step: 56, loss: 0.0088, W: 0.1487, b: 0.1161, lr: 0.00035088
+step: 57, loss: 0.0206, W: 0.1488, b: 0.1162, lr: 0.00034483
+step: 58, loss: 0.0946, W: 0.1489, b: 0.1164, lr: 0.00033898
+step: 59, loss: 0.0711, W: 0.1495, b: 0.1167, lr: 0.00033333
+step: 60, loss: 0.0479, W: 0.1498, b: 0.1170, lr: 0.00032787
+step: 61, loss: 0.0178, W: 0.1501, b: 0.1173, lr: 0.00032258
+step: 62, loss: 0.0803, W: 0.1502, b: 0.1175, lr: 0.00031746
+step: 63, loss: 0.0873, W: 0.1505, b: 0.1178, lr: 0.00031250
+step: 64, loss: 0.0156, W: 0.1510, b: 0.1182, lr: 0.00030769
+step: 65, loss: 0.0731, W: 0.1512, b: 0.1183, lr: 0.00030303
+step: 66, loss: 0.0614, W: 0.1515, b: 0.1186, lr: 0.00029851
+step: 67, loss: 0.0588, W: 0.1517, b: 0.1189, lr: 0.00029412
+step: 68, loss: 0.0148, W: 0.1521, b: 0.1192, lr: 0.00028986
+step: 69, loss: 0.0342, W: 0.1522, b: 0.1193, lr: 0.00028571
+step: 70, loss: 0.1142, W: 0.1523, b: 0.1195, lr: 0.00028169
+step: 71, loss: 0.0376, W: 0.1525, b: 0.1199, lr: 0.00027778
+step: 72, loss: 0.1230, W: 0.1527, b: 0.1201, lr: 0.00027397
+step: 73, loss: 0.0077, W: 0.1531, b: 0.1205, lr: 0.00027027
+step: 74, loss: 0.0195, W: 0.1532, b: 0.1206, lr: 0.00026667
+step: 75, loss: 0.0897, W: 0.1533, b: 0.1208, lr: 0.00026316
+step: 76, loss: 0.0684, W: 0.1537, b: 0.1211, lr: 0.00025974
+step: 77, loss: 0.0452, W: 0.1539, b: 0.1214, lr: 0.00025641
+step: 78, loss: 0.0172, W: 0.1542, b: 0.1216, lr: 0.00025316
+step: 79, loss: 0.0771, W: 0.1542, b: 0.1217, lr: 0.00025000
+step: 80, loss: 0.0826, W: 0.1545, b: 0.1220, lr: 0.00024691
+step: 81, loss: 0.0146, W: 0.1549, b: 0.1223, lr: 0.00024390
+step: 82, loss: 0.0699, W: 0.1550, b: 0.1224, lr: 0.00024096
+step: 83, loss: 0.0592, W: 0.1553, b: 0.1227, lr: 0.00023810
+step: 84, loss: 0.0557, W: 0.1555, b: 0.1229, lr: 0.00023529
+step: 85, loss: 0.0142, W: 0.1558, b: 0.1232, lr: 0.00023256
diff --git a/tests/TensorFlowSharp.Tests.CSharp/TestData/RMSPropTimeDecay/optimizer_lr_test.py b/tests/TensorFlowSharp.Tests.CSharp/TestData/RMSPropTimeDecay/optimizer_lr_test.py
@@ -0,0 +1,39 @@
+# This script is used to create data file (expected.txt)
+# which is used to compare the output from TensorFlowSharp optimizer tests.
+
+import tensorflow as tf
+
+# Training data
+train_x =[
+    3.3, 4.4, 5.5, 6.71, 6.93, 4.168, 9.779, 6.182, 7.59, 2.167,
+    7.042, 10.791, 5.313, 7.997, 5.654, 9.27, 3.1
+]
+train_y = [
+    1.7, 2.76,2.09,3.19,1.694,1.573,3.366,2.596,2.53,1.221,
+        2.827,3.465,1.65,2.904,2.42,2.94,1.3
+]
+n_samples = len(train_x)
+X = tf.placeholder(tf.float32)
+Y = tf.placeholder(tf.float32)
+
+W = tf.Variable(tf.constant(0.1), dtype=tf.float32)
+b = tf.Variable(tf.constant(0.1), dtype=tf.float32)
+
+pred = tf.add(tf.multiply(X,W), b)
+
+global_step = tf.Variable(0, trainable=False)
+learning_rate = 0.01
+decay_rate = 0.5
+decayed_learning_rate = learning_rate * (1. / (1. + decay_rate * tf.cast(global_step, tf.float32)))
+
+cost = tf.divide(tf.reduce_sum(tf.pow(tf.subtract(pred, Y), 2.0)), tf.multiply(2.0, n_samples))
+optimizer = tf.train.RMSPropOptimizer(decayed_learning_rate, momentum=0.0,epsilon=1e-7).minimize(cost, global_step=global_step, name = "AdagradOptimizer")
+
+init = tf.global_variables_initializer()
+with tf.Session() as session:
+    session.run(init)
+    for e in range(5):
+        for i in range(n_samples):
+            _, cost_v, W_v, b_v, pred_v, lr_v, step_v = session.run([optimizer, cost, W, b, pred, decayed_learning_rate, global_step], feed_dict = {X: train_x[i], Y: train_y[i]})
+            print(f"step: {step_v:d}, loss: {cost_v:.4f}, W: {W_v:.4f}, b: {b_v:.4f}, lr: {lr_v:.8f}")
+            #print("Prediction: %f == Actual: %f" % (pred_v, train_y[i]))