Create blog48-01-cnn-dataset.py

eastmountyxz · web-flow · commit 44ca765007d8 · 2021-11-08T10:42:35.000+08:00
diff --git a/blog48-ArabImage/blog48-01-cnn-dataset.py b/blog48-ArabImage/blog48-01-cnn-dataset.py
@@ -0,0 +1,197 @@
+# -*- coding: utf-8 -*-
+"""
+Created on Wed Jul  7 18:54:36 2021
+@author: xiuzhang CSDN
+&#21442;&#32771;&#65306;&#21016;&#28070;&#26862;&#32769;&#24072;&#21338;&#23458; &#25512;&#33616;&#22823;&#23478;&#20851;&#27880; &#24456;&#21385;&#23475;&#30340;&#19968;&#20301;CV&#22823;&#20332;
+     https://maoli.blog.csdn.net/article/details/117688738
+"""
+import numpy as np
+import pandas as pd
+from IPython.display import display
+import csv
+from PIL import Image
+from scipy.ndimage import rotate
+
+#----------------------------------------------------------------
+#                      &#31532;&#19968;&#27493; &#35835;&#21462;&#25968;&#25454;
+#----------------------------------------------------------------
+#&#35757;&#32451;&#25968;&#25454;images&#21644;labels
+letters_training_images_file_path = "dataset/csvTrainImages 13440x1024.csv"
+letters_training_labels_file_path = "dataset/csvTrainLabel 13440x1.csv"
+#&#27979;&#35797;&#25968;&#25454;images&#21644;labels
+letters_testing_images_file_path = "dataset/csvTestImages 3360x1024.csv"
+letters_testing_labels_file_path = "dataset/csvTestLabel 3360x1.csv"
+
+#&#21152;&#36733;&#25968;&#25454;
+training_letters_images = pd.read_csv(letters_training_images_file_path, header=None)
+training_letters_labels = pd.read_csv(letters_training_labels_file_path, header=None)
+testing_letters_images = pd.read_csv(letters_testing_images_file_path, header=None)
+testing_letters_labels = pd.read_csv(letters_testing_labels_file_path, header=None)
+print("%d&#20010;32x32&#20687;&#32032;&#30340;&#35757;&#32451;&#38463;&#25289;&#20271;&#23383;&#27597;&#22270;&#20687;" % training_letters_images.shape[0])
+print("%d&#20010;32x32&#20687;&#32032;&#30340;&#27979;&#35797;&#38463;&#25289;&#20271;&#23383;&#27597;&#22270;&#20687;" % testing_letters_images.shape[0])
+print(training_letters_images.head())
+print(np.unique(training_letters_labels))
+
+
+#----------------------------------------------------------------
+#                      &#31532;&#20108;&#27493; &#25968;&#20540;&#36716;&#25442;&#20026;&#22270;&#20687;&#29305;&#24449;
+#----------------------------------------------------------------
+#&#21407;&#22987;&#25968;&#25454;&#38598;&#34987;&#21453;&#23556;&#20351;&#29992;np.flip&#32763;&#36716;&#23427; &#36890;&#36807;rotate&#26059;&#36716;&#20174;&#32780;&#33719;&#24471;&#26356;&#22909;&#30340;&#22270;&#20687;
+def convert_values_to_image(image_values, display=False):
+    #&#36716;&#25442;&#25104;32x32
+    image_array = np.asarray(image_values)
+    image_array = image_array.reshape(32,32).astype('uint8')
+    #&#32763;&#36716;+&#26059;&#36716;
+    image_array = np.flip(image_array, 0)
+    image_array = rotate(image_array, -90)
+    #&#22270;&#20687;&#26174;&#31034;
+    new_image = Image.fromarray(image_array)
+    if display == True:
+        new_image.show()
+    return new_image
+
+convert_values_to_image(training_letters_images.loc[0], True)
+
+
+#----------------------------------------------------------------
+#                      &#31532;&#19977;&#27493; &#22270;&#20687;&#26631;&#20934;&#21270;&#22788;&#29702;
+#----------------------------------------------------------------
+training_letters_images_scaled = training_letters_images.values.astype('float32')/255
+training_letters_labels = training_letters_labels.values.astype('int32')
+testing_letters_images_scaled = testing_letters_images.values.astype('float32')/255
+testing_letters_labels = testing_letters_labels.values.astype('int32')
+print("Training images of letters after scaling")
+print(training_letters_images_scaled.shape)
+print(training_letters_images_scaled[0:5])
+
+
+#----------------------------------------------------------------
+#                      &#31532;&#22235;&#27493; &#36755;&#20986;One-hot&#32534;&#30721;&#36716;&#25442;
+#----------------------------------------------------------------
+import keras
+from keras.utils import to_categorical
+number_of_classes = 28
+training_letters_labels_encoded = to_categorical(training_letters_labels-1, 
+                                                 num_classes=number_of_classes)
+testing_letters_labels_encoded = to_categorical(testing_letters_labels-1, 
+                                                num_classes=number_of_classes)
+print(training_letters_labels)
+print(training_letters_labels_encoded)
+print(training_letters_images_scaled.shape)
+# (13440, 1024)
+
+
+#----------------------------------------------------------------
+#                         &#31532;&#20116;&#27493; &#24418;&#29366;&#20462;&#25913;
+#----------------------------------------------------------------
+#&#36755;&#20837;&#24418;&#29366; 32x32x1
+training_letters_images_scaled = training_letters_images_scaled.reshape([-1, 32, 32, 1])
+testing_letters_images_scaled = testing_letters_images_scaled.reshape([-1, 32, 32, 1])
+print(training_letters_images_scaled.shape, 
+      training_letters_labels_encoded.shape, 
+      testing_letters_images_scaled.shape, 
+      testing_letters_labels_encoded.shape)
+# (13440, 32, 32, 1) (13440, 28) (3360, 32, 32, 1) (3360, 28)
+
+
+#----------------------------------------------------------------
+#                         &#31532;&#20845;&#27493; CNN&#27169;&#22411;&#35774;&#35745;
+#----------------------------------------------------------------
+from keras.models import Sequential
+from keras.layers import Conv2D, MaxPooling2D, GlobalAveragePooling2D, BatchNormalization, Dropout, Dense
+
+#&#23450;&#20041;&#27169;&#22411;
+def create_model(optimizer='adam', kernel_initializer='he_normal', activation='relu'):
+    #&#31532;&#19968;&#20010;&#21367;&#31215;&#23618;
+    model = Sequential()
+    model.add(Conv2D(filters=16, kernel_size=3, padding='same', input_shape=(32, 32, 1), kernel_initializer=kernel_initializer, activation=activation))
+    model.add(BatchNormalization())
+    model.add(MaxPooling2D(pool_size=2))
+    model.add(Dropout(0.2))
+    
+    #&#31532;&#20108;&#20010;&#21367;&#31215;&#23618;
+    model.add(Conv2D(filters=32, kernel_size=3, padding='same', kernel_initializer=kernel_initializer, activation=activation))
+    model.add(BatchNormalization())
+    model.add(MaxPooling2D(pool_size=2))
+    model.add(Dropout(0.2))
+    
+    #&#31532;&#19977;&#20010;&#21367;&#31215;&#23618;
+    model.add(Conv2D(filters=64, kernel_size=3, padding='same', kernel_initializer=kernel_initializer, activation=activation))
+    model.add(BatchNormalization())
+    model.add(MaxPooling2D(pool_size=2))
+    model.add(Dropout(0.2))
+    
+    #&#31532;&#22235;&#20010;&#21367;&#31215;&#23618;
+    model.add(Conv2D(filters=128, kernel_size=3, padding='same', kernel_initializer=kernel_initializer, activation=activation))
+    model.add(BatchNormalization())
+    model.add(MaxPooling2D(pool_size=2))
+    model.add(Dropout(0.2))
+    model.add(GlobalAveragePooling2D())
+
+    #&#20840;&#36830;&#25509;&#23618;&#36755;&#20986;28&#31867;&#32467;&#26524;
+    model.add(Dense(28, activation='softmax'))
+
+    #&#25439;&#22833;&#20989;&#25968;&#23450;&#20041;
+    model.compile(loss='categorical_crossentropy', metrics=['accuracy'], optimizer=optimizer)
+    return model
+
+#&#21019;&#24314;&#27169;&#22411;
+model = create_model(optimizer='Adam', kernel_initializer='uniform', activation='relu')
+model.summary()
+
+
+#----------------------------------------------------------------
+#                         &#31532;&#19971;&#27493; &#27169;&#22411;&#32472;&#21046;
+#----------------------------------------------------------------
+from keras.utils.vis_utils import plot_model
+from IPython.display import Image as IPythonImage
+
+plot_model(model, to_file="model.png", show_shapes=True)
+display(IPythonImage('model.png'))
+
+
+#----------------------------------------------------------------
+#                         &#31532;&#20843;&#27493; &#27169;&#22411;&#35757;&#32451;
+#----------------------------------------------------------------
+from keras.callbacks import ModelCheckpoint
+
+checkpointer = ModelCheckpoint(filepath='weights.hdf5', 
+                               verbose=1, 
+                               save_best_only=True)
+history = model.fit(training_letters_images_scaled, 
+                    training_letters_labels_encoded,
+                    validation_data=(testing_letters_images_scaled,
+                                     testing_letters_labels_encoded),
+                    epochs=15, 
+                    batch_size=20, 
+                    verbose=1, 
+                    callbacks=[checkpointer])
+print(history)
+
+#----------------------------------------------------------------
+#                         &#31532;&#20061;&#27493; &#32472;&#21046;&#22270;&#24418;
+#----------------------------------------------------------------
+import matplotlib.pyplot as plt
+
+def plot_loss_accuracy(history):
+    # Loss 
+    plt.figure(figsize=[8,6])
+    plt.plot(history.history['loss'],'r',linewidth=3.0)
+    plt.plot(history.history['val_loss'],'b',linewidth=3.0)
+    plt.legend(['Training loss', 'Validation Loss'],fontsize=18)
+    plt.xlabel('Epochs ',fontsize=16)
+    plt.ylabel('Loss',fontsize=16)
+    plt.title('Loss Curves',fontsize=16)
+
+    # Accuracy 
+    plt.figure(figsize=[8,6])
+    plt.plot(history.history['accuracy'],'r',linewidth=3.0)
+    plt.plot(history.history['val_accuracy'],'b',linewidth=3.0)
+    plt.legend(['Training Accuracy', 'Validation Accuracy'],fontsize=18)
+    plt.xlabel('Epochs ',fontsize=16)
+    plt.ylabel('Accuracy',fontsize=16)
+    plt.title('Accuracy Curves',fontsize=16) 
+
+plot_loss_accuracy(history)
+
+