Add files via upload

eastmountyxz · web-flow · commit 2ceae9acbb6d · 2021-11-08T10:43:20.000+08:00
diff --git a/blog48-ArabImage/blog48-03-best-cnn-dataset.py b/blog48-ArabImage/blog48-03-best-cnn-dataset.py
@@ -0,0 +1,275 @@
+# -*- coding: utf-8 -*-
+"""
+Created on Wed Jul  7 18:54:36 2021
+@author: xiuzhang CSDN
+&#21442;&#32771;&#65306;&#21016;&#28070;&#26862;&#32769;&#24072;&#21338;&#23458; &#25512;&#33616;&#22823;&#23478;&#20851;&#27880; &#24456;&#21385;&#23475;&#30340;&#19968;&#20301;CV&#22823;&#20332;
+     https://maoli.blog.csdn.net/article/details/117688738
+"""
+import numpy as np
+import pandas as pd
+from IPython.display import display
+import csv
+from PIL import Image
+from scipy.ndimage import rotate
+
+#----------------------------------------------------------------
+#                      &#31532;&#19968;&#27493; &#35835;&#21462;&#25968;&#25454;
+#----------------------------------------------------------------
+#&#35757;&#32451;&#25968;&#25454;images&#21644;labels
+letters_training_images_file_path = "dataset/csvTrainImages 13440x1024.csv"
+letters_training_labels_file_path = "dataset/csvTrainLabel 13440x1.csv"
+#&#27979;&#35797;&#25968;&#25454;images&#21644;labels
+letters_testing_images_file_path = "dataset/csvTestImages 3360x1024.csv"
+letters_testing_labels_file_path = "dataset/csvTestLabel 3360x1.csv"
+
+#&#21152;&#36733;&#25968;&#25454;
+training_letters_images = pd.read_csv(letters_training_images_file_path, header=None)
+training_letters_labels = pd.read_csv(letters_training_labels_file_path, header=None)
+testing_letters_images = pd.read_csv(letters_testing_images_file_path, header=None)
+testing_letters_labels = pd.read_csv(letters_testing_labels_file_path, header=None)
+print("%d&#20010;32x32&#20687;&#32032;&#30340;&#35757;&#32451;&#38463;&#25289;&#20271;&#23383;&#27597;&#22270;&#20687;" % training_letters_images.shape[0])
+print("%d&#20010;32x32&#20687;&#32032;&#30340;&#27979;&#35797;&#38463;&#25289;&#20271;&#23383;&#27597;&#22270;&#20687;" % testing_letters_images.shape[0])
+print(training_letters_images.head())
+print(np.unique(training_letters_labels))
+
+
+#----------------------------------------------------------------
+#                      &#31532;&#20108;&#27493; &#25968;&#20540;&#36716;&#25442;&#20026;&#22270;&#20687;&#29305;&#24449;
+#----------------------------------------------------------------
+#&#21407;&#22987;&#25968;&#25454;&#38598;&#34987;&#21453;&#23556;&#20351;&#29992;np.flip&#32763;&#36716;&#23427; &#36890;&#36807;rotate&#26059;&#36716;&#20174;&#32780;&#33719;&#24471;&#26356;&#22909;&#30340;&#22270;&#20687;
+def convert_values_to_image(image_values, display=False):
+    #&#36716;&#25442;&#25104;32x32
+    image_array = np.asarray(image_values)
+    image_array = image_array.reshape(32,32).astype('uint8')
+    #&#32763;&#36716;+&#26059;&#36716;
+    image_array = np.flip(image_array, 0)
+    image_array = rotate(image_array, -90)
+    #&#22270;&#20687;&#26174;&#31034;
+    new_image = Image.fromarray(image_array)
+    if display == True:
+        new_image.show()
+    return new_image
+
+#convert_values_to_image(training_letters_images.loc[0], True)
+
+
+#----------------------------------------------------------------
+#                      &#31532;&#19977;&#27493; &#22270;&#20687;&#26631;&#20934;&#21270;&#22788;&#29702;
+#----------------------------------------------------------------
+training_letters_images_scaled = training_letters_images.values.astype('float32')/255
+training_letters_labels = training_letters_labels.values.astype('int32')
+testing_letters_images_scaled = testing_letters_images.values.astype('float32')/255
+testing_letters_labels = testing_letters_labels.values.astype('int32')
+print("Training images of letters after scaling")
+print(training_letters_images_scaled.shape)
+print(training_letters_images_scaled[0:5])
+
+
+#----------------------------------------------------------------
+#                      &#31532;&#22235;&#27493; &#36755;&#20986;One-hot&#32534;&#30721;&#36716;&#25442;
+#----------------------------------------------------------------
+import keras
+from keras.utils import to_categorical
+number_of_classes = 28
+training_letters_labels_encoded = to_categorical(training_letters_labels-1, 
+                                                 num_classes=number_of_classes)
+testing_letters_labels_encoded = to_categorical(testing_letters_labels-1, 
+                                                num_classes=number_of_classes)
+print(training_letters_labels)
+print(training_letters_labels_encoded)
+print(training_letters_images_scaled.shape)
+# (13440, 1024)
+
+
+#----------------------------------------------------------------
+#                         &#31532;&#20116;&#27493; &#24418;&#29366;&#20462;&#25913;
+#----------------------------------------------------------------
+#&#36755;&#20837;&#24418;&#29366; 32x32x1
+training_letters_images_scaled = training_letters_images_scaled.reshape([-1, 32, 32, 1])
+testing_letters_images_scaled = testing_letters_images_scaled.reshape([-1, 32, 32, 1])
+print(training_letters_images_scaled.shape, 
+      training_letters_labels_encoded.shape, 
+      testing_letters_images_scaled.shape, 
+      testing_letters_labels_encoded.shape)
+# (13440, 32, 32, 1) (13440, 28) (3360, 32, 32, 1) (3360, 28)
+
+
+#----------------------------------------------------------------
+#                         &#31532;&#20845;&#27493; CNN&#27169;&#22411;&#35774;&#35745;
+#----------------------------------------------------------------
+from keras.models import Sequential
+from keras.layers import Conv2D, MaxPooling2D, GlobalAveragePooling2D, BatchNormalization, Dropout, Dense
+
+#&#23450;&#20041;&#27169;&#22411;
+def create_model(optimizer='adam', kernel_initializer='he_normal', activation='relu'):
+    #&#31532;&#19968;&#20010;&#21367;&#31215;&#23618;
+    model = Sequential()
+    model.add(Conv2D(filters=16, kernel_size=3, padding='same', input_shape=(32, 32, 1), kernel_initializer=kernel_initializer, activation=activation))
+    model.add(BatchNormalization())
+    model.add(MaxPooling2D(pool_size=2))
+    model.add(Dropout(0.2))
+    
+    #&#31532;&#20108;&#20010;&#21367;&#31215;&#23618;
+    model.add(Conv2D(filters=32, kernel_size=3, padding='same', kernel_initializer=kernel_initializer, activation=activation))
+    model.add(BatchNormalization())
+    model.add(MaxPooling2D(pool_size=2))
+    model.add(Dropout(0.2))
+    
+    #&#31532;&#19977;&#20010;&#21367;&#31215;&#23618;
+    model.add(Conv2D(filters=64, kernel_size=3, padding='same', kernel_initializer=kernel_initializer, activation=activation))
+    model.add(BatchNormalization())
+    model.add(MaxPooling2D(pool_size=2))
+    model.add(Dropout(0.2))
+    
+    #&#31532;&#22235;&#20010;&#21367;&#31215;&#23618;
+    model.add(Conv2D(filters=128, kernel_size=3, padding='same', kernel_initializer=kernel_initializer, activation=activation))
+    model.add(BatchNormalization())
+    model.add(MaxPooling2D(pool_size=2))
+    model.add(Dropout(0.2))
+    model.add(GlobalAveragePooling2D())
+
+    #&#20840;&#36830;&#25509;&#23618;&#36755;&#20986;28&#31867;&#32467;&#26524;
+    model.add(Dense(28, activation='softmax'))
+
+    #&#25439;&#22833;&#20989;&#25968;&#23450;&#20041;
+    model.compile(loss='categorical_crossentropy', metrics=['accuracy'], optimizer=optimizer)
+    return model
+
+#&#21019;&#24314;&#27169;&#22411;
+model = create_model(optimizer='Adam', kernel_initializer='uniform', activation='relu')
+model.summary()
+
+
+#----------------------------------------------------------------
+#                         &#31532;&#19971;&#27493; &#27169;&#22411;&#32472;&#21046;
+#----------------------------------------------------------------
+from keras.utils.vis_utils import plot_model
+from IPython.display import Image as IPythonImage
+
+plot_model(model, to_file="model.png", show_shapes=True)
+display(IPythonImage('model.png'))
+
+
+#----------------------------------------------------------------
+#                         &#31532;&#20843;&#27493; &#27169;&#22411;&#35757;&#32451;+&#36755;&#20986;&#32467;&#26524;
+#----------------------------------------------------------------
+from keras.callbacks import ModelCheckpoint
+from sklearn.metrics import classification_report
+import matplotlib.pyplot as plt
+
+#&#32472;&#21046;&#22270;&#24418;
+def plot_loss_accuracy(history):
+    # Loss 
+    plt.figure(figsize=[8,6])
+    plt.plot(history.history['loss'],'r',linewidth=3.0)
+    plt.plot(history.history['val_loss'],'b',linewidth=3.0)
+    plt.legend(['Training loss', 'Validation Loss'],fontsize=18)
+    plt.xlabel('Epochs ',fontsize=16)
+    plt.ylabel('Loss',fontsize=16)
+    plt.title('Loss Curves',fontsize=16)
+
+    # Accuracy 
+    plt.figure(figsize=[8,6])
+    plt.plot(history.history['accuracy'],'r',linewidth=3.0)
+    plt.plot(history.history['val_accuracy'],'b',linewidth=3.0)
+    plt.legend(['Training Accuracy', 'Validation Accuracy'],fontsize=18)
+    plt.xlabel('Epochs ',fontsize=16)
+    plt.ylabel('Accuracy',fontsize=16)
+    plt.title('Accuracy Curves',fontsize=16) 
+
+#&#28151;&#28102;&#30697;&#38453;
+def get_predicted_classes(model, data, labels=None):
+    image_predictions = model.predict(data)
+    predicted_classes = np.argmax(image_predictions, axis=1)
+    true_classes = np.argmax(labels, axis=1)
+    return predicted_classes, true_classes, image_predictions
+
+def get_classification_report(y_true, y_pred):
+    print(classification_report(y_true, y_pred, digits=4)) #&#23567;&#25968;&#28857;4&#20301;
+
+checkpointer = ModelCheckpoint(filepath='weights.hdf5', 
+                               verbose=1, 
+                               save_best_only=True)
+flag = "test" 
+if flag=="train":
+    history = model.fit(training_letters_images_scaled, 
+                        training_letters_labels_encoded,
+                        validation_data=(testing_letters_images_scaled,
+                                         testing_letters_labels_encoded),
+                        epochs=20, 
+                        batch_size=128, 
+                        verbose=1, 
+                        callbacks=[checkpointer])
+    print(history)
+    plot_loss_accuracy(history)
+else:
+    #&#21152;&#36733;&#20855;&#26377;&#26368;&#20339;&#39564;&#35777;&#25439;&#22833;&#30340;&#27169;&#22411;
+    model.load_weights('weights.hdf5')
+    metrics_ = model.evaluate(testing_letters_images_scaled, 
+                             testing_letters_labels_encoded, 
+                             verbose=1)
+    print("Test Accuracy: {}".format(metrics_[1]))
+    print("Test Loss: {}".format(metrics_[0]))
+    
+    y_pre_test, y_true, image_predictions = get_predicted_classes(model, 
+                                                              testing_letters_images_scaled, 
+                                                              testing_letters_labels_encoded)
+    get_classification_report(y_true, y_pre_test)
+
+    #----------------------------------------------------------------
+    #                         &#31532;&#20061;&#27493; &#32472;&#21046;&#27979;&#35797;&#22270;&#20687;
+    #----------------------------------------------------------------
+    
+    
+    plt.rcParams['font.sans-serif']=['SimHei']  #&#29992;&#26469;&#27491;&#24120;&#26174;&#31034;&#20013;&#25991;&#26631;&#31614;
+    plt.rcParams['axes.unicode_minus']=False    #&#29992;&#26469;&#27491;&#24120;&#26174;&#31034;&#36127;&#21495;
+
+
+    fig = plt.figure(0, figsize=(14,14))
+    indices = np.random.randint(0, testing_letters_labels.shape[0], size=42)
+    y_pred = np.argmax(model.predict(training_letters_images_scaled), axis=1)
+    
+    for i, idx in enumerate(indices):
+        plt.subplot(7,6,i+1)
+            
+        image_array = training_letters_images_scaled[idx][:,:,0]
+        image_array = np.flip(image_array, 0)
+        image_array = rotate(image_array, -90)
+           
+        plt.imshow(image_array, cmap='gray')
+        plt.title("&#39044;&#27979;:{} &#30495;&#23454;:{}".format(y_pred[idx], 
+                  (training_letters_labels[idx] -1)))
+        plt.xticks([])
+        plt.yticks([])
+    plt.show()
+    plt.savefig("resutl.png", dpi=300)
+    
+    ## &#35780;&#20215;&#39044;&#27979;&#25928;&#26524;&#65292;&#35745;&#31639;&#28151;&#28102;&#30697;&#38453;
+    import seaborn as sns
+    from sklearn import metrics
+    
+    Labname = [1,2,3,4,5,6,7,8,9,10,11,12,13,14,
+               15,16,17,18,19,20,21,22,23,24,25,26,27,28]
+    print(y_pre_test)
+    y_pre_test = [num+1 for num in y_pre_test]
+    print(np.argmax(testing_letters_labels,axis=1))
+    confm = metrics.confusion_matrix(testing_letters_labels,
+                                     y_pre_test)
+    print(confm.T)
+    
+    plt.figure(figsize=(10,10))
+    heatmap = sns.heatmap(confm.T, square=True, annot=True,
+                fmt='d', cbar=True, linewidths=.6,
+                cmap="YlGnBu")
+    bottom, top = heatmap.get_ylim()
+    heatmap.set_ylim(bottom + 0.5, top - 0.5)
+    plt.xlabel('True label',size = 12)
+    plt.ylabel('Predicted label', size = 12)
+    #plt.xticks(np.arange(28)+0.5, Labname, size = 10)
+    #plt.yticks(np.arange(28)+0.5, Labname, size = 10)
+    plt.savefig('headmap.png', dpi=300)
+    plt.show()
+    
+
+
+