Σε αυτό το μέρος, πραγματοποιείται η προτεινόμενη μέθοδος αντιστάθμισης μετατόπισης αισθητήρα και συζητείται η απόδοσή της σύμφωνα με τα αποτελέσματα του SVM. Ο μήνας 1 ορίζεται ως σημείο αναφοράς, το οποίο θεωρείται ως μη μετατόπιση. Ο στόχος της μεθόδου αντιστάθμισης μετατόπισης είναι να κάνει τα χαρακτηριστικά των χαρακτηριστικών άλλων μηνών παρόμοια με αυτά του μήνα 1.
Τα δεδομένα που αναλύθηκαν σε αυτή τη μελέτη είναι: οκτώ σταθερά χαρακτηριστικά και είκοσι τέσσερα παροδικά χαρακτηριστικά συνολικά, τα οποία εξάγονται από οκτώ καμπύλες απόκρισης αισθητήρα για την αναπαράσταση ενός δείγματος. Με βάση την Εξ. (1)–(3), οκτώ χαρακτηριστικά σταθερής κατάστασης αντισταθμίζονται και εφαρμόζονται για ανάλυση ταξινόμησης. Συγκρίνονται είκοσι τέσσερα μεταβατικά χαρακτηριστικά και οκτώ από αυτά επιλέγονται ως βοηθητικά δεδομένα για την αντιστάθμιση μετατόπισης.
Μέθοδος αντιστάθμισης μετατόπισης αισθητήρα
Εξαγωγή και επιλογή χαρακτηριστικών
Όπως περιγράφηκε παραπάνω, τέσσερα χαρακτηριστικά εξάγονται από μία καμπύλη απόκρισης αισθητήρα σύμφωνα με την Εξ. (1) έως (3). Η τιμή σταθερής κατάστασης ορίζεται ως Χαρακτηριστικό 1. Τρεις μεταβατικές τιμές συγκρίνονται και επιλέγονται με βάση τις συσχετίσεις τους με το Χαρακτηριστικό 1 και η επιλεγμένη ορίζεται ως Χαρακτηριστικό 2. Όλα τα δείγματα χρησιμοποιούνται για την επιλογή χαρακτηριστικών. Τα διαγράμματα διασποράς του Χαρακτηριστικού 1 και άλλων τριών χαρακτηριστικών φαίνονται στο Σχ. 2.
Η γραμμική συσχέτιση οδηγεί σε λιγότερο σύνθετους υπολογισμούς και εμφανίζει ένα πιο εμφανές οπτικό αποτέλεσμα. Ως εκ τούτου, εφαρμόζεται κατά προτίμηση για την επιλογή του κατάλληλου Χαρακτηριστικού 2. Όπως φαίνεται στα Σχ. 2α, β και γ, όλα τα διαγράμματα εμφανίζουν ισχυρή συσχέτιση, η οποία αποδεικνύει την ορθότητα της γραμμικής σχέσης αυτών των δύο χαρακτηριστικών.
Τα σχήματα 2a, b και c είναι η γραμμική σχέση του Χαρακτηριστικού 1 και τριών μεταβατικών χαρακτηριστικών με 0,001, 0,01 και 0,1 παραμέτρου κλιμάκωσης, αντίστοιχα. Οι συντελεστές συσχέτισης προσαρμογής (R2) και το ριζικό μέσο τετραγωνικό σφάλμα (RMSE) χρησιμοποιούνται για να αντικατοπτρίζουν την απόδοση προσαρμογής τους. Σύμφωνα με το Σχ. 2, το Σχήμα 2α έχει την καλύτερη απόδοση προσαρμογής, του οποίου το τυπικό σφάλμα είναι 0,06736, R2 είναι 0,9951. Αντίθετα, το Σχ. 2γ έχει τη χειρότερη απόδοση προσαρμογής. Ο λόγος μπορεί να είναι ότι η αύξηση της παραμέτρου κλιμάκωσης \(\άλφα\) , περιλαμβάνει περισσότερη αβεβαιότητα, γεγονός που κάνει τα δεδομένα να παρουσιάζουν μεγαλύτερες διακυμάνσεις. Ωστόσο, η μικρότερη παράμετρος κλιμάκωσης σημαίνει υψηλότερο υπολογιστικό κόστος. Για το Σχ. 2β, το τυπικό του σφάλμα είναι 0,1348 και το R2 είναι 0,9918, το οποίο είναι λίγο χειρότερο από αυτό του Σχ. 2α και δείχνει επίσης καλή απόδοση προσαρμογής. Ως εκ τούτου, λαμβάνοντας υπόψη τόσο την απόδοση προσαρμογής όσο και το σύμπλεγμα υπολογισμού, το χαρακτηριστικό με 0,01 της παραμέτρου κλιμάκωσης επιλέγεται και ορίζεται ως Χαρακτηριστικό 2.
Υπολογισμός του Α και
\(B(k)\)
Τα αποτελέσματα του Σχ. 2 εμφανίζουν ολόκληρη τη σχέση του Χαρακτηριστικού 1 και του Χαρακτηριστικού 2. Σε αυτό το μέρος, οι σχέσεις τους για διαφορετικούς μήνες και τους αισθητήρες συζητούνται λεπτομερώς. R2 και RMSE χρησιμοποιούνται ξανά και οι τιμές τους εμφανίζονται στους Πίνακες 3 και 4, αντίστοιχα. Οι τιμές του RMSE έχουν κανονικοποιηθεί, καθιστώντας τα συγκρίσιμα.
Η απόδοση προσαρμογής του μήνα 1 είναι ο πιο σημαντικός δείκτης για το λόγο ότι είναι ο στόχος αντιστάθμισης μετατόπισης. Σύμφωνα με τον Πίνακα 3, οι τιμές του R2 του μήνα 1 είναι όλα υψηλότερα από 0,86, που υποδηλώνει καλή συσχέτιση και ότι η παράμετρος Α είναι σε θέση να αντικατοπτρίζει το χαρακτηριστικό της απόκρισης σήματος αισθητήρα του Μήνα1. Επιπλέον, οι τιμές του R2 είναι όλα αποδεκτά, γεγονός που αποδεικνύει και πάλι την ορθότητα της γραμμικής συσχέτισης δύο χαρακτηριστικών. Σύμφωνα με τον Πίνακα 4, οι τιμές του RMSE του μήνα 1 είναι όλες μικρότερες από 0,12, πράγμα που σημαίνει καλή απόδοση προσαρμογής. Για όλες τις τιμές στον Πίνακα 4, το μεγαλύτερο μέρος του RMSE είναι μικρότερο από 0,15, γεγονός που αποδεικνύει επίσης την ύπαρξη γραμμικής συσχέτισης δύο χαρακτηριστικών.
Από την άλλη πλευρά, με βάση τους Πίνακες 3 και 4, η απόδοση του Μήνα 1 είναι η καλύτερη. Για άλλους μήνες, οι τιμές του R2 και το RMSE παρουσιάζουν διακυμάνσεις και οι περισσότερες από τις αποδόσεις προσαρμογής τους είναι χειρότερες από αυτές του Μήνα 1. Ο λόγος μπορεί να είναι παράγοντες περιβάλλοντος και συστήματος μέτρησης, των οποίων η αβεβαιότητα κάνει τη μετατόπιση του αισθητήρα να παρουσιάζει διακυμάνσεις.
Σύμφωνα με την παραπάνω περιγραφή, η σχέση του Χαρακτηριστικού 1 και του Χαρακτηριστικού 2 υπάρχει. Επιπλέον, οι σχέσεις τους για διαφορετικούς μήνες και οι αισθητήρες είναι διαφορετικοί, πράγμα που σημαίνει ότι θα μπορούσε να ληφθεί ως χαρακτηριστικό για την αντιστάθμιση drift. Όπως περιγράφεται στην «Λήψη δεδομένων», επιλέγονται και εφαρμόζονται 25 δείγματα κάθε μήνα και αέριο για τις παραμέτρους Α και \(B(k)\)υπολογισμός.
Η παράμετρος Α αντικατοπτρίζει τη σχέση δύο χαρακτηριστικών του ίδιου αισθητήρα. Οι τιμές της παραμέτρου Α με διαφορετικούς αισθητήρες και μήνες υπολογίζονται από την Εξ. (4) και παρουσιάζεται για άμεση εμφάνιση φαινομένων μετατόπισης και ανάλυση του κανόνα μετατόπισης του αισθητήρα. Οι τάσεις τους με διαφορετικούς μήνες και αισθητήρες φαίνονται στο Σχ. 3 παρακάτω.
Όπως φαίνεται στο Σχ. 3, οι τάσεις της παραμέτρου Α για όλους τους αισθητήρες είναι παρόμοιες, γεγονός που αντανακλά την ομοιότητα των φαινομένων μετατόπισης. Επιπλέον, η τιμή της παραμέτρου Α αυξάνεται πρώτα, μετά αυξομειώνεται και τέλος μειώνεται. Για τους πρώτους μήνες, η μετατόπιση του αισθητήρα μπορεί να επηρεαστεί τόσο από την πραγματική μετατόπιση όσο και από τη μετατόπιση του συστήματος μέτρησης, η οποία προκαλεί αβεβαιότητα και απρόβλεπτο. Ως εκ τούτου, οι τιμές της παραμέτρου Α κυμαίνονται κατά τη διάρκεια αυτής της περιόδου. Στη συνέχεια, η μετατόπιση που προκαλείται από την πραγματική μετατόπιση κυριαρχείται με την πάροδο του χρόνου, η οποία έχει μια ορισμένη τάση και οδηγεί στη μείωση της τιμής της παραμέτρου Α. Τα αποτελέσματα δείχνουν ότι όλοι οι αισθητήρες έχουν παρόμοιο κανόνα ολίσθησης και η παράμετρος Α είναι μια κατάλληλη παράμετρος που το δείχνει.
\(B(k)\) , το οποίο αντικατοπτρίζει τη σχέση του Χαρακτηριστικού 1 του Μήνα 1 και άλλων μηνών, είναι μια άλλη σημαντική παράμετρος για την αντιστάθμιση μετατόπισης και χρησιμοποιείται για την κρίση του βαθμού μετατόπισης. Οι τάσεις της αξίας του \(B(k)\) με διαφορετικούς αισθητήρες και μήνες που φαίνονται στο Σχ. 4 παρακάτω.
Όπως φαίνεται στο Σχ. 4, οι τάσεις του \(B(k)\) για όλους τους αισθητήρες είναι επίσης παρόμοιοι. Αυξάνεται πρώτα και μετά γίνεται σταθερό. Επιπλέον, η αξία του \(B(k)\)κατά τη διάρκεια του μήνα 14 έως 20 μειώνεται σημαντικά, γεγονός που αυξάνει τη δυσκολία αντιστάθμισης μετατόπισης. Ο λόγος αυτού του κανόνα τάσης είναι παρόμοιος με αυτόν της παραμέτρου Α. Τα αποτελέσματα δείχνουν ότι όλοι οι αισθητήρες έχουν παρόμοιο μοτίβο μετατόπισης και θα μπορούσαν να αντισταθμίσουν χρησιμοποιώντας μία μέθοδο.
Αποζημίωση drift
Σύμφωνα με την παραπάνω περιγραφή, παρουσιάζονται οι σχέσεις μεταξύ δύο χαρακτηριστικών του μήνα 1, 4, 14, 16, 20, 22 και 36. Οι τιμές των παραμέτρων Α και \(B(k)\)είναι δεδομένα. Στη συνέχεια, η αξία του \(Τελικό(1)(ι)(κ)\)υπολογίζεται σύμφωνα με την Εξ. (6)–(11) και τα χαρακτηριστικά αντιστάθμισης μετατόπισης για όλα τα δείγματα αποκτώνται εύκολα.
Σε αυτό το μέρος, παρουσιάζονται ως παράδειγμα τα χαρακτηριστικά των αρχικών και αντισταθμισμένων χαρακτηριστικών του αισθητήρα 1 που ανιχνεύει αέρια αιθανόλη τον μήνα 14 και οι τιμές τους συγκρίνονται με αυτές του μήνα 1. Επιπλέον, υπολογίζεται ο μέσος όρος και το τυπικό σφάλμα τους.
Τα αποτελέσματα δείχνουν ότι ο μέσος όρος των αρχικών χαρακτηριστικών του μήνα 14 είναι 5537,32 και το τυπικό σφάλμα είναι 2270,74. Μετά την αντιστάθμιση drift, η μέση τιμή του γίνεται 10.599,53 και το τυπικό σφάλμα είναι 5740,68. Συγκριτικά, η μέση τιμή του μήνα 1 είναι 11.149,45 και το τυπικό σφάλμα είναι 5102,03, τα οποία είναι παρόμοια με αυτά του συνόλου δεδομένων μετά την αντιστάθμιση μετατόπισης. Τα αποτελέσματα αποδεικνύουν την επίδραση της μεθόδου αντιστάθμισης μετατόπισης που προτείνεται σε αυτή τη μελέτη.
Επιπλέον, τα χαρακτηριστικά αντιστάθμισης μετατόπισης άλλων μηνών έχουν επίσης παρόμοια χαρακτηριστικά, γεγονός που δείχνει ότι η μέθοδος αντιστάθμισης μετατόπισης που προτείνεται σε αυτή τη μελέτη είναι αξιόπιστη με υψηλή πιθανότητα.
SVM
Το χαρακτηριστικό 1 όλων των αισθητήρων και των δειγμάτων αντισταθμίζεται με βάση την παραπάνω διαδικασία. Στη συνέχεια, εφαρμόζεται SVM και συγκρίνονται οι επιδόσεις ταξινόμησης του αρχικού συνόλου δεδομένων και των δεδομένων με αντιστάθμιση μετατόπισης για να αποδειχθεί η επίδραση της μεθόδου αντιστάθμισης μετατόπισης.
Για το SVM, επιλέχθηκαν 180 δείγματα (60 δείγματα για αιθανόλη, αιθυλένιο και αέρα υποβάθρου, αντίστοιχα) του Μήνα 1 και εφαρμόστηκαν για το μοντέλο ταξινόμησης κτιρίων για το λόγο ότι τα δεδομένα του μήνα 1 ήταν το σημείο αναφοράς χωρίς μετατόπιση. Ο ίδιος αριθμός δειγμάτων κάθε ομάδας βοήθησε στην εξισορρόπηση της σημασίας κάθε ομάδας και στη βελτίωση της απόδοσης ταξινόμησης του μοντέλου SVM. Η συνάρτηση πυρήνα ορίστηκε ως συνάρτηση ακτινικής βάσης. Για την απόκτηση του βέλτιστου μοντέλου SVM, δύο παράμετροι, η παράμετρος ποινής c και η παράμετρος πυρήνα g, βελτιστοποιήθηκαν μέσω της μεθόδου αναζήτησης πλέγματος με την αύξηση των c και g σε διάστημα 2,5 για τη λήψη των καλύτερων c και g. Εφαρμόστηκε πενταπλάσια διασταυρούμενη επικύρωση για την εκτίμηση της απόδοσης κάθε παραμέτρου και επιλέχθηκαν οι παράμετροι με την καλύτερη ακρίβεια διασταυρούμενης επικύρωσης. Το Σχήμα 5 δείχνει την απόδοση του SVM με διαφορετικούς συνδυασμούς c και g. Όπως φαίνεται στο Σχ. 5, το 100% του σωστού ποσοστού ταξινόμησης προκύπτει όταν c = 0,1768 και g = 32, τα οποία επομένως εφαρμόζονται για τη διαδικασία δοκιμής.
Στη συνέχεια, το SVM που χτίστηκε στην προηγούμενη πρόταση εφαρμόστηκε για ταξινόμηση και συμπεριλήφθηκαν τα συνολικά δείγματα που εμφανίζονται στον Πίνακα 2. Ο Πίνακας 5 παρουσιάζει τα αποτελέσματα του SVM με βάση το αρχικό σύνολο δεδομένων και δεδομένων μετά την αντιστάθμιση.
Όπως φαίνεται στον Πίνακα 5, τα σωστά ποσοστά ταξινόμησης του συνόλου δεδομένων του μήνα 1 είναι και τα δύο 100%, γεγονός που δείχνει ότι το SVM έχει καλή απόδοση ταξινόμησης και αποδεικνύει την επίδραση του SVM. Για άλλους μήνες, τα αρχικά δεδομένα θα μπορούσαν να θεωρηθούν ως παρασυρόμενα, των οποίων τα σωστά ποσοστά ταξινόμησης είναι όλα χαμηλότερα από αυτά του μήνα 1. Από την άλλη πλευρά, τα αποτελέσματα δείχνουν ότι οι επιδόσεις ταξινόμησης των αντισταθμιζόμενων δεδομένων είναι καλύτερες από αυτές των αρχικών δεδομένων για όλους τους μήνες, γεγονός που υποδεικνύει την επίδραση αυτής της μεθόδου αντιστάθμισης μετατόπισης.
Αναλυτικά, για τα αρχικά δεδομένα, τα σωστά ποσοστά ταξινόμησης μειώνονται όσο περνάει ο χρόνος συνολικά. Ο λόγος μπορεί να είναι ότι το φαινόμενο drift γίνεται όλο και πιο εμφανές, με αποτέλεσμα το μοντέλο SVM να χάνει σταδιακά την αποτελεσματικότητά του και να οδηγεί στη μείωση του σωστού ρυθμού ταξινόμησής του. Για τον μήνα 20, το σωστό ποσοστό ταξινόμησής του είναι 56,04%, το οποίο έχει καταστεί σχεδόν άχρηστο για την ταξινόμηση των αρχικών δεδομένων. Για τα αντισταθμισμένα δεδομένα, το σωστό ποσοστό ταξινόμησης λαμβάνει πάνω από 20% αύξηση σε σύγκριση με αυτό των αρχικών δεδομένων εκτός του Μήνα 36 και ο μέσος όρος αυτών φτάνει στο 89,78%, γεγονός που αντικατοπτρίζει την καλή απόδοση της μεθόδου αντιστάθμισης drift. Ωστόσο, ο σωστός ρυθμός ταξινόμησης μειώνεται επίσης με την πάροδο του χρόνου, γεγονός που δείχνει ότι ο βαθμός μετατόπισης θα μπορούσε να επηρεάσει την απόδοση της μεθόδου αντιστάθμισης μετατόπισης και αυτή η επιρροή έγινε μεγαλύτερη με την πάροδο του χρόνου.
Όσον αφορά ορισμένους μήνες, τα σωστά ποσοστά ταξινόμησης του μήνα 20 και 22 είναι χαμηλά για τα αρχικά δεδομένα. Αντίθετα, η αξία του \(B(k)\), η οποία είναι η κύρια παράμετρος για την αντιστάθμιση μετατόπισης, μειώνεται επίσης γρήγορα κατά τη διάρκεια αυτής της περιόδου όπως φαίνεται στο Σχ. 4. Επομένως, ο λόγος για κακά αποτελέσματα μπορεί να είναι ότι ο βαθμός μετατόπισης των αρχικών δεδομένων του μήνα 20 και 22 υπερβαίνει το όριο του SVM μοντέλο. Από την άλλη πλευρά, για τα αντισταθμισμένα δεδομένα, τα σωστά ποσοστά ταξινόμησης είναι και τα δύο αποδεκτά, γεγονός που αποδεικνύει ότι η μέθοδος αντιστάθμισης μετατόπισης εξακολουθεί να εφαρμόζεται τον μήνα 22. Για τον μήνα 36, το σωστό ποσοστό ταξινόμησης των αντισταθμιζόμενων δεδομένων είναι λίγο υψηλότερο από αυτό του αρχικά δεδομένα, τα οποία υποδεικνύουν την κακή επίδραση και ότι η μέθοδος αντιστάθμισης μετατόπισης δεν λειτουργεί καλά.
Σύμφωνα με την παραπάνω συζήτηση, η μέθοδος αντιστάθμισης μετατόπισης που προτείνεται σε αυτή τη μελέτη είναι αποτελεσματική όταν ο χρόνος συνεχούς παρακολούθησης είναι μικρότερος από 22 μήνες, ο οποίος ήταν αρκετός για τα περισσότερα σενάρια εφαρμογής. Ως εκ τούτου, η μέθοδος αντιστάθμισης μετατόπισης που προτείνεται σε αυτή τη μελέτη επιτυγχάνει μεγάλη ανάπτυξη του σωστού ρυθμού ταξινόμησης και έχει πρακτική σημασία.