Abstract:
วิทยานิพนธ์นี้ศึกษาปัญหาการจำแนกอนุกรมเวลาด้วยเทคนิคการใช้รูปร่างของลำดับย่อยในอนุกรมเวลา ซึ่งถูกเรียกกันในชื่อ "Shapelet" เทคนิค Shapelet นั้นสามารถจำแนกประเภทของข้อมูลประเภทหนึ่งออกจากประเภทอื่น ๆ ได้ ในหลายทศวรรษที่ผ่านมา มีนักวิจัยพยายามแสดงให้เห็นว่า Shapelet ไม่ใช่อนาคตสำหรับเทคนิคการจำแนกอนุกรมเวลา แต่เทคนิค Shapelet ก็ยังเป็นวิธีที่ได้รับความนิยมเพราะสามารถอธิบายขั้นตอนการจำแนกได้ อย่างไรก็ตามยังมีปัญหาใหญ่สองประการสำหรับเทคนิคนี้ อย่างแรกคือความเร็วในการหาตัวแทน Shapelet และอย่างที่สองคือจำนวนของลำดับย่อยที่ปรากฏออกมามากเกินไป โดยจำนวนตัวแทนที่ดีที่เป็นไปได้มีตั้งแต่หนึ่งพันถึงหนึ่งล้านตัวแทน ในวิทยานิพนธ์ฉบับนี้เราไม่ได้เน้นไปที่การเพิ่มความเร็วในการค้นหาตัวแทนของ Shapelet แต่เราได้เสนอวิธีการใหม่เพื่อสร้างตัวแทน Shapelet โดยการเรียนรู้รูปร่างของลำดับย่อยของอนุกรมเวลา แทนที่จะใช้ลำดับย่อยของอนุกรมเวลาจริง ในงานชิ้นนี้เราได้ใช้เทคนิค Autoencoder ในการประยุกต์ใช้เพื่อลดความซับซ้อน (จำนวนมิติ) ของตัวแทนลำดับย่อยให้อยู่ในมิติที่เล็กลง เพื่อที่จะสามารถค้นหาตัวแทนที่ดีได้อย่างมีประสิทธิภาพมากขึ้น และนอกจากนี้ การที่เราใช้แบบจำลองการเรียนรู้ ทำให้แบบจำลองสามารถเรียนรู้รูปร่างของลำดับย่อยได้มากกว่าหนึ่งตัวไปพร้อมกัน ทำให้ผลที่ได้จากการสร้างกลับของลำดับย่อย Shapelet มีความซับซ้อนน้อยกว่าข้อมูลลำดับย่อยจริง ด้วยเทคนิคการสร้าง Shapelet ของเรา จะทำให้ลำดับย่อยที่ได้เหมาะสมกับข้อมูลอนุกรมเวลาจริงที่มีความซับซ้อนสูงมากกว่าลำดับย่อยที่ได้จากอนุกรมเวลาจริง ผลการทดลองที่สาธิตให้ดูนั้นพบว่าเทคนิคของเรามีความแม่นยำสูงกว่าเมื่อเทียบกับ Shapelet ที่ได้มาจากลำดับย่อยของอนุกรมเวลาจริง และมันไม่อ่อนไหวต่อชุดข้อมูลฝึกสอน
Thisthesisconsidersaproblemoftimeseriesclassificationwithshapeofsubsequences,known as the shapelet algorithm. Time series shapelets is a snippets of time series that can distinguish one class from others. In the last decade, many researches show that time series shapelets is not only one of the most promising classification techniques, but also a desirable solution because it is simply an explainableresulttotheexperts. However,Twomaindrawbacksoftimeseriesshapeletsdiscoveryare speedandtheappearanceofthecandidatesanditsrepresentative,i.e. thetimeseriesshapeletsitself. In thispaper,wedonotimprovetherunningtimeofdiscoveringthetimeseriesshapelets,butwepropose a new method to learn the shape of time series shapelets, instead of picking one from candidates. The numberofcandidatescanbevaryfromtenthousandstomillionssubsequencesorevenmoredepended onthelengthofthecandidates. Inthispaper,autoencodertechniqueisappliedtoreducethecomplexity of candidates from the higher-dimensional space to the much smaller-dimensional space, to highlight the potential candidates as the representatives, to learn the shapes of those candidates instead of the individual one, and to reconstruct the more-smooth time series shapelets. Our time series shapelets, named autoshaplets, is not fit to the exact value of the training data anymore, which normally is noisy accordingtotherealobservation. Theexperimentresultsdemonstratethatthenewgeneratedshapelets canachievehigheraccuracycomparedtotheexactshapelets,anditislesssensitivetothetrainingdata.