امروزه يکي از حوزههاي پرکاربرد و مهم در زمينه تشخيص و پيش بيني استفاده از يادگيري ماشين است. در اين شماره شما را با قابليت بخش اپليکيشن يادگيري ماشين نرم افزار متلب آشنا خواهيم کرد.
اين قسمت به کاربر اين امکان را ميدهد تا از برخي روشهاي طبقه بندي دادهها و نيز معيارهاي ارزيابي سيستم تشخيصي استفاده کرده و مقايسه مناسبي از نتايج کسب شده توسط روشهاي مختلف ارائه کند. براي دسترسي به قسمت اپليکيشن يادگيري ماشين ميتوانيد پس از بازکردن نرم افزار متلب، مطابق شکل1، از منوي بالاي نرم افزار به بخش APPS رفته و از قسمت MATH, STATISTIC AND OPTIMISATION که مرتبط با قابليتهاي رياضي، آمار و بهينه سازي است بر روي Classification Learner کليک کنيد تا پنجرهاي به صورت شکل 2 باز شود. اين محيط قابليت طبقه بندي دادهها به شيوه الگوريتم يادگيري با سرپرست را دارد.
شکل 1) محيط مربوط به اپليکيشنهاي متلب
شکل 2) محيط مربوط به طبقه بندي دادهها
براي شروع کار طبقه بندي، ابتدا از قسمت New Session (شکل 2) بايد داده مورد نظر خود را بارگذاري کنيد. پس از کليک بر روي New Session دو گزينه جهت بارگذاري داده پيش رو خواهيد داشت. در صورتي که داده شما در قسمت فضاي کار (Workspace) نرم افزار متلب وجود دارد بر روي From Workspace کليک کنيد و در صورتي که داده خود را از قبل ذخيره کردهايد، ميتوانيد با کليک بر روي From File داده مورد نظر را فراخواني کنيد.
شکل 3) مسير بارگذاري دادهها
در اين مثال نمونه، يک متغير به نام x در فضاي کار ايجاد شده است که ستون اول و دوم به عنوان ويژگي و ستون سوم به عنوان تارگت است. پس از انتخاب متغير x در پنجرهاي به صورت شکل 4 سه مرحله (Step) وجود دارد که در مرحله 2 بايد براي هر ستون يک تعريف در نظر گرفت. ستونهاي اول و دوم را به عنوان ويژگي و ستون سوم را به عنوان پاسخ تنظيم کرده و در پايين تصوير 4 بر روي Start Session کليک کرده تا موقعيت دادهها در فضاي نمونه به صورت شکل 5 ظاهر شود.
شکل 4) نحوه بارگذاري داده و تعريف ورودي و خروجي
شکل 5) موقعيت دادهها در دو کلاس
براي طبقه بندي دادهها ميتوان از روشهاي مختلف استفاده کرد. براي شروع ميتوانيد از تبهاي بالاي شکل 5، بر روي CLASSIFIER کليک کنيد تا انواع روشهاي طبقه بندي مطابق شکل 6 ظاهر شود. پس از انتخاب هر روش موجود، بر روي Train کليک کنيد تا آموزش الگوها با آن روش انجام شود. در اين مثال، از روش Linear Discernment استفاده ميشود. پس از اتمام آموزش دادهها، ميزان صحت (Accuracy) به دست آمده توسط اين روش در قسمت چپ پنجره توزيع دادهها نشان داده ميشود. با توجه به اينکه دادههاي انتخابي توزيع کاملاً مستقلي از هم دارند، روش انتخابي با صحت 100 درصد توانست توزيع دادهها را آموزش ببيند. براي نمايش ماتريس درهم ريختگي (Confusion Matrix) نيز ميتوانيد از منوي بالاي تصوير 5 بر روي Confusion Matrix کليک کنيد تا تصويري مانند شکل 6 ظاهر شود. اين تصوير هم گوياي تشخيص درست الگوها توسط روش Linear Discernment است. همچنين همانطور که در سمت راست تصوير 6 مشخص است ميتوان به صورت دلخواه، نوع نما را يکي از انواع Plot ها جهت نمايش نرخهاي مثبت حقيقي (True Positive Rates)، منفي کاذب (False Negative Rates)، يا مقادير پيش بيني مثبت (Positive Predictive Values) يا نرخهاي کشف نادرست
(False Discovery Rates) تنظيم کرد.
شکل 6) نمايش ماتريس درهم ريختگي (Confusion Matrix)
همچنين جهت نمايش منحني عملياتي گيرنده (Receiver Operating Characteristic)يا ROC ميتوانيد از منوي بالا بر رويROC Curve کليک کنيد تا تصويري به شکل 7 توليد شود که همانطور که در شکل مشخص است با توجه به تشخيص 100 درصدي الگوها در دو کلاس، مساحت زير منحني ROC (Area Under Curve) AUC نيز مقدار يک به دست آمده است.
شکل 7) نمايش منحني ROC
در انتها ميتوانيد جهت مقايسه طبقه بندي کنندههاي مختلف از قسمت CLASSIFIER از روشهاي طبقه بندي ديگر مانند SVM، KNN و … استفاده کنيد و مقايسهاي از نظر ميزان کارايي روش پيشنهادي در تشخيص الگوها و طبقه بندي آنها به دست آوريد. همچنين با انتخاب هر روش ميتوانيد از قسمت Advanced، پارامترهاي مرتبط با هر روش را به صورت دلخواه تنظيم کنيد تا کارايي روش پيشنهادي در تشخيص افزايش يابد.
استفاده از روش تحليل مؤلفههاي اصلي ( Principal Component Analysis –PCA)
نيز ميتواند جهت کاهش ابعاد ويژگي در صورت لزوم به شما کمک کند. شکل 8 نتايج به دست آمده با استفاده از روشهاي مختلف با حالت فعال و غيرفعال PCA را نشان ميدهد.
شکل8) مقايسه طبقه بندي کنندههاي مختلف با و بدون اعمال PCA
دیدگاه ها