نوع مدرک: | متون چاپی |
سرشناسه | کشانی ، امین، نویسنده |
ردهبندی کنگره : | COM soft 38 1397 |
عنوان : | استفاده ازتکنیکهای دادهکاوی جهت بهبود دقت تشخیص بیماری دیابت |
عنوان موازی : | Use of Data Mining Techniques to Improve the Accuracy of Diagnosis of Diabetes |
ناشر: | دانشگاه شهید اشرفی اصفهانی: اصفهان |
سال نشر : | 1397 |
صفحه شمار: | 92ص |
شابک/شاپا | 23793 |
یادداشت | پایان نامه کارشناسی ارشد: کامپیوتر نرم افزار |
توصیفگرها | دیابت دادهکاوی الگوریتمهای دادهکاوی متدولوژی CRISP-DMو انتخاب ویژگی Diabetes Data Mining Data Mining Algorithms CRISP-DM Methodology Feature Selection |
چکیده : | امروزه، دادهکاوی یکی از تکنیکهای پرکاربرد میباشد که پـردازش خـود را روی دادههـای انبـوه انجام میدهد. با توجه به فراوانی دادههای پزشکی و بیماریها، این موضوع میتواند بستر مناسبی برای به کارگیری تکنیکهای مختلف دادهکاوی باشد. تشخیص زودرس افراد مبتلا به یـک بیمـاری مخفـی مانند دیابت از اهمیت زیادی برخوردار است. به طوری که میتوان اقـدامات فـوری بـرای جلـوگیری ازپیشرفت بیماری و یا آسیب رساندن به اعضای بدن را انجام داد. دیابت بیماریای است که توانایی بدن برای تولید یا پاسخ دادن به هورمون انسولین ضعیف است، که منجر به متابولیسم غیر طبیعی کربوهیدراتها و افزایش سطح گلوکز در خون و ادرار میشود. همه میتوانند از آن رنج ببرند و تاکنون درمان برای آن وجود ندارد.
در این تحقیق از مجموعه داده UCI Machine Learning Repositoryاستفاده شده است کـه شـامل 101766 رکورد با 50 ویژگی و حاوی دادههای بیماران دیابتی از 130 بیمارستان در ایالات متحده که طی 10 سال (1999-2008) جمعآوری شده است میباشد. سـپس بـرای کار با دادهها از متدولوژی CRISP-DM استفاده شد. دادهها در دو قسمت مورد مدلسازی و ارزیابی قرار گرفتند: انتخاب ویژگیها پس از پیشپردازش دادهها و انتخاب ویژگی. در ادامـه بـرای مدلسازی از چهار الگوریتم درخت تصمیم، بیز ساده، شبکههای عصـبی مصـنوعی و KNN (با K=1، K=5 و K=10) در دو حالـت انتخاب ویژگیها پس از پیشپردازش دادهها و انتخاب ویژگی، استفاده گردید. بـا اسـتفاده از روش X-Validationجهت ارزیابی مدلسازیهای انجام شد، روش درخت تصمیم بالاترین دقت (100%) را کسب کرده و به عنوان مدل برتر انتخاب شده است. بـا روش بیز ساده نیز دقت قابل قبولی (98.58%) بدست آمده است. همچنین با استفاده از انتخاب ویژگی برای 3 الگوریتم درخت تصمیم، بیز ساده و KNN (با K=1، K=5 و K=10) توانستیم دقت بسیار خوب (99.91%) را بدست آوریم |
لینک ثابت رکورد: | ../opac/index.php?lvl=record_display&id=13008 |
زبان مدرک : | فارسی |