2-4- چالش‌های داده‌کاوی.. 16

 

2-4-1- چالش‌های اولیه. 17

 

2-4-2- چالش‌های ثانویه. 18

 

2-5-معرفی داده‌کاوی.. 19

 

2-5-1-منشاُ علمی.. 21

 

2-5-2- معماری سیستم داده‌کاوی.. 21

 

2-5-3- مراحل عملیات داده‌کاوی.. 23

 

2-5-3-1-آماده‌سازی داده 23

 

2-5-3-2-یادگیری مدل. 24

 

2-5-3-3-ارزیابی و تفسیر مدل. 25

 

2-6- محدودیت‌های داده‌کاوی.. 25

 

2-7- قابلیت‌های داده‌کاوی.. 26

 

2-8- روش‌های یادگیری مدل در داده‌کاوی.. 26

 

2-8-1- روش‌های پیش‌بینی.. 26

 

2-8-1-1- دسته‌بندی.. 27

 

2-8-1-2- رگرسیون. 27

 

2-8-1-3-تشخیص انحراف.. 28

 

2-8-2- روش‌های توصیفی.. 29

 

2-8-2-1- خوشه‌بندی.. 30

 

2-8-2-2- کشف قوانین انجمنی.. 32

 

2-8-2-3- کشف الگوهای ترتیبی.. 32

 

2-9- فنون داده‌کاوی.. 32

 

2-9-1- یافتن خودکارخوشه‌ها 34

 

2-9-1-1-نقاط قدرت این روش… 34

 

2-9-1-2-نقاط ضعف… 34

 

2-9-1-3- کاربرد. 34

 

2-9-2- درخت‌های تصمیم‌گیری و استقرا قاعده‌ای.. 35

 

2-9-2-1-نقاط قوت.. 35

 

2-9-2-2-نقاط ضعف روش درخت‌تصمیم‌گیری.. 35

 

2-9-2-3-کاربرد. 36

 

2-9-3- شبکه‌های عصبی.. 36

 

2-9-3-1- نقاط قوت شبکه‌های عصبی مصنوعی.. 36

 

2-9-3-2- نقاط ضعف شبکه‌عصبی.. 37

 

2-9-3-3-کاربرد. 37

 

2-10- درجه‌بندی فنون مختلف داده‌کاوی از جهت سختی و آسانی.. 37

 

2-11-تعریف داشبورد. 38

 

2-12- سابقه تحقیق. 43

 

2-12-1- سابقه داده‌کاوی.. 43

 

2-12-2- سابقه داشبورد. 47

 

2-13 بررسی مراحل داشبورد در چند نمونه. 49

 

2-14-نتیجه گیری.. 50

 

فصل سوم: 51

 

3-1- مقدمه. 52

 

3-2- چارچوب تحقیق. 53

 

3-3- روش تحقیق. 54

 

3-3-1- طبقه‌بندی تحقیق برمبنای هدف.. 54

 

3-3-2- طبقه بندی تحقیق بر مبنای روش… 54

 

3-3-3- طبقه‌بندی تحقیق بر مبنای نوع داده‌ها 55

 

3-4- جامعه آماری.. 55

 

3-5- نمونه‌گیری.. 56

 

3-5-1- روش نمونه‌گیری.. 56

 

گردآوری و تحلیل داده‌ها 56

 

3-7- ساختار اجرایی تحقیق. 57

مقالات و پایان نامه ارشد

 

 

3-7-1- ساختار اجرایی بخش اول تحقیق. 58

 

3-7-1-1- درک مساله. 59

 

3-7-1-2- شناخت داده‌ها 60

 

3-7-1-3- آماده سازی داده‌ها 61

 

3-7-1-4- مدل‌سازی.. 61

 

3-7-1-5- ارزیابی نتایج. 62

 

3-7-1-6- بکارگیری مدل. 62

 

3-8- تحلیل خوشه‌ای.. 63

 

3-9- الگوریتم  k-means. 64

 

3-10-شبکه‌عصبی.. 65

 

3-10-1- معماری شبکه. 66

 

3-11-درخت‌تصمیم. 67

 

3-12- شاخص مقایسه نتایج خوشه‌بندی با رویکردهای مختلف… 69

 

3-12-1- شاخص مجموع خطای مربعی.. 69

 

3-13- ابزار‌های داده‌کاوی.. 69

 

3-14- بخش دوم ساختار اجرایی تحقیق. 70

 

3-14-1- شناسایی شاخص… 70

 

3-14-2- پیاده‌سازی داشبورد. 70

 

3-15- ابزار پیاده‌سازی داشبورد. 71

 

3-16- نتیجه‌گیری.. 71

 

فصل چهارم: 73

 

4-1-مقدمه. 74

 

4-2-فرآیند داده‌کاوی.. 74

 

4-2-1-درک مساله. 74

 

4-2-2-شناخت داده‌ها 75

 

4-2-2-1- داده‌ها 75

 

4-2-2-2- انتخاب داده‌ها 75

 

4-2-3- آماده سازی و پیش پردازش داده‌ها 76

 

4-2-3-1- آماده سازی داده‌ها 76

 

-2-3-2-پیش پردازش داده‌ها 77

 

4-2-4-مدل‌سازی.. 82

 

4-2-4-1-خوشه‌بندی.. 83

 

4-2-4-2- خوشه‌بندی k-means. 83

 

4-2-4-3- پیش‌بینی خوشه‌ها 84

 

4-2-4-4- پیش‌بینی با شبکه‌عصبی.. 85

 

4-2-4-5- پیش‌بینی با درخت‌تصمیم C5. 85

 

4-2-5- ارزیابی.. 88

 

4-2-6- به‌کارگیری مدل. 89

 

4-3- فرآیند طراحی و پیاده‌سازی داشبورد. 89

 

4-3-1- شناسایی شاخص… 89

 

4-4- نتیجه‌گیری.. 93

 

فصل پنجم: 94

 

5-1- مقدمه. 95

 

برفصل‌های گذشته. 95

 

5-3- دستاوردها و نوآوری‌های تحقیق. 96

 

5-4- پیشنهادات برای تحقیق‌های آتی.. 97

 

5-5- محدودیت‌های تحقیق. 98

 

فهرست منابع. 99

 

 

 

 

 

فهرست جداول

 

جدول2-1 درجه‌بندی فنون مختلف داده‌کاوی.. 38

 

جدول 2-2 تعاریف داشبورد در مرور ادبیات.. 38

 

جدول 2-3 مراحل طراحی داشبورد. 49

 

جدول3-1 الگوریتم خوشه‌بندی.. 65

 

جدول 4-1 اقلام اطلاعات فردی دانشجویان. 78

 

جدول 4-2 اقلام اطلاعاتی معدل دانشجویان. 79

 

جدول 4-3 اقلام اطلاعاتی دانشگاهی دانشجویان. 79

 

جدول 4-4 نرخ پارامتر SSE به ازای تعداد خوشه‌ها در k-means. 84

 

جدول 4-5 پیش بینی با استفاده از روش شبکه‌عصبی.. 85

 

جدول 4-6 دسته‌بندی معدل‌‌ها 86

 

جدول 4-7 پیش بینی با استفاده از روش درخت تصمیمC5. 87

 

جدول 5-1 دقت پیش‌بینی‌های انجام شده 97

 

 

 

 

 

فهرست شکل‌ها و نمودارها

 

.. 9

 

شکل2-1: قیاس رشد حجم داده با رشد تعداد تحلیل‌گران داده 15

 

شکل 2-2 سلسله مراتب داده تا خرد. 20

 

شکل 2-3 معماری یک سیستم داده‌کاوی.. 22

 

شکل 2-4 ساختار داده‌کاوی آموزشی.. 44

 

شکل 3-1 مراحل اصلی پیشنهادی برای اجرای تحقیق. 53

 

شکل 3-2  استاندارد جهانی CRISP. 59

 

شکل 4-1 بخشی از ارتباط داده‌ای جداول. 77

 

نمودار 4-1 میزان استفاده تکنیک‌های پیش‌پردازش داده 81

 

شکل 4-2بخشی از داده‌ها در نرم‌افزار Excel 82

 

شکل 4-3 تعداد رکوردها در هر خوشه. 84

 

شکل 4-5 اهمیت فیلدها در پیش‌بینی معدل ترم شش دانشجویان. 88

 

شکل4-6 پیشرفت تحصیلی دانشجویان ورودی سال 1371. 91

 

شکل4-7 پیشرفت تحصیلی دانشجویان ورودی سال 1381. 91

 

شکل 4-8 پیش بینی پیشرفت تحصیلی دانشجویان فاقد شغل ورودی سال 1381. 92

 

شکل 4-9 پیش‌بینی پیشرفت تحصیلی دانشجویان شاغل در سازمان‌های دولتی ورودی سال 1381  93

 

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...