2-1-6-6توسعه ی مدل16
2-1-7-قابلیت های اساسی داده کاوی16
2-1-7-1 طبقه بندی16
2-1-7-2 پیش بینی17
2-1-7-3تحلیل خوشه ای17
2-1-7-4تخمین18
2-1-7-5گروه بندی شباهت یا قوانین وابستگی19
2-1-7-6توصیف و نمایه سازی20
2-1-8-دسته بندی الگوریتم های داده کاوی20
2-1-9-الگوریتم های خوشه بندی21
2-1-9-1روش افرازی ( تقسیم بندی)21
2-1-9-1-1الگوریتم K-means22
2-1-9-2روش های سلسله مراتبی22
2-1-9-3روش های مبتنی بر چگالی23
2-1-10-الگوریتم های وابستگی قواعد23
2-1-10-1الگوریتم Naïve23
2-1-10-2 الگوریتم Apriori24
2-1-11-الگوریتم های طبقه بندی26
2-1-11-1الگوریتم درخت طبقه بندی و رگرسیون (CART)26
2-1-11-2الگوریتم درخت تصمیم C4.527
2-1-11-3الگوریتم های شبکه های بیزین29
2-2-1-مدیریت شهری و شهرداری30
2-2-2-نقش فن آوری اطلاعات در توسعه ی مدیریت شهری31
2-2-3-معرفی سامانه مدیریت شهری 137 شهرداری تهران33
2-2-3-1نحوه ی عملکرد سامانه مدیریت شهری 13736
2-2-3-2ماموریت های مرکز سامانه مدیریت شهری 13738
2-2-3-3رویکردهای اجرایی مرکز سامانه مدیریت شهری 13738
2-2-3-4چشم انداز مرکز سامانه مدیریت شهری 13739
2-2-3-5ساختار سازمانی سامانه مدیریت شهری 13739
2-2 مدل مفهومی تحقیق40
2-3- ادبیات یاپیشینه تحقیق40
2-4- خلاصه فصل دوم44
فصل سوم: روش تحقیق
مقدمه46
3-1- نوع تحقیق46
3-2- مدل فرایندی داده کاوی بر اساس استاندارد CRISP-DM47
3-2-1-شناخت کسب و کار47
3-2-2-شناخت داده ها 48
3-2-3-آماده سازی داده ها48
3-2-4-مدل سازی49
3-2-5-ارزیابی مدل49
3-2-6-توسعه مدل49
3-3-داده های تحقیق50
3-4-جامعه آماری, روش نمونه گیری و حجم نمونه50
3-5-روش گردآوری اطلاعات و ابزار سنجش50
3-6-نوع داده ها و مقیاس آن ها51
3-7-ساختار اجرایی تحقیق51
3-7-1-درک مساله کسب و کار51
3-7-2-درک داده ها52
3-7-3-آماده سازی داده ها53
3-7-4-مدل سازی55

در این سایت فقط تکه هایی از این مطلب(به صورت کاملا تصادفی و به صورت نمونه) با شماره بندی انتهای صفحه درج می شود که ممکن است هنگام انتقال از فایل ورد به داخل سایت کلمات به هم بریزد یا شکل ها درج نشود-این مطالب صرفا برای دمو می باشد

ولی برای دانلود فایل اصلی با فرمت ورد حاوی تمامی قسمت ها با منابع کامل

اینجا کلیک کنید

3-7-5-ارزیابی نتایج56
3-7-6-به کارگیری مدل56
3-8-مدل اجرایی تحقیق56
3-9-خلاصه فصل سوم58
فصل چهارم: تجزیه و تحلیل داده ها
مقدمه60
4-1- توصیف داده ها60
4-2- تحلیل توصیفی داده ها با استفاده از جداول و نمودارهای توصیفی63
4-2-1-طبقه بندی بر اساس نوع مشکل63
4-2-2-طبقه بندی بر اساس منطقه بروز مشکل66
4-2-3-شاخص‌های توصیفی سرانه67
4-3- تحلیل داده ها با استفاده از تکنیک های داده کاوی70
4-3-1-شناسایی مناطق همگن از منظر سامانه 13770
4-3-1-1ارزیابی خوشه ها76
4-3-2-پیش بینی وضعیت تماس های آب گرفتگی در هر یک از مناطق به ازای بارش هر میلیمتر باران77
4-3-2-1 مدل تعمیم یافته خطی77
4-3-2-2مدل شبکه‌های عصبی82
4-3-3تعیین ارتباط میان آب گرفتگی نواحی مختلف یک منطقه84
4-3-4تعیین نواحی مستعدتر در هر منطقه در بروز مشکلات و معضلات شهری86
4-4- خلاصه فصل چهارم87
فصل پنجم: بحث و نتیجه گیری
مقدمه89
5-1-خلاصه89
5-2- دلایل با اهمیت بودن نتایج و دستاوردهای تحقیق90
5-3- جنبه ی نوآوری تحقیق91
5-4- نتایج تحقیق91
5-4-1-نتایج تحلیل توصیفی91
5-4-2-نتایج حاصل از تحلیل داده کاوی و ارائه ی دانش استخراج شده94
5-4-2-1نتایج حاصل از شناسایی مناطق همگن با استفاده از روش خوشه بندی دو مرحله ای94
5-4-2-2- نتایج پیش بینی تماس های آب گرفتگی در هر یک از مناطق به ازای بارش هر میلیمتر باران95
5-4-2-3تعیین ارتباط میان آب گرفتگی نواحی مختلف یک منطقه96
5-4-2-4نتایج تحلیل قوانین وابستگی برای شناسایی نواحی مستعدتر در هر منطقه در بروز مشکلات و معضلات شهری97
5-5- پاسخ به سوالات تحقیق97
5-6- محدودیت‌های تحقیق98
5-7- پیشنهادات تحقیق99
5-8- پیشنهادات جهت تحقیقات آتی100
5-9- خلاصه فصل پنجم101
فهرست منابع102
چکیده انگلیسی105
فهرست جداول
عنوان صفحه
جدول 2-1 : نمونه ای از جدول پیام35
جدول 2-2: تحقیقات خارجی در زمینه کاربرد داده کاوی در مراکز تماس444
جدول4-1 : فیلد های جدول پیام61
جدول 4-2: فیلد های جدول اطلاعاتی مربوط به اعتبار مصوب عمرانی مناطق61
جدول4-3: فیلد های جدول اطلاعاتی مربوط به بارش مناطق61
جدول4-4: فراوانی گروه های تماس63
جدول4-5 پراکندگی مشکلات مربوط به گروه جمع آوری و نصب65
جدول4-6 : طبقه بندی مشکلات بر اساس منطقه66
جدول 4-7 سرانه تماس و بودجه مناطق بیست و دو گانه تهران68
جدول4-8: شاخص‌های نیکویی برازش78
جدول4-9: آزمون درستنمایی مدل خطی تعمیم یافته78
جدول4-10 آزمون عوامل مدل خطی تعمیم یافته79
جدول4-11 آزمون ضرائب مدل خطی تعمیم یافته79
جدول4-12 بخشی از ارتباط‌های دنباله‌ای شناسایی شده85
جدول4-13 قوانین شناسایی شده به روش GRI86
فهرست شکل ها
عنوان صفحه
شکل 2-1 مراحل فرایند کشف دانش و جایگاه داده کاوی.11
شکل2-2 مراحل فرایند CRISP-DM13
شکل 2-1 چرخه گردش پیام- ماخذ: مرکز سامانه 13736
شکل 2-2ساختار سازمانی سامانه مدیریت شهری سامانه 137-ماخذ: مرکز مدیریت سامانه 13739
شکل2-3 مدل مفهومی تحقیق40
شکل3-1وضعیت ایستگاه های پنج گانه هواشناسی مستقر در شهر تهران می باشد.53
شکل3-2 روش اجرایی تحقیق57
شکل4-1: درصد فراوانی هر کدام از گروه‌های تماس64
شکل 4-2 :سهم مناطق در تماس های از نوع “جمع آوری خاک و نخاله” و “نصب سطل زباله مخزن دار”66
شکل4-3: رابطه میان تعداد تماس، جمعیت و اعتبار مصوب عمرانی69
شکل4-4 بررسی نه عامل اول در خوشه بندی73

شکل4-5 بررسی نه عامل دوم در خوشه بندی74
.شکل 4-6 بررسی هفت عامل آخر در خوشه بندی75
شکل 4-7 اعضای خوشه های اول و دوم76
شکل 4-8 : آنالیز مدل خطی تعمیم یافته81
شکل 4-9: نمودار صعود81
شکل 4-10: مدل شبکه عصبی83
شکل 4-11: آنالیز مدل شبکه عصبی84
شکل 5-1 : رابطه میان تعداد تماس، جمعیت و اعتبار مصوب عمرانی93
شکل 5-2 اعضای خوشه اول و دوم94

کلیات
مقدمه
تمایل به شهرنشینی و جاذبه های آن در میان جامعه، به حدی رو به افزایش است که در حال حاضر شهرها به عنوان مهم ترین پایگاه رشد و توسعه و مرکز اصلی تحولات قرار گرفته اند. بنابراین در مسیر دستیابی به توسعه ی پایدار، شهر یک شاخص مهم تلقی می گردد که رشد وبالندگی آن ارتباط مستقیم با چگونگی مدیریت و دستاورد های حاصله دارد.
مشارکت اگرچه به معنای عام آن از دیرباز با زندگی انسان پیوند داشته، اما به معنای جدید از عرصه سیاست و پس از جنگ جهانی دوم آغاز شده است. این نوع مشارکت در برخی از کشورهای صنعتی جهان، در قلمرو اقتصادی و صنعتی آغاز شد؛ تا مردم را در مالکیت شریک سازد و پایه های پایدار و تداوم صنعت و اقتصاد را مستحکم سازد.
    اما تازه ترین زمینه ی مشارکت، مشارکت شهروندان در اداره ی امور شهرهاست. این نوع مشارکت یکی از الزامات زندگی شهری است و هنگامی تحقق می یابد که شهرنشینان از حالت فردی که صرفاً در مکانی به نام شهر زندگی می کنند درآیند و به شهروند بدل شوند.
می توان گفت یکی از مسائل مهم در عرصه ی مدیریت شهری، نحوه ی ارزیابی شهروندان از عملکرد مدیریت شهری، اعتماد به این نهاد و مشارکت در آن است. در این میان، نحوه ی عملکرد مدیریت شهری، خود می تواند عامل مهمی برای میزان اعتماد شهروندان به مدیریت شهری و مشارکت با آن باشد.
به عبارت دیگر با توجه به گسترش شهر نشینی و مهاجرت به شهرها، به خصوص کلان شهر تهران و با
در نظر گرفتن جمعیت میلیونی این شهر، عدم کارایی مدیریت سنتی شهر و لزوم بهره گیری از مدیریت متمرکز همراه با به کارگیری از بروزترین دانش فن آوری اطلاعات، احساس می شود. یکی از مشکلات بارز شهر تهران، عدم اطلاع به موقع مدیران شهری از وجود و بروز حوادث و مشکلات در شهر می باشد که مشارکت بیشتر شهروندان در اداره ی شهر و برقراری ارتباط مستقیم مردم با سیستم مدیریت شهری از طریق یک وسیله در دسترس و ارزان قیمت راه حل این معضل بزرگ می باشد(امیری 1389).
از این رو شهرداری تهران در یک اقدام ابتکاری و با استفاده از فن آوری های نوین اطلاعاتی و ارتباطاتی، به راه‌اندازی سامانه ی مدیریت شهری 137 جهت ایجاد ارتباط مستقیم شهروندان با مدیران شهری به منظور انتقال نظرات و خواسته‌ها و بیان مشکلات مربوط به امور مدیریت شهری اقدام کرده است.
از طرفی تنوع و پیچیدگی در حوزه ی خدمات شهرداری، دسترسی به دانش مناسب برای تصمیم گیری و تولید اطلاعات از میان حجم انبوهی از داده ها را برای این سازمان، بیش از پیش ضروری می سازد. استفاده از فن آوری اطلاعات و ارتباطات نقش اساسی در حل مسائل تهران و کلان شهرها دارد. این مساله به ویژه در مدیریت شهری، اقتصاد شهری، تولید شغل و ارتقای سطح فرهنگ شهروندی نقشی اساسی ایفا می کند(هراتی زاده، 1386). یکی از ابزارهای مناسب جهت ایجاد این دانش سازمانی و کمک به مدیران در تصمیم سازی و تصمیم گیری صحیح به کارگیری فن آوری های نوین، نظیر داده کاوی1 است.
از این رو هدف این تحقیق، به کارگیری تکنیک های داده کاوی در شناسایی و پیش بینی، نیازها و مشکلات شهری بر اساس داده های بدست آمده از سامانه ی مدیریت شهری 137 می باشد.
بیان مساله
شهرها، امروزه بسیار پیچیده شده اند. مشکلات متعددی هم چون آلودگی هوا، آلودگی صوتی، تولید انبوه زباله، دفن زباله های تولیدی، توسعه معابر و آسفالت، فضای سبز، بهداشت، و … شهرها را احاطه کرده اند. با توسعه ی شهرها وظایف شهرداری ها در خدمت رسانی هم توسعه پیدا کرده است. در مدیریت‌ شهری‌ امروز که آن را اداره‌ امور شهر به‌منظور ارتقای مدیریت‌ پایدار مناطق‌ شهری‌ در سطح‌ محلی و‌ با تبعیت‌ از اهداف‌ سیاست های‌ ملی، اقتصادی‌ و اجتماعی‌ کشور می دانند، مشارکت و تعامل، مفاهیمی محوری می باشند(ویژه‌نامه‌ مرکز مطالعات‌ برنامه‌ریزی‌ شهری، شهرداری‌ تهران‌ 1387، ص 7).
یکی از راه های مشارکت شهروندان در اداره ی امور شهر برقراری ارتباط با شهرداری از طریق سامانه 137 می باشد. این سامانه که در رویکردی نوین توسط شهرداری تهران و با بهره مندی از دانش فن آوری اطلاعات، ایجاد شده است سعی در انجام سریع و دقیق امور شهری با نظر مستقیم و مشارکت فعال شهروندان دارد و تلاش می نماید ساکنین شهر را نسبت به محیط زندگی خویش وارد عرصه ی مدیریت نماید.
از نگاهی دیگر سامانه 137 یک بانک اطلاعاتی است که داده های ارزشمندی در مورد مسایل شهری را در خود جای داده است. کلیه پیام ها و درخواست های مردم در بانک اطلاعاتی مرکز سامانه 137 ذخیره شده و با استفاده از این داده ها می توان تحلیل هایی کاربردی در بازه های زمانی مختلف و به تفکیک لایه های مختلف اطلاعاتی مانند مناطق، نواحی و واحدهای مختلف سازمانی ارائه کرد. با استفاده از این تحلیل ها می توان وقایع و مشکلاتی که ممکن است در آینده گریبان شهر را بگیرد پیش بینی کرد و آماده مقابله با این مشکلات شد. توانایی استخراج دانش مفید نهفته در این داده ها در جهان امروزی خود یک توانایی رقابتی محسوب می شود و در چنین شرایطی است که باید از رشد تکنولوژی برای استفاده موثر از این ثروت بالقوه سود جست و داده کاوی نیز یک جواب بهینه برای استخراج این ثروت است.
داده کاوی که یکی از ده دانش در حال توسعه می باشد امروزه در امور کسب و کار مورد توجه بیشتر سازمان ها قرار گرفته است و هدف آن استخراج اطلاعات از پایگاه های داده و یافتن الگوهای جدید، معتبر، مفید و قابل فهم در داده ها می باشد (http:// www.wikipedia.org).
در طول دهه گذشته، حجم زیادی از داده ها در پایگاه داده ها انباشته و ذخیره شده اند و نتیجه این انباشتگی این است که سازمان ها در داده غنی ولی در کسب دانش بسیار ضعیف می باشند. امروزه میزان داده های در دسترس هر 3 سال دو برابر می شود و سازمانی تواناست که قادر باشد حداقل 7 درصد از اطلاعاتش را مدیریت نماید. تحقیقات انجام یافته نشان از آن دارد که سازمان ها امروزه کمتر از یک درصد از داده هایشان را برای تحلیل استفاده می نمایند. به عبارت دیگر امروزه سازمان ها در اطلاعات غرق شده اند در حالی که گرسنه دانش هستند؛ چرا که سازمان ها داده های زیادی را در تصرف خود دارند درحالی که هنوز با فقدان دانش پنهان درون داده ها مواجه هستند(www.irandatamining.ir).
هدف تحقیق
به کارگیری برخی از قابلیت های داده کاوی نظیر Clustering، Association Rules و … بر روی اطلاعات سامانه ی137 و کشف روابط و الگوهای پنهان میان داده ها با استفاده از تکنیک های مختلف هریک از آن ها و بررسی و تحلیل نتایج به دست آمده به منظور ارتقای کیفیت خدمات شهری.
سوالات تحقیق
چگونه می توان با استفاده از تکنیک های داده کاوی بر روی داده های سامانه 137 شهرداری تهران به پیش بینی مشکلات مناطق22 گانه شهرداری در حوزه ی کلان شهری پرداخت؟
چگونه می توان با استفاده از تکنیک های داده کاوی بر روی داده های سامانه 137 شهرداری به کشف الگوی پنهان میان مشکلات مناطق و حوزه های مختلف شهرداری دست یافت؟
اهمیت و ضرورت تحقیق
با رشد فزاینده ی جمعیت در کلان‌شهر تهران و به دنبال آن افزایش مشکلات و مسائل ناشی از شهرنشینی در ابعاد وسیع اقتصادی، اجتماعی، فرهنگی و زیست‌محیطی، لزوم ایجاد و استفاده از بسترهای مدیریت شهری جدید همراه با به‌روزترین و کاربردی‌ترین فن آوری‌ها احساس می‌شود (امیری، 1388،ص3 ).
تهران با جمعیت بیش از 8217236 نفر(سالنامه آماری شهر تهران- 1388) و مساحت 730 کیلومتر مربع پرجمعیت ترین کلان شهر ایران محسوب می شود. ناگفته پیداست که ارائه خدمات شهری در چنین کلان شهری با تراکم بیش از 11256 نفر بر کیلومتر مربع که سفرهای آونگی2 ساکنین شهرهای دور و نزدیک اطراف نیز به جمعیت روز آن مرتباً می افزاید، نیازمند به کارگیری تمهیدات ویژه بوده و بدون حضور و نقش فعال شهروندان امکان پذیر نمی باشد.
یکی از مشکلات رایج و فراگیری که در مدیریت کلان‌شهر تهران مشاهده می‌شود، ضعف دریافت اطلاعات به موقع مدیران شهری درباره نیازهای شهروندان و تشخیص ضرورت‌های ارائه خدمات شهری در نواحی و مناطق مختلف شهرداری می‌باشد. در این میان یکی از بهترین روش‌ها برای کسب اطلاعات دقیق در زمینه ی مسائل و مشکلات شهروندان و دریافت نقطه‌نظرات مردم پیرامون مدیریت شهری، ایجاد خطوط ارتباطی مناسب با شهروندان و کسب اطلاعات از طریق خود آنان می‌باشد و این مهم با ایجاد سامانه ای موسوم به 137 در شهرداری تهران دنبال می‌شود.
از این رو شماره 137 پل ارتباطی بین شهروندان و شهرداری تهران است؛ که به شهروندان اجازه می دهد مشکلات و کمبودهای موجود در شهر را به اطلاع شهرداری برسانند. به عبارت دیگر سامانه 137، که از سال 1384 جایگزین صندوق صوتی پیام گیر شهرداری گردیده است، فرایندی است که با سرلوحه قرار دادن اصول شهروند مداری، محله گرایی و مشارکت مردمی به اجرا در آمده تا این مشکلات و درخواست های شهروندان را رسیدگی و برطرف نماید.
کاوش داده ها و اطلاعات جمع آوری شده از طریق این سامانه می تواند منجر به شناسایی الگوهای مهم و پنهانی شود که پیش از آن ممکن است مورد توجه قرار نمی گرفته و دانستن آن مدیران شهری را در ارائه ی مطلوب خدمات شهری به شهروندان یاری می رساند. زیرا دانش داده کاوی سازمان ها را قادر می سازد تا از سرمایه ی داده هایشان بهره برداری نمایند. از این ابزار برای پشتیبانی فرایند تصمیم گیری استفاده می گردد. داده کاوی با پردازش جامع داده و انجام فرایند تصمیم سازی از طریق استخراج دانش با ارزش از داده، تصمیم گیری را برای مدیران سازمان تسهیل می نماید.
قلمرو تحقیق
از منظر سازمانی
قلمرو این تحقیق از منظر سازمانی، مرکز مدیریت شهری سامانه ی 137 شهرداری تهران است که از سال 1384 جایگزین صندوق صوتی پیام گیر شهرداری گردیده و اصول شهروند مداری، محله گرایی و مشارکت مردمی را سرلوحه خود در رسیدگی به درخواست ها و مشکلات مردم شهر تهران نموده است.
از منظر زمانی و مکانی
قلمرو این تحقیق از منظر مکانی – زمانی، پیام ها و درخواست های واصله شهروندان در همه مناطق 22 گانه شهرداری تهران است که در طول فروردین تا اسفند ماه سال 1389 از طریق کانال های ارتباطی با 137 دریافت شده است.
از منظر موضوعی
از منظر موضوعی این تحقیق در حوزه ی کاربرد داده کاوی در مدیریت شهری جای دارد. به این ترتیب که در نتیجه داده کاوی سامانه 137 و کشف دانش پنهان میان داده ها، به توسعه مدیریت شهری خواهیم رسید. کشف دانش پنهان منجر به تسهیل در امر تصمیم سازی مدیران، تخصیص بهینه منابع و آمادگی بیشتر در مقابل معضلات شهری خواهد شد. و در نتیجه توسعه مدیریت شهری به افزایش مشارکت های مردمی و به کارگیری هر چه بیشتر فن آوری های نوین اطلاعاتی در فرایندهای شهری نایل می شویم.
روش تحقیق و جمع آوری اطلاعات
تحقیق حاضر از نظر هدف کاربردی و از نظر روش تشریحی محسوب می شود. در اجرای تکنیک های
داده کاوی، از نرم افزار Clementine 12 استفاده شده است. دلیل استفاده از این نرم افزار توانایی آن در پردازش مجموعه های داده ای بزرگ3 و متداول بودن آن در میان کاربران است. در بخش آماده سازی داده ها از نرم افزارهایی نظیر Sql server 2008، Excel 2007 و Spss 16 استفاده شده است.
داده های اصلی این تحقیق شامل برشی از بانک داده سامانه 137 در مقطع سال 89 می باشد که از طریق مراجعه حضوری به آن مرکز و طی مراحل استاندارد و قانونی گرد آوری گردیده است. سایر داده های تحقیق که شامل اعتبار مصوب عمرانی مناطق و میزان بارش روزانه در سال 89 می شود از اطلاعات معتبر منتشر شده در سایت اینترنتی شهرداری و هواشناسی به دست آمده است.
تعریف واژه ها و اصطلاحات فنی
داده کاوی(Data Mining): علم استخراج اطلاعات مفید از پایگاه‌های داده یا مجموعه داده‌ای می‌باشد.
انباره داده ها (Data Warehouse) : مجموعه ای از داده های ذخیره شده به شکل الکترونیکی در یک سازمان که به منظور استفاده در فعالیت های تحلیلی و گزارش گیری طراحی و راه اندازی شده است.
خوشه بندی(Clustering): یکی از تکنیک های مهم داده کاوی است که اشیاء با تعداد زیادی مشخصه را به زیرگروههای معنی دار جدا ازهم تقسیم بندی می کند. به طوری که اعضای هر گروه از نظر مقدار مشخصه هایشان، بیشترین شباهت را به هم دارند و با اعضای سایر گروه ها بیشترین تفاوت را دارند.( هن و کمبر 2006)
قوانین وابستگی (Association Rules): هدف قوانین وابستگی تعیین کردن این است که چه پدیده هایی با هم در ارتباط بوده و به هم وابسته اند. نمونه ی اصلی این کار تعیین اقلامی است که با هم در چرخه ی خرید مشتریان یک سوپرمارکت قرار می گیرند.
خلاصه فصل اول
در این فصل به کلیات تحقیق پرداخته شد که شامل: بیان مساله، هدف تحقیق، سوالات تحقیق، اهمیت و ضرورت تحقیق، قلمرو سازمانی- زمانی و مکانی- موضوعی تحقیق، روش تحقیق و جمع آوری اطلاعات، تعریف واژه ها و اصطلاحات فنی می شد. توضیحات لازم ذیل هر بخش به تفصیل آورده شده است تا تصویری جامع و کلی از چارچوب تحقیق انجام یافته ارائه شود.

ادبیات تحقیق

مقدمه
اصولاً پیدایش و رواج اصطلاح مدیریت شهری4 به مفهوم جدید آن را باید نتیجه ی تلاش های نظری و عملی برای غلبه بر انبوه مشکلات موجود در کلان شهرها به ویژه در نیمه دوم قرن بیستم دانست ( کاظمیان، 1382، صص 43و 51). مدیریت شهری معانی و محتواهای متفاوتی برای اندیشمندان مختلف در برداشته و دارد. مفاهیم و تعاریف اولیه در چارچوب سنت و طرز تلقی محدود، تکنوکراتیک و سیاست زدایی شده از مدیریت شهری ارائه شده اند. همه ی این تعاریف مدیریت شهری را در چارچوب اداره ی امور عمومی محدود می کنند(Mattingly, 1994).
امروزه شهرها با افزایش مداوم جمعیت و نیازهای اجتماعی وابسته به آن روبرو هستند ولی منابعی که در اختیار شهرداری ها قرار می گیرد به همان نسبت افزایش نمی یابد. اهمیت حفظ تعادل بین نیازهای اجتماعی، اقتصادی و محیطی نسل حاضر و آینده از طیف توسعه انسانی پایدار، تغییر پارادایمی را در مدیریت شهری و ارائه ی خدمات شهری به وجود آورده است. این تغییر پارادایم به ورود مفاهیمی چون مشارکت شهروندی، جامعه مدنی، مقتدرسازی5، مشغولیت مدنی6 و حکمرانی شهری انجامیده است(شریفیان ثانی، 1388، ص 43).
مشاوره و کسب نظر شهروندان، در صورتی که واقعی باشد، سودمند است. مخالفان نظارت شهروندی چنین نظارتی را سد راه ارائه ی خدمات مطلوب می دانند. مشارکت عمومی همواره، امری مطلوب به شمار می آید، اما برنامه ریزان در عمل، برای جلب مشارکت شهروندان با مشکل روبرویند. مشارکت گونه های مختلف دارد که برخی از آن ها عبارتند از: مشارکت از طریق مشاوره و درخواست پاسخ به پرسش ها از سوی اجتماعات و مشارکت به دلیل انگیزه های مادی که در آن اجتماع منابعی مانند نیروی کار و پول و غذا را در برابر محرک های مادی در اختیار می گذارند(شریفیان ثانی، 1388، ص 42).
یکی از جنبه های بارز مشارکت مردم در اداره ی امور شهر برقراری ارتباط با شهرداری از طریق سامانه ی مدیریت شهری 137 شهرداری تهران می باشدکه تلاش نموده با سرلوحه قرار دادن اصول شهروند مداری، محله گرایی و مشارکت مردمی به رسیدگی به درخواست ها و مشکلات مردم شهر تهران بپردازد.
از طرف دیگر، امروزه شهرداری ها نیز هم چون دیگر سازمان ها غرق در انبوه داده ها و اطلاعاتی هستند که استفاده از آن ها در بیشتر موارد، محدود به انجام کارهای جاری شده است. داده کاوی که استفاده از آن نیز روز به روز توسعه می یابد، می تواند منجر به استفاده از این اطلاعات در زمینه ی تصمیم گیری های استراتژیک شود.
در این فصل به ارائه ی مبانی نظری تحقیق، مفاهیم و ابعاد تحقیق و مدل مفهومی تحقیق می پردازیم.

مبانی نظری
تاریخچه داده کاوی
ایده ای که مبنای داده کاوی است، یک فرایند با اهمیت از شناخت الگوهای بالقوه مفید، بدیع و نهایتاً قابل درک از داده هاست. واژه «کشف دانش در پایگاه داده ها»7 که به معنای جستجوی دانش در اطلاعات است، در اوایل دهه 80 شکل گرفته است. کشف دانش و داده کاوی یک حوزه جدید، میان رشته ای و در حال رشد است که حوزه های مختلفی هم چون پایگاه داده، آمار، یادگیری ماشین8، مصور سازی9، هوش مصنوعی10، بازشناسی الگو11 و سایر زمینه های مرتبط را با هم تلفیق کرده است تا اطلاعات و دانش ارزشمند نهفته در حجم بزرگی از داده ها را استخراج نماید( فیاد و همکاران، 1996، هن و کمبر، 2006).
هن و کمبر (2006) داده کاوی را به صورت استخراج یا کاوش دانش از مقادیر عظیم داده ها تعریف کرده و داده کاوی را مهم ترین مرحله در فرایند کشف دانش معرفی کرده اند. جایگاه استخراج دانش و کاوش داده ها در شکل 2-1 نشان داده شده است.
تعریف داده کاوی
داده کاوی به استخراج یا کاوش دانش از حجم زیادی داده اطلاق می شود که در واقع تشبیهی از کاوش طلا از صخره ها و سنگ هاست. کاوش واژه ای صریح و روشن است که فرایند یافتن یک مجموعه ی کوچک از مواد با ارزش در حجم زیادی از مواد خام را توصیف می کند. به این ترتیب مفهوم داده کاوی به عنوان یک مفهوم کلی و عام مشخص می شود. واژه های دیگری هم در متون علمی دیده می شوند که مفاهیمی مشابه یا کاملاً نزدیک به داده کاوی دارند؛ مثل کاوش دانش از بانک های اطلاعاتی، استخراج دانش، تحلیل داده یا الگو.(Frawley 1992)
تعاریف مختلفی از داده کاوی ارائه شده است که چند مورد آن در زیر آورده شده است:
داده کاوی استخراج اطلاعات مفهومی، ناشناخته و به صورت بالقوه مفید از پایگاه داده می باشد (Frawley 1992).
داده کاوی به معنای یافتن نیمه خودکار الگوهای پنهان موجود در مجموعه داده های موجود می باشد( هن و کمبر 2006).
داده کاوی علم استخراج اطلاعات مفید از پایگاه های داده یا مجموعه داده ای می باشد(هاند و دیگران 2001).
داده کاوی استخراج نیمه اتوماتیک الگوها، تغییرات، وابستگی ها، نابهنجاری ها و دیگر ساختارهای معنی دار آماری از پایگاه های بزرگ داده می باشد(Larsed 2003).
داده کاوی عبارت است از فرایند اکتشاف دانش در بانک های اطلاعاتی به منظور یافتن الگوهای معتبر، مفید، جدید و قابل درک از داده ها(شهرابی، 1389).
داده کاوی مجموعه ای از تکینک های اکتشاف دانش در بانک های اطلاعاتی بر مبنای روش های پیشرفته تحلیلی است که به عنوان ابزاری برای کارکردن بر روی اطلاعات با حجم بالا و کشف الگوهای جدید در این اطلاعات به کار می رود (Gupta 2006).
داده کاوی تلاشی برای ارائه ی بینشی هوشمندانه به مدیران برای شناخت بهتر کسب و کار و پیش بینی شرایط آینده، در طی یک فرایند پیچیده است (Gupta 2006).
داده کاوی در واقع یک فن آوری میان گروهی است که با همکاری متخصصین بانک های اطلاعاتی، محرمانگی و امنیت اطلاعات، هوش مصنوعی و یادگیری ماشینی، آمار و گرافیک انجام می- شود(فیاد و همکاران، 1996، هن و کمبر، 2006).
شکل 2-1 مراحل فرایند کشف دانش و جایگاه داده کاوی(آخوندزاده نوقابی، 1388).
انواع داده کاوی
در عمل دو هدف مهم و اساسی داده کاوی، پیش بینی12 و تشریح13 است. در پیش بینی، بعضی از متغیرها یا حوزه هایی از مجموعه های داده ای به منظور پیش بینی ارزش ناشناخته یا آینده ی داده های دیگر مورد استفاده قرار می گیرند، از سوی دیگر تشریح، بر یافتن الگوهای تشریحی داده ها که می توانند به وسیله انسان تعبیر شوند تمرکز می نماید. در نتیجه داده کاوی را می توان در یکی از گروه های زیر جای داد:
در داده کاوی پیش بینی کننده با استفاده از داده ها، مدل هایی برای پیش بینی مقادیر متغیرهای مورد نظر تولید می گردد.
داده کاوی تشریحی با استفاده از الگوهایی که در اعداد می یابد به تجزیه و تحلیل و علت یابی یک یا چند پدیده می پردازد.
ازنظر پیش بینی کننده، هدف از داده کاوی تولید مدلی است که با استفاده از یک کد اجرایی، وظایفی چون پیش بینی، دسته بندی، تخمین مقدار، تخمین عملکرد و غیره را انجام دهد.
از نظر تشریح کننده، هدف حصول درکی کامل از سیستم تحلیل شده به وسیله الگوهای پنهان در آن و روابط درون مجموعه های داده ای است(مرکز مطالعات و برنامه ریزی شهر تهران 1388، ص 3).
دلایل استفاده از داده کاوی
در سال های اخیر استفاده از تکنیک های داده کاوی رشد بسیار سریعی داشته است که از دلایل این امر می توان به موارد ذیل اشاره کرد(Gupta 2006):
سهولت تولید داده ها با استفاده از پردازش تحلیلی برخط14.
افزایش داده های ایجاد شده از طریق ابزارهای الکترونیکی از قبیل تراکنش های خرید، عملیات بانک، کارت های اعتباری و ماهواره ها.
افزایش داده های ایجاد شده از طریق صفحات وب.
افزایش حجم ابزاهای ذخیره داده ها شامل انواع حافظه ها.
کاهش هزینه های پردازش اطلاعات.
وجود محیط های رقابتی با توجه به جهانی شدن کسب و کار.
وجود نرم افزارهای مفید داده کاوی.
پیش نیازهای یک داده کاوی موفق
برای انجام یک داده کاوی موثر، لازم است قبل از شروع به موارد زیر توجه داشت(Gupta 2006):
ضمن آشنایی کامل با موضوع مورد بحث، مسئله ی داده کاوی به درستی تعریف و تبیین شده باشد.
داده ها موجود باشند.
داده های موجود مرتبط، کافی، مناسب و پاک سازی شده باشند.
مسئله با روش های پرس و جو یا سایر ابزارهای کار با بانکهای اطلاعاتی قابل حل نباشد.
نتایج حاصل از داده کاوی قابل اجرا و عملیاتی باشد.
مراحل فرایند داده کاوی ( استاندارد 15CRISP-DM )
فرایند CRISP-DM یک متدولوژی استاندارد داده کاوی می باشد که در اواخر سال 1996 توسط سه شرکت بزرگ دایملر کرایسلر (بنز)16، SPSS، و NCR ایجاد گردید. این متدولوژی، یک مدل فرایندی برای داده کاوی ارائه می دهد که مروری بر چرخه ی عمر هر پروژه ی داده کاوی بوده و شامل مراحل متناظر با یک پروژه، وظایف مربوطه و ارتباط بین این وظایف می باشد.
گام های این متدولوژی در ادامه بیان شده است.

چرخه ی عمر یک پروژه ی داده کاوی، شامل 6 مرحله می باشد که در شکل2-2 نشان داده شده است. توالی این مراحل انعطاف پذیر می باشد و برگشت به مراحل قبلی و مسیر های آزاد بین مراحل گاهی مورد نیاز است. جهت پیکان هایی که در شکل مشاهده می گردد، بیان کننده ی مهم ترین و تکراری ترین وابستگی های بین مراحل می باشد.
شناخت کسب و کار17
در این مرحله لازم است که اهداف پروژه و نیازها از دیدگاه کسب و کار به طور مشخص تبیین شود. توجه به این مرحله بسیار ضروری است و با شناخت کامل اهداف می توان از قابلیت های داده کاوی بهترین استفاده را کرد و الگوریتم مناسب را انتخاب نمود(هن و کمبر 2006).
گام های این مرحله عبارتند از:
تعیین اهداف کسب و کار ( مفاهیم اولیه، اهداف و معیارهای موفقیت).
ارزیابی موقعیت ( موجودی منابع، نیازمندی ها، فرضیه ها و محدودیت ها، ریسک ها و روابط، اصطلاحات و هزینه و فایده).
تعیین اهداف داده کاوی ( اهداف داده کاوی و معیار موفقیت).
تولید طرح پروژه.
شناخت داده ها18
در این مرحله مواردی از قبیل موجود بودن داده ها، محرمانگی داده ها، چگونگی دسترسی به داده ها و میزان سیستمی بودن داده ها بررسی می شود. تحلیل صحیح در این مرحله ممکن است به تجدید نظر در مرحله یک (شناخت کسب و کار) بیانجامد. جمع آوری و آشنایی با داده ها، شناخت مسائل مربوط به کیفیت داده ها و مشاهده ی اطلاعات اولیه ی نهانی یا زیرمجموعه های داده ها که ممکن است برای آنالیز جالب باشند از وظایف این مرحله است (هن و کمبر 2006).
گام های این مرحله عبارتند از:
جمع آوری اولیه داده ها
توصیف داده ها
شناسایی داده ها
تایید کیفیت داده ها
آماده سازی داده ها19
در این مرحله داده های موجود جهت استفاده ی الگوریتم داده کاوی آماده می شود. هدف این مرحله رسیدن به چشم انداز قابل کاوش است. در این مرحله یکپارچگی، انتخاب، پاکسازی و تغییر شکل داده ها انجام می شود (هن و کمبر 2006).
گام های این مرحله عبارتند:
انتخاب داده ها
پاکسازی داده ها
ساختار دهی داده ها ( انتخاب برخی صفات و ایجاد رکوردها)

شما می توانید تکه های دیگری از این مطلب را با جستجو در همین سایت بخوانید

یکپارچه نمودن داده ها ( داده های ترکیبی)
فرمت کردن داده ها
مدل سازی20
این مرحله شامل پیاده سازی تکنیک های مدل سازی یا داده کاوی بر روی دیدگاه قابل کاوش ایجاد شده در مرحله ی قبل است (هن و کمبر 2006).
گام های این مرحله عبارتند از:
انتخاب تکنیک مدل سازی (فرضیه ها و تکنیک های مدل سازی)
ارزیابی طراحی ( طراحی آزمایشی)
ساخت مدل (پارامترهای انتخاب شده و توصیف مدل)
ارزیابی مدل (سنجش مدل و بازنگری در پارامترهای انتخاب شده)
ارزیابی مدل21
در این مرحله مدل طراحی شده مورد ارزیابی قرار می گیرد تا مشخص شود آیا اهداف داده کاوی تامین شده است . به عبارت دیگر باید مشخص شود که آیا مدل برای پاسخگویی به برخی از نیازهای کسب و کار مفید است یا خیر. بعد از ارزیابی مدل ممکن است به بازنگری در اهداف تعیین شده در مرحله ی اول منجر شود (هن و کمبر 2006).
گام های این مرحله عبارتند از:
ارزیابی نتایج
تجدید نظر در فرایند
طراحی گام های بعدی (لیست فعالیت ها و تصمیم های ممکن)
توسعه ی مدل22
ایده ی این مرحله به کارگیری پتانسیل های مدل استخراج شده، ترکیب آن با فرایند های تصمیم گیری سازمان، ارائه گزارش هایی در مورد دانش استخراج شده و … می باشد. در این مرحله مدل، پیاده سازی و اجرا می گردد و معمولاً یک رابط گرافیکی مناسب نیز برای کاربران طراحی می شود (هن و کمبر 2006).
گام های این مرحله عبارتند از:
برنامه ریزی برای توسعه
برنامه ریزی برای مانیتور و نگهداری
تولید گزارش نهایی
بازنگری مجدد پروژه
قابلیت های اساسی داده کاوی
طبقه بندی23
طبقه بندی فرایند جستجوی مجموعه ای از مدل ها یا توابع است که کلاس های داده ها یا مفاهیم را توصیف یا تفکیک می نماید. تا بتوان از این مدل برای پیش بینی کلاس اشیا استفاده کرد. مدل استخراج شده بر پایه تحلیل مجموعه ای داده های آموزشی یا داده هایی که کلاس آن ها مشخص است می باشد(هن و کمبر 2006).
فرایند طبقه بندی در واقع نوعی یادگیری با ناظر می باشد که طی دو مرحله انجام می گیرد. در مرحله اول مجموعه ای از داده ها که در آن هر داده شامل تعدادی خصوصیتِ دارای مقدار و یک خصوصیت به نام خصوصیتِ کلاس می باشد، برای ایجاد یک مدل داده به کار می رود که این مدل داده در واقع توصیف کننده مفهوم و خصوصیات مجموعه داده هایی است که این مدل از روی آن ها ایجاد شده است. مرحله دوم اعمال فرایند طبقه بندی یا به کارگیری مدل داده ایجاد شده بر روی داده هایی است که شامل تمام خصوصیات داده هایی می شود که برای ایجاد مدل داده به کار گرفته شده اند، به جز خصوصیت کلاس این مقادیر، که هدف از عمل طبقه بندی نیز تخمین مقدار این خصوصیت می باشد(هن و کمبر 2006).
پیش بینی24