۲-۱۳ نتیجه گیری
در ابتدا بحثی تحت عنوان استخراج نیازمندیها به عنوان اولین و مهمترین مرحله در مهندسی نیازمندیها مطرح گردید. دیدیم که اهمیت این مرحله تا به جایی است که هرگونه ضعف و کم و کاستی در آن به صورت تصاعدی در مراحل بعدی مهندسی نیازمندیها اعم از تحلیل، تعیین و مدیریت نیازمندیها تأثیر گذار است.
در ادامه بحث استخراج نیازمندیها به مسئله سازمانها و سامانههای بزرگ مقیاس که ممکن است گسترهای بزرگ از ذینفعان را در بر گیرد برخوردیم و دریافتیم که روشهای سنتی استخراج نیازمندیها اعم از مصاحبه، مشاهده، نمونه سازی و … با توجه به تعداد زیاد ذینفعان، حجم بزرگ پایگاه دادههای امروزی و … اجازه بکارگیری روشهای سنتی را به مهندسان نیازمندی نمیدهد. از این رو دریافتیم باید روشها و تکنیکهای بهینه دیگری توسعه داده شوند تا در مقیاسهای بزرگ به استخراج هر چه کاملتر و صحیحتر نیازمندیها کمک کنند.
در پی آن به بررسی ابزارهایی پرداختیم که در مراحل مختلف مهندسی نیازمندیها مورد استفاده قرار میگیرند. در برخی موارد دیدیم که این ابزارها صرفاً با اهداف دیگری توسعه داده شده بودند اما در بحث مهندسی نیازمندیها از آنها استفاده میشد. هر کدام دارای مزایا و معایبی بودند و بسته به سطح جزئیات، میزان رسمیت، اهداف و عملیاتهای گوناگون در مراحل مختلف مهندسی نیازمندیها مورد استفاده قرار میگرفتند.
در پی این تحقیقات به این نتیجه رسیدیم که در مقیاسهای بزرگ علاوه بر استخراج نیازمندیها درگیر مسائلی چون شناسایی و پیش بینی نیازهای دیگر ذینفعان، هدایت ذینفعان در ارائه خواستههایشان، اولویت بندی نیازها و دیگر موارد هستیم. در اینگونه موارد دریافتیم بحث داده کاوی به عنوان مرحلهای از کشف دانش کمک شایانی به بحث استخراج دانش نهفته در حجم عظیم دادهای خام موجود در پایگاه دادههای بزرگ میکند. میدانیم که در دنیای امروز جمع آوری اطلاعات کار دشواری نیست، بحث مهم استخراج دانش مورد نیاز از این اطلاعات است. به عنوان مثال پایگاه داده موجود در سازمان مدیریت شهری ۱۳۷ شهرداری تهران را در نظر بگیرید. این پایگاه داده که از طریق درگاههای ارتباطی متفاوتی چون سامانه اینترنتی، پیام کوتاه و تماس تلفنی به ثبت نیازها، خواستهها، پیشنهادات و انتقادات شهروندان میپردازد با میلیونها رکورد ثبتی دارای مقیاس بسیار بزرگی بوده که در شناسایی، استخراج، اولویت انجام نیازها و دیگر موارد ناگزیر به استفاده از روشهای هوشمندی چون داده کاوی هستیم. امروزه سازمانها در دریای دادهها و اطلاعات غرق شدهاند، حال آنکه گرسنه دانش از این اطلاعات هستند.
در پی بکار گیری داده کاوی در بحث استخراج نیازمندیها به مروری بر تحقیقات کارلوس کاسترو [۴, ۵]، نیلوفر مولا [۱۴] و دیگر محققان پرداختیم. دیدیم که این محققان چگونه با بکار گیری داده کاوی بر مسائل و مشکلات در استخراج نیازمندیها در مقیاسهای بزرگ تا حدودی نائل آمدند. آنان با بکار گیری این تکنیک توانستند مسائل مهمی چون پیش بینی و اولویت بندی نیازها را در کار خود بگنجانند چرا که در مقیاسهای بزرگ نیاز به پیش بینی و اولویت بندی احساس میگردد.
دو نمونه کار مرتبط بر روی پایگاه داده موجود در سامانه مدیریت شهری ۱۳۷ شهرداری تهران انجام شده بود که به دلیل مشکلاتی اعم از منطق غلط در خوشه بندی و اولویت بندی ما را بر آن داشت که با مشاوره خبرگان و صاحب نظران شهرداری تهران به انجام این تحقیق بپردازیم. مشکلات کارهای مرتبط شامل مواردی به شرح زیر بود:
-
- خوشه بندی بر اساس فرکانس تکرار و میزان رضایتمندی شهروندان بوده که مثالهای نقض آن پیشتر توضیح داده شد.
-
- در اولویت بندی برخی نیازمندیها نادیده گرفته میشدند که این امر خلاف نظر شهرداری تهران میباشد.
-
- پیچیدگی زمانی بالایی را داشتند.
-
-
-
- برخی کارهای مرتبط را در استخراج نیازمندیهای سازمان نمیتوان بکار گرفت و صرفاً برای پیاده سازی در پروژههای نرمافزاری بودند.
(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))
-
-
اما میتوان گفت پژوهش قابل توجهی در بحث استخراج و اولویت بندی نیازها به کمک داده کاوی در سازمانهای بزرگ مقیاس بخصوص در کشور ایران انجام نشده است. نقاط ضعف روشهای ارائه شده در [۲, ۱۳] که سعی بر بکار گیری روشهای هوشمندی چون داده کاوی در شناسایی و اولویت بندی نیازهای شهروندان ما را بر آن داشت تا در ادامه تحقیقات خود به ارائه چارچوبی نوین در بحث استخراج نیازمندیها در مقیاسهای بزرگ در سازمانهای کشورمان بپردازیم.
بررسی کاربرد تکنیکهای داده کاوی در حوزه خدمات شهری و عمومی موضوعی است که در این تحقیق مورد بررسی قرار میگیرد. مورد مطالعه در این تحقیق، سامانه ۱۳۷ شهرداری تهران که مرکز رسیدگی و ساماندهی به مشکلات شهری است میباشد.
ما با ارائه چارچوب پیشنهادیمان به شناسایی نیازها، روابط بین آنها و اولویت بندی نیازمندیها در پایگاه داده سامانه مدیریت شهری شهرداری تهران پرداخته که از جمله مزایای این چارچوب میتوان به موارد زیر اشاره کرد:
قابلیت بکار گیری در مقیاسهای بزرگ
شناسایی نیازهای شهروندان بر اساس دو متغیر فرکانس تکرار و درجه اهمیت
قابلیت تفکیک به نیازهای عملیاتی و غیر عملیاتی
اولویت بندی نیازها بر اساس تکنیک رتبه بندی
رضایتمندی شهروندان
فصل سوم
روش تحقیق
فصل سوم
روش تحقیق
۳-۱ مقدمه
در این فصل قصد داریم به دلیل پوشش نقاط ضعف کارهای مرتبط انجام شده به ارائه راهکار پیشنهادی خود بپردازیم. مطالعه موردی و یافتههای تحقیق انجام شده نیز در فصل بعد تشریح خواهد گردید.
۳-۲ راهکار پیشنهادی
راهکار پیشنهادی شامل چهار مرحله اصلی بوده که سه مرحله ابتدایی آن همانند فرایند کشف دانش بوده که شامل آماده سازی و پیش پردازش داده، یادگیری مدل و ارزیابی و تفسیر مدل میباشد، سپس در مرحله آخر آن یعنی مرحله چهارم به اولویت بندی نیازمندیهای استخراج شده میپردازیم.
مراحل اصلی راهکار پیشنهادی را در شکل۳-۱ میبینید:
شکل۳-۱: مراحل اصلی راهکار پیشنهادی
هر مرحله شامل چندین فاز انجام شده بر روی مطالعه موردی میباشد که در این قسمت به تشریح این فازها میپردازیم.
۳-۲-۱ آماده سازی و پیش پردازش داده
اولین و مهمترین مرحله در فرایند داده کاوی آماده سازی و پیش پردازش داده میباشد. هدف در این مرحله تأمین ورودی مناسب برای مرحله حیاتی یادگیری مدل است. خروجی در مرحله آماده سازی داده عبارتست از داده پیش پردازش شده که امکان یادگیری مدل از روی آن وجود دارد.
این مرحله شامل چندین گام مهم میباشد که در شکل۳-۲ این گامها را میبینید:
شکل۳-۲: گامهای مرحله آماده سازی و پیش پردازش داده
البته لازم به ذکر است این مرحله شامل گامهای دیگری نیز میباشد، اما در این تحقیق به دلیل استفاده از این گامها سعی کردیم فقط به تشریح همین گامها بپردازیم. همچنین ترتیب استفاده از این گامها ممکن در پیاده سازیهای متفاوت گوناگون باشد.
۳-۲-۱-۱ جمع آوری و بارگذاری دادههای استخراج شده
اولین گام در مرحله آماده سازی داده، استخراج داده از منابع دادهای موجود است.در این گام میبایست دادهها که در منابع مختلفی پراکنده شدهاند، به صورت متمرکز در یک محل جمع آوری شده و یک انباره داده مرکزی ایجاد شود. در پیش پردازش دادهها مجموعه دادهای که هدف کاوش آنها را داریم از این مجموعه داده انتخاب میشوند. در این مقاله ما دادهها را به صورت پرسشهایی از پایگاه دادههای سازمان فناوری اطلاعات و ارتباطات شهرداری مهیا کرده که اندازه این دادهها بیش از دو میلیون رکورد از نیازهای ثبت شده شهروندان در فصل بهار سال ۱۳۹۲ میباشد.
۳-۲-۱-۲ پاک سازی داده
در این گام ابتدا چگونگی رفع مشکل Missing Valueها (مقادیری که در دسترس ما نیستند) را بیان کنیم. در این مرحله با انواع مشکلاتی که کیفیت داده را به مخاطره میاندازند مقابله کنیم. نویز، مقادیر از دست رفته و دادههای تکراری از این قبیل هستند. در دادههای جمع آوری شده برای انجام این تحقیق تمام ویژگیهایی که بیش از نیمی از مقادیر آنها دارای مقدار Null بودند را حذف کردیم.
۳-۲-۱-۳ انتخاب زیر مجموعهای از ویژگیها
زمانی که تمایل داریم فقط نظم بخش خاصی از مجموعه داده را مورد بررسی قرار دهیم، از این روش استفاده میکنیم. در واقع باید ویژگیهایی که در عمل کاوش، غیر مرتبط هستند را باید از فرایند حذف کنیم. برای انجام این تحقیق ما به برخی ویژگیها مانند آدرس، شماره تماس، نام شهروند و … نیازی نداشتیم و این ویژگیها را از فرایند کاوش حذف کردیم.
۳-۲-۱-۴ فیلترینگ نمونهها
در عملیات فیلترینگ نمونهها سطرهای ویژهای که میخواهیم بر روی آنها کار کنیم انتخاب میشوند. ممکن است بخواهیم نظم خاصی را در میان زیر مجموعهای از رکوردها بیابیم که در این صورت بهتر است رکوردهای افزونه را از فرایند کاوش حذف کنیم تا حتیالامکان پیچیدگی زمانی و فضایی را به حداقل برسانیم. دادههای جمع آوری شده در این تحقیق شامل اطلاعات تمام مناطق و نواحی شهر تهران بوده که برای پیاده سازی تصمیم گرفتیم مناطق را بصورت جداگانه در نظر گرفته و فقط رکوردهای مربوط به منطقه ۱۲ را مورد بررسی قرار دادیم.
۳-۲-۱-۵ تبدیل داده
تبدیل داده یعنی اینکه مقادیر بعضی از فیلدها را تغییر دهیم. در عملیات تبدیل دادهها از یک تابع استفاده میشود که مجموعه کل مقادیر یک ویژگی مفروض را به یک مجموعه جدیدی از مقادیر نگاشت میکند. به عنوان مثال در این تحقیق به یک ویژگی تحت عنوان فرکانس تکرار درخواستهای شهروندان نیاز داشتیم که محاسبه کردیم.
۳-۲-۱-۶ خلق ویژگی
این عملیات عبارت است از خلق ویژگیهای جدیدی که بتوانند در کنار سایر ویژگیهای پیشین اطلاعات مهم موجود در یک مجموعه داده را مؤثرتر و کاملتر از ویژگیهای اولیه نمایش دهد. در انجام این تحقیق ما یک ویژگی تحت عنوان درجه اهمیت نیازمندی توسط خبرگان سامانه مدیریت شهری ۱۳۷ شهرداری تهران تعریف کردیم تا بتوانیم عمل خوشه بندی را بر اساس آن انجام دهیم.