برخي از الگوريتمهاي داده کاوي

 

امروزه با حجم عظيمي از داده ها روبرو هستيم. براي استفاده از آنها به ابزارهاي كشف دانش نياز داريم. داده كاوي به عنوان يك توانايي پيشرفته در تحليل داده و كشف دانش مورد استفاده قرار مي گيرد. داده كاوي در علوم )ستاره شناسي(...،در تجارت )تبليغات، مديريت ارتباط با مشتري،...( در وب )موتورهاي جستجو،...( در مسايل دولتي )فعاليتهاي ضد تروريستي،...( كاربرد دارد. عبارت داده كاوي شباهت به استخراج زغال سنگ و طلا دارد. داده كاوي نيز اطلاعات را كه در انبارهاي داده مدفون شده است، استخراج مي كند.

 

داده كاوي به عنوان مهمترين كاربرد Data Warehouse يا انباره هاي داده شناخته مي شود . به وسيله داده كاوي داده هاي موجود مورد تحليل قرار مي گيرند تا روندهاي احتمالي، ارتباطهاي غير محسوس و الگو هاي مخفي داده ها از بين انبوه داده ها، شناسايي شوند. در اين فرايند از الگوريتم هاي پيچيده رياضي و آماري استفاده مي شود تا داده ها تبديل به دانش سازمان شوند.

 

در واقع هـــــدف از داده كاوي ايجاد مدل هايي براي تصميم گيري است. اين مدلها رفتارهاي آينده را براساس تحليلهاي گذشته پيش بيني مي كنند. به كاربردن داده كاوي به عنوان اهرمي براي آماده سازي داده ها و تكميل قابليتهاي انباره داده، بهترين موقعيت را براي به دست آوردن برتريهاي رقابتي ايجاد مي كند.

 

 

الگوريتمهاي داده کاوي:

 

  1.  Association algorithm - الگوريتم وابستگي

الگوريتم وابستگي نوعي آناليز پيوندي است كه براي تشخيص رفتار يك رويداد و يا يك پروسهي خاص استفاده ميشود .

 

اين الگوريتم از دو بخش شرط و نتيجه تشكيل شده. بخش شرط يك آيتم خاص از اطلاعات را كشف و در بخش نتيجه آيتمي ديگر از اطلاعات كه وابسته به شرط است را پيدا ميكند. در واقع شرحي از دو كلمهي "اگر" و "پس" ، براي كشف رابطههاي ناشناخته ميان اطلاعات است. براي مثال، ميتوان گفت كه "اگر" شخصي چكش بخرد "پس" به احتمال 80 درصد ميخ هم خريداري ميكند. الگوريتم وابستگي بسيار مفيد است چراكه توسط آن ميتوانيم رفتار مشتريان را تجزيه و تحليل و پيشبيني كنيم. بعلاوه اين الگوريتم نقش مهمي در تحليل اطلاعات سبد خريد و چيدمان محصولات دارد كه در نتيجه سبب ميشود تا كالاها را به صورت هدف دار به مشتريان پيشنهاد دهيم.

 

  1.  Clustering algorithm - الگوريتم خوشه بندي

خوشهبندي از جمله الگوريتمهاي دستهبندي دادهكاوي است. الگوريتم خوشهبندي اطلاعاتي را كه ويژگيهاي نزديك به هم و مشابه دارند را در قطعه هايي جداگانه كه به آن خوشه گفته ميشود قرار ميدهد. به بيان ديگر خوشه بندي همان دسته بنديهاي سادهاي است كه در كارهاي روزانه انجام ميدهيم. وقتي با يك مجموعه كوچك از صفات روبرو باشيم اين دسته بندي به سادگي قابل اجراست، براي مثال در يك مجموعه از خودكارهاي آبي، مشكي، قرمز و سبز به راحتي ميتوانيم آنها را در 4 دسته قرار دهيم اما اگر در همين مجموعه ويژگيهاي ديگري مثل سايز، شركت سازنده ،وزن، قيمت و... مطرح باشد كار كمي پيچيده ميشود. حال فرض كنيد در يك مجموعه متشكل از هزاران ركورد و صدها ويژگي قصد دسته بندي داريد، چگونه بايد اين كار را انجام دهيد؟! 

 

بخش بندي دادهها به گروهها يا خوشههاي معنادار به طوري كه محتويات هر خوشه ويژگيهاي مشابه و در عين حال نسبت به اشياء ديگر در ساير خوشهها غير مشابه باشند را خوشهبندي مي گويند. از اين الگوريتم در مجموعه دادههاي بزرگ و در مواردي كه تعداد ويژگيهاي داده زياد باشد استفاده ميشود. گاهي اوقات ممكن است با مشاهده اوليه ،خوشهبندي انجام شده منطقي به نظر نرسد اما با كمي تحليل متوجهي دقت اين الگوريتم مي شويد.

 

 

2.  Decision Trees  algorithm - الگوريتم درخت تصمیم

درخت تصميم يكي از قويترين و پركاربردترين الگوريتمهاي داده كاوي است كه براي كاوش در داده ها و كشف دانش كاربرد دارد. اين الگوريتم دادهها را به مجموعه هاي مشخصي تقسيم ميكند. هر مجموعه شامل چندين زير مجموعه از دادههاي كم و بيش همگن كه داراي ويژگيهاي قابل پيش بيني هستند تقسيم مي شود . براي مثال فرض كنيد كه اطلاعاتي از محصولات فروخته شده خود داريد. با بررسي اين اطلاعات مشخص ميشود كه تعداد 9 فروش از 10 فروش محصول دوچرخه توسط افراد 15 تا 25 ساله انجام گرفته است و تنها يك فروش براي افراد بالاي 25 سال داشته ايد .

 

از اين اطلاعات ميتوان نتيجه گرفت كه سن مشتري نقش مهمي در فروش دوچرخه هاي شما دارد. الگوريتم درخت تصميم نيز اينگونه عمل ميكند، در مورد يك هدف خاص چندين ويژگي را تجزيه و تحليل كرده و شرايط را براي پيشبيني و هدفمندي فروش فراهم مي كند.

 

3.  Linear Regression algorithm - الگوريتم رگرسیون خطي

رگرسيون فن و تكنيكي آماري براي بررسي و مدل سازي روابط ميان داده ها است. رگرسيون خطي از فرمولهاي مناسبي جهت محاسبه مقادير A و B براي رسيدن به پيش بيني C استفاده ميكند. رگرسيون در داده كاوي تنوع ديگري از درخت تصميم است به شكلي كه به محاسبه ي يك ارتباط خطي ميان متغيرهاي وابسته و غير وابسته كمك مي كند. محاسبه هاي انجام شده در پيش بينيها كاربرد دارند.

 

4.  Naive Bayes Algorithm - الگوريتم بیز

اين الگوريتم بر پايه ي قضيه بيز براي مدل سازي پيشگويانه ارائه شده است. قضيه بيز از روشي براي دسته بندي پديدهها بر پايه احتمال وقوع يا عدم وقوع يك پديده استفاده مي كند و احتمال رخ دادن يك پديده محاسبه و دسته بندي مي شود.

 

به مثال زير توجه كنيد:

بخش بازاريابي شركت قصد دارد به عنوان يك استراتژي تبليغاتي براي مشتريان بالقوه نامه هاي تبليغاتي ارسال كند .

 

از طرفي براي كاهش هزينه ها قصد دارد فقط به مشترياني كه علاقه مند هستند و ممكن است واكنش مثبت نشان دهند نامه ها را ارسال كند. در پايگاه داده شركت اطلاعاتي از افرادي كه به نامه هاي قبلي واكنش نشان داده بودند ذخيره شده است. آنها مي خواهند ببينند كه به وسيله اطلاعات آماري مانند سن، موقعيت مكاني و به وسيله مقايسه پتانسيل مشتريان بالقوه با مشترياني كه مشخصات مشترک دارند و اينكه چه اشخاصي در گذشته از شركت خريداري كرده است مي توانند به واكنش ها و پاسخهاي دريافتي خود بي افزاييند. به طور كلي مي خواهند تفاوت مشترياني كه محصول خريداري كرده اند و مشترياني كه هيچ محصولي نخريده اند را پيدا كنند.

 

با استفاده از الگوريتم بيز سازمانها براي بازاريابي مي توانند نتيجه را براي يك مشتري خاص به سرعت پيش بيني كنند، بنابراين مشخص مي شود كه كدام مشتري علاقه بيشتري به پاسخ دادن نامه دارد.

 

5.  Neural Network Algorithm - الگوريتم شبکه هاي عصبي

شبكه هاي عصبي از پركاربردترين و عملي ترين روشهاي مدلسازي مسائل پيچيده و بزرگ كه شامل صدها متغير هستند مي باشد. شبكه هاي عصبي ميتوانند براي مسائل طبقه بندي كه خروجي يك كلاس است يا مسائل رگرسيون كه خروجي يك مقدار عددي است استفاده شوند.

 

هر شبكه عصبي شامل يك لايه ورودي است كه هر گره در اين لايه معادل يكي از متغيرهاي پيش بيني مي باشد. اين الگوريتم براي تجزيه و تحليل دادههاي پيچيدهاي كه انجام آن توسط ساير الگوريتم ها به سادگي انجام نمي گيرد كاربرد دارد .

 

6. الگوريتم شبكه هاي عصبي در موارد زير پيشنهاد مي شود:

  1. بازاريابي، مانند رسيدن به موفقيت در ارسال نامههاي تبليغاتي
  2. پيشبيني حركت سهام، نوسانات نرخ ارز و يا ساير اطلاعات سيال مالي كه داراي پيشينه هستند
  3. تجزيه و تحليل فرآيندهاي توليدي و صنعتي
  4. متن كاوي و هر مدل پيشبيني كه شامل تحليل هاي پيچيدهاي از ورودي هاي زياد و خروجي هاي نسبتا كم باشد.

 

7. Logistic regression algorithm - الگوريتم رگرسیون منطقي يا لجستیک

رگرسيون منطقي يك روش آماري براي مدل سازيهايي كه نتايج دودويي دارند، است. براي شرايطي كه هدف برآورد مفاهيمي چون "رخ دادن" يا "رخ ندادن" است مانند نتيجه ي يك مسابقه فينال كه دو حالت بيشتر ندارد.

 

ممكن است مقادير پيشبيني شده بي معني باشد و يا در عمل تفسير پذير نباشند يا امكان مقايسه مقادير پيشبيني با هم نباشد كه ممكن است از نتايج الگوريتمهاي درخت تصميم و رگرسيون خطي باشد در چنين شرايطي براي رفع ابهامات از اين الگوريتم استفاده ميشود.

 

از اين مدل براي بدست آوردن نتايج بهينه پيشبيني استفاده مي شود.  از رگرسيون لجستيك ميتوان به عنوان تنوع ديگري از الگوريتم شبكه هاي عصبي نام برد. رگرسيون منطقي يك مدل آماري رگرسيون براي متغيرهاي باينري است.

 

 

8. Sequence Clustering algorithm - الگوريتم خوشهبندي زنجیرهاي

اين الگوريتم شباهت زيادي به خوشه بندي دارد اما برخلاف الگوريتم خوشه بندي، خوشه ها را بر پايه يك مدل جستجو ميكند و نه بر اساس شباهت ركوردها. اين مدل زنجيرهاي رويدادها را بر اساس زنجيرهي ماركوف ايجاد مي كند. در زنجيرهي ماركوف توزيع احتمال شرطي حالت بعدي تنها به حالت فعلي بستگي دارد و به وقايع قبل از آن وابسته نيست. زنجيره ماركوف ابتدا يك ماتريسي از تركيب تمامي وضعيتهاي شدني امكان پذير ايجاد مي كند و سپس در هر خانهي ماتريس احتمالات حركت از يك وضعيت به وضعيت ديگر را ثبت ميكند. از طريق اين احتمالات محاسباتي انجام ميشود كه در نتيجه يك مدل بر پايهي آن ايجاد مي شود. به مثال زير توجه كنيد:

 

فرض كنيد براي فروش اينترنتي محصولات خود يك وبسايت داريد كه اطلاعات كاربران و صفحات بازديد شده ثبت مي شود. هر مشتري براي خريد بايد اطلاعاتي از خود در سايت ثبت كند و با هر كليك مشتريان، اطلاعاتي از مشتري و صفحه ثبت ميشود. با استفاده از الگوريتم خوشه بندي زنجيرهاي بر روي اين اطلاعات مي توانيد مشترياني كه كليك ها و الگوهاي مشابه داشته اند را گروه بندي كنيد. با تحليل گروه بنديها مي توانيد بفهميد كه چه كاربراني به سايت شما مي آيند، كدام صفحات سايت شما پر بازديدتر هستند و ارتباط بيشتري با فروش هاي شما دارند و صفحه ي بعدي از سايت شما كه بازديد خواهد شد، كدام است. 

 

رایان طبیب

 
·  نظر دهی 
· اشتراک گذاری :


برچسب ها   :





کلمات کلیدی
کلمات کلیدی :
كشف ,
مي ,
هاي ,
اين ,
كه ,
يك ,
يا ,
شرط ,
خاص ,
دو ,
كار ,
حال ,
غير ,
كمي ,
پيش ,
فرض ,
25 ,
نقش ,
نيز ,
هدف ,
مدل ,
خطي ,
ي ,
بيز ,
زير ,
قصد ,
سن ,
يكي ,
كم ,
عمل ,
ثبت ,
چه ,





برای ارسال نظر ‎‏ ، همین امروز در وب سایت رایان طبیب ثبت نام کنید.

ورود


مقالات طراحی سایت

مقالات سئو و بهینه سازی سایت

مقالات علمی

کلیه حقوق متعلق به رایان طبیب می باشد.
طراحی سایت،بهینه سازی سایت،طراحی وب سایت،بهینه سازی وب سایت،سئو,صابر فضلی احمدی,Saber Fazli Ahmadi
طراحی سایت حرفه ای،طراحی وب،طراحی وب سايت،فروشگاه،بهینه سازی،طراحی وب سایت،سئو,صابر فضلی احمدی,Saber Fazli Ahmadi
طراحی و توسعه سایت رایان طبیب | 2018 ©