[الگوریتم شبکه های عصبی هوشمند] بررسی الگوریتم Kmeans تکاملی برای مجموعه داده های توزیع شده

یکی از چالش‌های خوشه‌بندی برخورد با داده‌های توزیع ‌شده در مخازن جدا است، چرا که اغلب تکنیک‌های خوشه‌بندی نیازمند این هستند که داده‌ها متمرکز باشند. k-means، به عنوان یکی از الگوریتم‌های داده‌کاوی به دلیل ساد‌گی، مقیاس‌پذیری، و تغییرپذیری راحت به انواع زمینه‌ها و حوزه‌های کاربردی انتخاب شده‌است. اگرچه نسخه‌های توزیع شده k-meansارائه شده‌اند، اما این الگوریتم هنوز به انتخاب الگوی خوشه‌بندی اولیه حساس است و نیازمند این است که تعداد خوشه‌ها از قبل مشخص شده باشند. در این راستا استفاده از الگوریتم‌های تکامل یافته برای غلبه بر محدودیت‌های k-means را پیشنهاد می‌کنیم و در همین زمان، با داده‌های توزیع شده سرو کار داریم. دو رویکرد توزیع متفاوت به بکاررفته است: ابتدا بدست آوردن مدل نهایی یکسان برای نسخه متمرکز الگوریتم خوشه‌بندی، دوم تولید و انتخاب خوشه‌ها برای هر زیرمجموعه داده توزیع شده و ترکیب آنها پس از آن. الگوریتم‌ها با تجربیات بدست آمده از دو دیدگاه مقایسه می‌شوند: مورد نظری، از طریق تجزیه‌وتحلیل پیچیدگی مجانبی، و نمونه آزمایشی، از طریق ارزیابی مقایسه نتایج بدست آمده از مجموعه آزمایشات و تست‌های آماری. نتایج بدست آمده مبنی بر اینست که برای هرسناریو نرم افزار گونه های مختلفی مناسب است.

بنابراین در راستای معرفی الگوریتم های مورد استفاده در داده کاوی و شبکه های عصبی هوشمند سعی براین است که در روزها و هفته های آتی خیلی تخصصی تر در زمینه های مختلف هوش مصنوعی مسائل مورد بحث و بررسی قرار گیرند.

Reference: Evolutionary k-means for distributed data sets