ترجمه مقاله طراحی و پیاده سازی خوشه بندی اسناد توزیع شده بر پایه MapReduce
دسته بندی ترجمه مقاله
بازدید ها 368
فرمت فایل docx
حجم فایل 234 کیلو بایت
تعداد صفحات فایل 8
قیمت: 13,500 تومان
ترجمه مقاله طراحی و پیاده سازی خوشه بندی اسناد توزیع شده بر پایه MapReduce

فروشنده فایل

کد کاربری 6
کاربر

عنوان انگلیسی مقاله: Design and Implement of Distributed Document Clustering Based on MapReduce

عنوان فارسی مقاله: طراحی و پیاده سازی خوشه بندی اسناد توزیع شده بر پایه MapReduce

فرمت فایل ترجمه شده: WORD (قابل ویرایش)

تعداد صفحات فایل ترجمه شده: 8

جهت دانلود رایگان نسخه انگلیسی این مقاله اینجا کلیک نمایید

ترجمه ی سلیس و روان مقاله آماده ی خرید می باشد

قیمت : 13500 تومان

 

چکیده ترجمه :

در این مقاله ما توضیح میدهیم که Document Clustering برای مجموعه های بزرگ بوسیله Map-Reduce چگونه میتواند به طور موثر اجرا شود. Hadoop یک چارچوب مناسب و انعطاف پذیر برای محاسبات توزیع شده  خوشه ای از ماشین آلات کالا پیاده سازی و فراهم می کند. در این مقاله طراحی و پیاده سازی tfidf و الگوریتم K-Means در Map Reduce ارائه شده است. از همه مهمتر، کارایی و اثربخشی از الگوریتم بهبود یافته است و در نهایت، ما در مورد برخی نتایج بحث های مرتبطی خواهیم داشت.

واژه های مرتبط :  Map-Reduce, tfidf, K-Means clustering

مقدمه :

با توسعه سریع اینترنت، حجم عظیمی از اسناد باید در یک زمان کوتاه پردازش شود. تحقیق در وب کاوی در مورد  روش مقیاس پذیر و قابل انطباق با اسناد جمعی تمرکز دارد [1]. ذخیره سازی و محاسبات جرم داده های اسناد در یک سیستم توزیع شده یک روش جایگزین است [2]. در محاسبات توزیع شده، مشکل تقسیم وظایف است، به طوری که هر کدام توسط یک کامپیوتر حل شود. با این حال، بسیاری از مشکلات مانند برنامه ریزی کار، تحمل خطا و ارتباط بین دستگاه برای برنامه نویسان با تجربه کم، با سیستم موازی و توزیع شده بسیار مشکل است. در این مقاله ما تجربه ها و یافته های Document Clustering را بر اساس  Map-Reduce توصیف می کنیم. Map-Reduce [3] ، یک چارچوب است که برنامه نویسان تنها نیاز به مشخص نمودن تابع Map  و Reduce  دارند تا وظیفه های بزرگ را به صورت موازی در مورد خوشه های بزرگ بر روی ماشین آلات کالا اجرا نمایند. در مرحله پیش پردازش سند ، ما یک الگوریتم تکرار شونده برای محاسبه وزن tfidf در Map-Reduce  به منظور ارزیابی مهم بودن یک دوره برای  یک سند در یک مجموعه طراحی میکنیم. سپس یک Mean Cluster در Map Reduce اجرا می شود تا تمام اسناد رو به k خوشه تقسیم کند که هر سند متعلق به یک خوشه با همین معنا است. از همه مهمتر، در می یابیم که نادیده گرفتن شرایط با بالاترین فرکانس سند نمی تواند سرعت الگوریتم ما در Map-Reduce را بهبود ببخشد ، اما دقت خوشه سند را کمی بهبود می بخشد. آزمایش نشان می دهد که روش مار رشد تقریبا خطی  در زمان مورد نیاز در حال اجرا  با افزایش اندازه مجموعه برای مجموعه های حاوی  چند ده هزار سند خواهد داشت.

فایل های مرتبط ( 15 عدد انتخاب شده )
ترجمه مقاله تاثیر سرمایه‌گذاری بازاریابی رابطه‌مند بر قدردانی مشتری در خرده فروشی
ترجمه مقاله تاثیر سرمایه‌گذاری بازاریابی رابطه‌مند بر قدردانی مشتری در خرده فروشی

ترجمه مقاله مدل صفی زنجیره تامین با استراتژی تعویق فرم
ترجمه مقاله مدل صفی زنجیره تامین با استراتژی تعویق فرم

ترجمه مقاله طراحی شبکه های توزیع لجستیک شهری کم کربن با استقرار منابع
ترجمه مقاله طراحی شبکه های توزیع لجستیک شهری کم کربن با استقرار منابع

ترجمه مقاله برنامه ریزی LID-BMP برای کنترل آب باران شهری
ترجمه مقاله برنامه ریزی LID-BMP برای کنترل آب باران شهری

استفاده از المان اتصال تیر به ستون به منظور تجزیه و تحلیل قاب بتن مسلح
استفاده از المان اتصال تیر به ستون به منظور تجزیه و تحلیل  قاب بتن مسلح

ترجمه مقاله تست بازسازی شهری با استفاده از فرهنگ و هنر در شهر سنبا
ترجمه مقاله تست بازسازی شهری با استفاده از فرهنگ و هنر در شهر سنبا

ترجمه مقاله ما نیاز به جایی برای ترک سیگار داریم
ترجمه مقاله ما نیاز به جایی برای ترک سیگار داریم

ترجمه مقاله مروری بر سیستم تعلیق الکترومغناطیسی برای وسایل نقلیه مسافری
ترجمه مقاله مروری بر سیستم تعلیق الکترومغناطیسی برای وسایل نقلیه مسافری

ترجمه مقاله مدل تاثیر بر سیاست استراتژیک منابع انسانی و برنامه ریزی و مدیریت
ترجمه مقاله مدل تاثیر بر سیاست استراتژیک منابع انسانی و برنامه ریزی و مدیریت

ترجمه مقاله استرس مادر و کیفیت زندگی خانواده در پاسخ به یک کودک مبتلا به اوتیسم
ترجمه مقاله استرس مادر و کیفیت زندگی خانواده در پاسخ به یک کودک مبتلا به اوتیسم

ترجمه مقاله حاکمیت سازمانی و سیستم‌های اخلاقی: تعهد با رویکرد اعتماد سازی
ترجمه مقاله حاکمیت سازمانی و سیستم‌های اخلاقی: تعهد با رویکرد اعتماد سازی

ترجمه مقاله تشخیص حرکت شی در زمینه پویا
ترجمه مقاله تشخیص حرکت شی در زمینه پویا

ترجمه مقاله ردیابی شی فقط با نشانه زمینه
ترجمه مقاله ردیابی شی فقط با نشانه زمینه

ترجمه مقاله بهینه سازی تولید شکلات از طریق قابلیت ردیابی
ترجمه مقاله بهینه سازی تولید شکلات از طریق قابلیت ردیابی

ارزیابی اثر انتقال راه حل‌های مرکزی آبی به راه حل‌های غیر مرکزی بر زیرساختارهای موجود
ارزیابی اثر انتقال راه حل‌های مرکزی آبی به راه حل‌های غیر مرکزی بر زیرساختارهای موجود

پشتیبانی از تمامی بانک ها-فراهمکار

بالا