توضیحات
جلسه۶: آموزش خوشه بندی داده ها در نرم افزار داده کاوی رپیدماینر
آموزش خوشه بندی: خوشه بندی داده ها یکی از مهمترین و پرکاربردترین روش هایی است که امروزه بسیار مورد توجه پژوهشگران مختلف قرار گرفته است. خوشه بندی از جمله روش های بدون نظارت یا Unsupervised است که برای گروه بندی داده های همگن استفاده می گردد. روش های خوشه بندی مختلفی از جمله K-means و X-means، سلسله مراتبی DBSCAN و غیره وجود دارد که هر کدام با استراتژی خاص خود فرآیند خوشه بندی را انجام می دهند. روش های خوشه بندی بر اساس محاسبه میزان فاصله بین نقاط تا نقطه های مرکزی، فرآیند خوشه بندی را انجام می دهند.
در این جلسه آموزشی از مجموعه دوره های آموزشی رپیدماینر، بصورت فراگیر نحوه خوشه بندی داده ها با استفاده از الگوریتم های خوشه بندی K-means، X-means، DBSCAN، K-Medio ds در نرم افزار رپیدماینر آموزش داده می شود. در این جلسه آموزشی فرآیند خوشه بندی داده ها بصورت عملی انجام شده و سورس، داده و فیلم آموزشی در اختیارتان قرار داده می شود. دیتاست در نظر گرفته شده در این جلسه آموزشی، دیتاست سرطان سینه در خانم ها است. مراحل انجام شده در آموزش در قسمت زیر لیست شده است:
- معرفی عملگر Read Excel بصورت مختصر جهت ورود دیتاست سرطان سینه
- معرفی مختصر کنترل Replace Miss Values در نرم افزار رپیدماینر جهت اعمال پیش پردازش بر روی داده ها و ضعف مقادیر پرت از آن
- معرفی الگوریتم خوشه بندی K-means و تشریع کامل پارامترهای آن جهت اعمال خوشه بندی بر روی داده ها
- معرفی خروجی های تولید شده و نمودارهای تولید شده پس از اعمال خوشه بندی
- معرفی و تشریع کنترل Write Excel جهت ذخیره سازی داده های خوشه بندی شده
- معرفی الگوریتم خوشه بندی X-Means و DBSCAN و K-Medio ds و تشریع کامل پارامترهای آن جهت اعمال خوشه بندی بر روی داده ها
بنابراین بطور کلی، در این دوره آموزشی بصورت فراگیر طریقه خوشه بندی یک مجموعه داده ها (دیتاست سرطان سینه) را با کمک انواع الگوریتم های خوشه بندی مثل K-means و X-means و DBSCAN و K-Mediods خواهید آموخت.
از مهمترین مزایای این جلسه آموزشی نسبت به سایر جلسات موجود در اینترنت این است که ضمن تحویل فیلم تهیه شده توسط برجسته ترین اساتید داده کاوی، سورس مدل های تولید شده همراه با دیتاست بصورت رایگان تحویل می گردد. علاوه بر این، کلیه الگوریتم های خوشه بندی مهم و موجود در نرم افزار داده کاوی رپیدماینر بصورت جداگانه مورد بررسی قرار گرفته و یک پروژه عملی با آن تهیه می گردد.
فهرست سرفصل ها و رئوس مطالب مطرح شده در این جلسه آموزشی، در ادامه آمده است:
برخی از مهمترین مباحثی که در این دوره آموزشی تشریح می گردد عبارتند از:
– تشریح دیتاست استفاده شده(دیتاست سرطان سینه در خانم ها) بصورت نمونه و معرفی ویژگی هدف که در مراحل خوشه بندی میبایست حذف گردد.
– معرفی کنترل Read Excel جهت ورود داده های مورد استفاده به مدل خوشه بندی تولید شده
– معرفی کنترل Replace Miss Value و اعمال به مدل جهت حذف نمونه های بلااستفاده
– معرفی کنترل Normalize و اعمال به مدل تولید شده جهت نرمال سازی داده ها و افزایش دقت خوشه بندی داده ها
– معرفی کامل الگوریتم خوشه بندی K-Means و پارامترهای مربوط به آن
– معرفی مشکلات و ضعف الگوریتم خوشه بندی K-Means و نقاط قوت این الگوریتم
– ارائه یک مثال عملی از الگوریتم خوشه بندی K-Means بروی داده های سرطان سینه در حالت نرمالایز و بدون حالت نرمالایز
– تشریح کامل خروجی ها و نتایج الگوریتم خوشه بندی K-Means
– معرفی کامل الگوریتم خوشه بندی X-Means و پارامترهای مربوط به آن
– معرفی مشکلات و ضعف الگوریتم خوشه بندی X-Means و نقاط قوت این الگوریتم
– ارائه یک مثال عملی از الگوریتم خوشه بندی X-Means بروی داده های سرطان سینه در حالت نرمالایز و بدون حالت نرمالایز
– تشریح کامل خروجی ها و نتایج الگوریتم خوشه بندی X-Means
– معرفی و تشریح بهبودهایی که الگوریتم X-Means نسبت به K-Means دارد
– معرفی الگوریتم خوشه بندی K-Mediods و پارامترهای مربوطه
– اعمال یک مدل عملی از نحوه خوشه بندی الگوریتم K-Mediods
– معرفی الگوریتم خوشه بندی DBSCAN و پارامترهای مربوطه
– اعمال یک مدل عملی از نحوه خوشه بندی الگوریتم DBSCAN
– تولید یک مدل خوشه بندی ترکیبی و ارائه سورس آن
این آموزش برای رشته های زیر مفید است:
دوره های آموزشی نرم افزار داده کاوی رپیدماینر(Rapidminer) از جلسات مقدماتی تا سطوح متوسطه و پیشرفته برای رشته هایی ذیل مناسب و مفید می باشد.
– رشته کامپیوتر گرایش های نرم افزار، سخت افزار و معماری
– رشته تجارت الکترونیک
– رشته برنامه نویسی
– رشته فناوری اطلاعات
– و سایر رشته های مرتبط
قسمتی از جلسه آموزش شماره ۶ از مجموعه جلسات دوره آموزشی نرم افزار داده کاوی رپیدماینر، از طریق پیش نمایش زیر قابل مشاهده است.در ویدئو زیر ۴۰ دقیقه و ۳۵ ثانیه آموزش ضبط شده توسط استاد بهنام حیدری تهیه و تنظیم گردیده است.
با خرید کامل دوره با ۳۰% تخفیف ویژه از طریق این لینک تنها با پرداخت ۳۶۸٫۲۰۰ هزار تومان ۱۹جلسه را باهم خریداری نمایید.
نقد و بررسی ها
هیچ دیدگاهی برای این محصول نوشته نشده است .