پایگاه داده مربوط به درس داده های حجیم

اخبار ارسال شده در: ۲۵ آبان ۱۳۹۵

قابل توجه دانشجویان عزیز:

در این نوشته سه مجموعه داده برای ارزیابی درس داده های حجیم قرار داده شده است. برای دریافت بر روی لینک های زیر کلیک کنید.

مجموعه داده تشریح مجموعه داد لینک دریافت
Electricity این مجموعه داده  برای تست طبقه­ بندهای تطبیقی محبوب است و هدف آن طبقه­ بندی باینری پیش ­بینی مسیر افزایش قیمت الکتریسیته با توجه به میانگین جابجایی ۲۴ ساعت گذشته در بازار برق New South Wales استرالیا می­باشد. متغیرهای ورودی هر ۳۰ دقیقه ثبت شده و دوره مابین می ۱۹۹۶ تا دسامبر ۱۹۹۸ را پوشش می­دهند . داده­ها دارای ۵ متغیر ورودی عددی هستند: روز هفته، ساعت، تقاضای NSW، تقاضای Victoria و انتقال زمان­بندی شده لینک دریافت
KDD مجموعه داده شناسایی نفوذ KDD نفوذ­های شبیه­ سازی شده یک محیط شبکه­ ای نظامی را ثبت می­کند. هدف طبقه­ بندی ترافیک شبکه در یکی از ۲۳ طبقه (نرمال یا نوعی نفوذ) توصیف شده توسط ۴۱ ویژگی می­باشد. لینک دریافت
Cover Type مجموعه داده فارست کاورتایپ متغیرهای کارتوگرافیک چهار منطقه خالی از سکنه واقع در پارک جنگلی کلورودای شمالی ایالات متحده را ثبت می­کند. هدف این طبقه­ بندی پیش­ بینی نوع پوشش جنگلی (بیش از ۷ نوع) برای یک مشاهده معین (سلول ۳۰*۳۰ متری) است. این مجموعه داده استامپ زمانی ندارد اما در اصل به صورت جغرافیایی عرضه شده است که می­توان آن را به صورت یک جریان در نظر گرفت؛ این مجموعه داده یک محک خوب برای طبقه­ بندی جریان داده است. این مجموعه  ۵۴ ویژگیاست. لینک دریافت

 

 

Dr. Majid Vafaei Jahan

           Computer Engineering Department
          Islamic Azad University, Mashhad Branch
Web Site Farsi: http://fa.vafaeijahan.com;
Web Site English: www.VafaeiJahan.com;
 dr.vafaie