مجموعهای از دیتا ست های آموزشی مخصوص ماشین لرنینگ از Data Science Dojo و... تعداد کنونی :۴۳ دیتاست
این دیتاست ها قبلا در گیتهاب بوده و بنابر سیاست خود مجموعه DSD از گیتهاب حذف و در سایت اصلی (هم تحریم و هم فیلتر!) گذاشته شدند.
- دیتاست ها به دو دسته تخصصی طبقهبندی-خوشه-بندی و رگرسیون دسته بندی شدهاند.
- بنا بر ویژگی برخی از داده ها، ممکن است هم در پوشه رگرسیون و هم طبقهبندی-خوشهبندی حضور داشته باشد.
- از جنبه آموزشی به ۳ دسته آسان و متوسط و سخت دستهبندی شده اند.
- معیار دستهبندی داده ها فایل
README.md
در پوشه مادر است. من فقط داده هارا از شلختگی خارج و دستهبندی کردم.- منظور از سختی، میزان دادهها، رابطه بین ویژگیها، پخش بودن داده هادر جند سند و... میباشد.
- معیار دستهبندی داده ها فایل
- در هر پوشه، یک فایل
README.md
وجود دارد که اطلاعات اولیه، معرفی ویژگی ها، منابع و ماخذ داده ها در آن تشریح شده است.
اگر دیتاست خوبی دارید، حتما به این لیست اضافه کنید!