برای استارت هر پروژه ماشین لرنینگی همونطور که قبلا زیاد تکرار کردیم ما نیاز داریم یه دیتای خیلی تمیز داشته باشیم. اصطلاحا باید دیتایی که بهمون میدن رو یه پیش پردازش روش انجام بدیم و بعد بدیمش به الگوریتم ها تا مدل آموزش ببینه. (حتما جلسه شش رو ببینید ) این جلسه قراره راجع به این موضوع صحبت کنیم که فرض کنید دیتا توی منابع مختلف زیر قرار داشته باشه و ما بخوایم ازش استفاده کنیم تا مدل بسازیم:
Google Drive
Github
URL address
A Python Library
Your PC
خب ساده ترین کار اینه که ما اول دیتا رو دانلود کنیم و بعد ازش استفاده کنیم. اما همیشه به همین راحتی نیست. دیتا حجم خیلی بالایی داره و اگه دانلودش کنیم دوباره آپلود کردنش تو محیط کدنویسی کار سختیه. به طور مثال خیلی از پروژه های بزرگ کدها و دیتا رو توی گیتهاب میریزن و شما باید اونو وارد محیط خودتون کنید. پس خیلی این جلسه رو جدی بگیرید (هرچند ساده س). توی ویدئوی زیر من تمام مراحل بالا رو با کدنویسی مرحله به مرحله توضیح دادم تا با این مرحله مهم آشنا بشید.