بلاگ طوری

طبقه بندی موضوعی

۲ مطلب در ارديبهشت ۱۴۰۰ ثبت شده است

مرور ابزارهایی برای پژوهش دانشگاهی

دوشنبه, ۶ ارديبهشت ۱۴۰۰، ۰۴:۲۳ ب.ظ

ابزارهایی که برای پیش برد اهداف آموزشی در دوره دکتری استفاده کردم و به نظرم مفید بود رو ثبت خواهم کرد

  • نقشه ذهنی یا mindmap با miro.com
  • پیدا کردن کارهای اصلی در یک حوزه پژوهشی با استفاده از سایت arxiv.org 
    • از یک مقاله که سایت خوبی گرفته شروع کنید، پایین صفحه تب related paper رو بزنید و گزارش Connectedpapers رو ببینید این یک همکاری بین مجموعه ای به همین نام با arxiv هست. میتونید مقالات مطرح پیشین یا بعدی این پژوهش رو تفکیک کنید و استفاده کنید. 
  • پیدا کردن تزهای یک حوزه:
    • از دانشگاههای مطرح شروع کنید برید تو سایت کتابخانه شون و تز رو جستجو کنید، معمولا خوب ایندکس نمیشن، وقتت روی سرچ در گوگل نذارید. 
    • proquest.com که با دانشگاه تهران هم قرار داد داره و میتونید بعد از لاگین با اکانت دانشگاه تهران، سرچ کنید تزها رو 
  • ابزارهایی که کار آمد نبودند: 
    • ebsco.com
    • jstor.org
      • در زمینه علوم کامپیوتر معدود مجلات قدیمی داره 
    •  
  • بهنام حیدری

مرور دانسته ها در مورد transfer-learning به زبان ساده

دوشنبه, ۶ ارديبهشت ۱۴۰۰، ۰۳:۱۴ ب.ظ

خیلی سریع و بی مقدمه بعد از مدتها 

میخوام یه سری مفاهیم رو دوره و ثبت کنم که گپهاش رو متوجه بشم و بتونم ارتباطاشون رو در ذهنم سامان بدم. 
تو حوزه NLP (Natrual language proceesing) و CV (computer vision) از مدلهای pre-train شده استفاده می‌شد، چون train روی دیتاست بزرگ منابع پردازشی و قوی و زیاد نیاز دارد در حالی که در این روش یکبار با استفاده از منابع قوی مدل آموزش داده میشه و بعد مدل ذخیره میشه و میشه برای کارهای دیگه استفاده کرد. 

بعد متد دیگری در Machine learning مطرح شد به اسم Transfer Learning که در این روش این مدل پیش آموزش داده شده رو برای یک تسک دیگر استفاده میکنند و دیدن این خیلی جوابهای خوبی میده، یعنی شما یک مدل کلی روی مجموعه بزرگی داده آموزش میدید (train) بعد اینجوریه که ماشین دانش عمومی زبان طبیعی رو بدست می آورد به این وسیله و وقتی قصد دارید برای یک تسک خاص مثلا POS یا NER از اون استفاده کنید نتایج بهتری میده چون مدل دانش زبان طبیعی رو داره و زمان و منابع کمتری هم برای پردازش نیاز دارد. پردازش اولیه که منابع و زمان زیاد داره معمولا توسط تیمهای تحقیقاتی انجام میشه و نتایج و مدلشون رو انتشار میدهند

  • بهنام حیدری