خوش آموز درخت تو گر بار دانش بگیرد، به زیر آوری چرخ نیلوفری را


کتاب آموزش نرم افزار R

کتاب آموزش نرم افزار R
در این نوشتار سعی داریم تا شما را با چند کتاب و منبع آموزشی خوب برای یادگیری زبان برنامه نویسی R آشنا سازیم. البته قبل از آن مقدماتی دربارۀ اینکه زبان برنامه نویسی R چیست و چه کاربردی دارد، خدمتتان ارائه می کنیم. اگر در زمینۀ زبان برنامه نویسی R نیازمند به آموزش های بیشتری در قالب ویدئو یا دوره های جامع آموزشی دیگر هستید، مجموعه آموزشی R و نرم افزارهای RStudio محل بسیار خوبی برای شروع کار و البته ادامۀ این مسیر می باشد. در ادامه شما را با کتاب "R برای علم داده" (R for Data Science) آشنا می سازیم و بخش هایی از این کتاب ارزشمند را مورد اشاره قرار می دهیم. خوشبختانه نسخه ای از این کتاب کاملاً رایگان (به صورت آنلاین) منتشر شده است که می توانید از آن بهره ببرید.

R چیست؟


R یک زبان برنامه نویسی و یک محیط برای محاسبات آماری و ترسیم نمودارهای مختلف آماری می باشد. R مشابه زبان S می باشد، در واقع می توان R را به عنوان پیاده سازی دیگری از S در نظر گرفت. البته تغییرات بسیار مهمی بین این دو وجود دارد، اما بیشتر کدهایی که برای S نوشته شده اند را می توان بدون کوچکترین دستکاری، در R نیز اجرا کرد.

R گسترۀ وسیعی از تکنیک های آماری و گرافیکی از جمله مدل سازی خطی و مدل سازی غیر خطی، آزمون های آماری کلاسیک، تجزیه و تحلیل سری های زماین، طبقه بندی، خوشه بندی و ... را ارائه می دهد و در زمان بسیار قابل توسعه نیز می باشد. زبان S را اغلب به عنوان وسیله ای در روش شناسی آماری مورد استفاده قرار می دهند اما R یک پروژۀ منبع باز است که جا را برای مشارکت گروهی باز کرده است و البته مشارکت های فراوانی نیز در توسعۀ هر چه بیشتر آن صورت گرفته و همچنان می گیرد.

اگر در زمینۀ زبان برنامه نویسی R نیازمند منابع آموزشی خوبی هستید، ما به شما آموزش برنامه نویسی R و نرم افزار RStudio - مقدماتی در فرادرس را پیشنهاد می کنیم.

یکی از نقاط قوت R را می توان گرافیک های با کیفیت بالای آن دانست که بواسطۀ آن نمودارهایی با کیفیت را جهت انتشار در اختیار شما قرار می دهد. هر چند شما به عنوان کاربر R کنترل کاملی بر اجزاء گرافیک ها خواهید داشت اما پیش فرض های آن چنان بخوبی انتخاب شده اند که شما را از بسیاری از به جزییات پرداختن ها بی نیاز می کند.

یکی دیگر از نقاط قوت R اینست که رایگان است و در ضمن منبع باز نیز می باشد و کد آن در دسترس قرار دارد. مزیت دیگر R اینست که بر روی طیف گسترده ای از سیستم عامل ها شامل FreeBSD، لینوکس، ویندوز، و سیستم عامل مک قابل نصب و اجرا می باشد.

کتاب آموزش نرم افزار R

امکانات R


R مجموعۀ یکپارچه ای از امکانات نرم افزاری برای دستکاری داده ها، محاسبات و نمایش های گرافیکی می باشد. R شامل موارد زیر می باشد:

  • ابزاری موثر برای مدیریت و ذخیره سازی داده ها،
  • مجموعه ای از عملگرها برای انجام محاسبات بر روی آرایه ها و ماتریس ها،
  • مجموعۀ عظیمی از ابزارهای میانی منسجم و یکپارچه برای تجزیه و تحلیل داده ها،
  • امکانات گرافیکی برای تجزیه و تحلیل داده ها و نمایش داده ها روی صفحۀ مانیتور یا چاپ آن روی کاغذ،
  • یک زبان برنامه نویسی ساده و در عین حال پیشرفته که شامل شرط ها، حلقه ها، توابع بازگشتی تعریف شده توسط کاربر، و امکانات ورودی و خروجی است.

R نیز مانند S، مبتنی بر یک زبان برنامه نویسی کامپیوتری طراحی شده است و همین امر کاربران را قادر می سازد تا با معرفی توابع جدید، کارکردهای جدیدی را به آن بیفزایند. همچنین اگر نیاز به کارهای محاسباتی فشرده ای باشد، می توان کدهای \(\text{C}\)، \(\text{C++}\) و \(\text{Fortran}\) را به آن متصل کرد و در زمان اجرا فراخوانی کرد. کاربران حرفه ای می توانند کدهایی به زبان C بنویسید و اشیاء R را مستقیماً دستکاری کنند.

بسیاری از کاربران R را یک سیستم آماری می دانند. اما واقعیت اینست که R محیطی است که روش های آماری نیز در آن پیاده سازی شده است و فراتر از آن است. R را می توان به سادگی با ویژگی packages (بسته ها) گسترش داد. از طریق وبسایت های اینترنتی CRAN می توانید پکیج های فراوانی را در برای R بیابید که طیف وسیعی از آمار مدرن را پوشش می دهند.

برای شروع برنامه نویسی به زبان R و آشنایی بیشتر با ابزارهای مهم کار با آن می توانید از آموزش آشنایی با برنامه نویسی R (رایگان) بهره ببرید.

کتاب آموزش نرم افزار R

معرفی کتاب "R برای علم داده"


اولین دلیل انتخاب این کتاب به عنوان یک منبع آموزشی بسیار مناسب جهت فراگیری R را خدمتتان عرض می کنم. نویسندۀ این کتاب هادلی ویکام (Hadley Wickham)، دانشمند ارشد پروژۀ RStudio می باشد که یکی از بهترین محیط های توسعه یکپارچه برای زبان R است و البته توصیه ما به شما هم اینست که از RStudio برای برنامه نویسی R استفاده کنید، چرا که هم قدرتمند است و هم یک نسخۀ رایگان عالی دارد که برای بسیاری از کارها کفایت می کند. یکی دیگر از مزیت های نویسندۀ این کتاب اینست که در پروژه های طراحی ابزارهای محاسباتی و شناختی برای علم داده فعال است و به قولی خبرۀ این رشته است و طبیعتاً خیلی چیزهای ارزشمند می داند که به کار شما بیاید.

خوشبختانه یک نسخۀ رایگان این کتاب را می توانید از نشانی r4ds.had.co.nz به صورت آنلاین در اختیار داشته باشید. اگر هم بخواهید pdf آن را در اختیار داشته باشید، نیاز به خریدن دارد که نیازی هم به آن نیست.

کتاب "R برای علم داده" به شما می آموزد که چگونه با استفاده از R به علم داده بپردازید. در این کتاب خواهید آموخت که چگونه داده های خود را به R وارد کنید، آنها را به سودمند ترین ساختار ممکن تبدیل کنید، آنها را تغییر دهید، مدل سازی کنید، داده ها را به گرافیک تبدیل کنید و از آنها نمودارهای متنوعی بگیرید. در این کتاب مهارت هایی عملی و کاربردی در ارتباط با علم داده دست پیدا خواهید. در این کتاب نحوۀ پالایش داده ها و ترسیم نمودارها و بسیاری از موارد دیگر در این زمینه را فرا خواهید گرفت. این مهارتها هستند که به علم داده اجازه می دهند به واقعیت بپیوندد و اینجا شما بهترین شیوه های ممکن برای انجام هر یک از این موارد با R را خواهید آموخت.

در ادامه به بخش هایی بر گرفته شده از کتاب "R برای علم داده" می پردازیم و اطلاعات ارزشمندی از داخل این کتاب را به شما به اشتراک می گذاریم.

کتاب آموزش نرم افزار R

مقدمه ای بر R و ارتباط آن با علم داده


علم داده (Data science) یک رشتۀ هیجان انگیز است که به شما امکان می دهد داده های خام را به درک، بینش و دانش تبدیل کنید. هدف از کتاب "R برای علم داده" اینست که به شما کمک کند مهمترین ابزارهای R که شما را در علم داده یاری می رسانند، به شما معرفی کند و چگونگی کار با آنها را به شما بیاموزد. بعد از فراگیری این کتاب قادر خواهید بود از بهترین تکنیک های موجود در R برای مقابله با طیف گسترده ای از چالش های علم داده استفاده کنید. در ادامه بخشی از کارهایی که باید در علم داده انجام دهید را مورد اشاره قرا می دهیم.

ابتدا شما باید داده های خود را وارد R کنید. معمولاً داده ها در یک فایل، پایگاه داده، یا واسط برنامه نویسی وب ذخیره شده اند و شما به کمک R آنها را بارگذاری می کنید. طبیعی است که اگر نتوانید داده های را در اختیار داشته باشید، قطعاً نمی توانید علم داده را بر روی آن پیاده سازی کنید.

بعد از اینکه داده های خود را وارد R کردید، بهترین کار اینست که آنها را منظم کنید. منظم سازی داده ها به این معناست که آنها را طوری یکپارچه کنید که از نظر معنایی، بین مجموعۀ داده و نحوۀ ذخیرۀ آن تطابق وجود داشته باشد. وقتی داده های شما نظم یافتند، هر ستون یک متغیر خواهد بود و هر ردیف یک مشاهده (observation) خواهد بود. داده های منظم از این جنبه بسیار مهم هستند که منجر می شود وقت و تمرکزتان را بر روی سوال کردن از داده ها بگذارید و وقتتان را صرف غلبه بر این چالش که چگونه داده ها را به شکل مناسب جهت استفاده در توابع مختلف در بیاورید نکنید.

قدم بعدی بعد از مرتب سازی داده ها، تغییر آنها است. تغییر به معنای محدود کردن مشاهدات مورد علاقه (به عنوان مثال همۀ افراد در یک شهر، یا همۀ داده های سال گذشته)، ایجاد متغیرهای جدیدی که در واقع توابعی از روی داده های موجود هستند (مثلاً محاسبۀ سرعت از روی مسافت و زمان)، و محاسبۀ یکسری آمارهای خلاصه (مانند تعداد ها یا میانگین ها یا مجموع ها) می باشد. هم اکنون داده های شما منظم و شکل یافته است و می توانید کار با آن را آغاز کنید.

هنگامی که داده های مرتب با متغیرهای مورد نیاز خود را در اختیار داشته باشید، در واقع دو موتور اصلی تولید دانش را در اختیار دارید: مدلسازی (modelling) و تجسم (Visualisation). می توانید با پیمایش داده ها به شکل های مختلف انواع تجزیه و تحلیل ها را بر روی آنها پیاده سازی کنید.

کتاب آموزش نرم افزار R
تجسم (Visualisation): تجسک اساساً یک فعالیت بشری است. یک تجسم خوب،چیزهایی را به شما نشان می دهد که انتظارش را نداشتید، یا اینکه سوالات جدیدی را در مورد داده ها برای شما ایجاد می کند. همچنین یک تجسم خوب ممکن است به شما نشان دهد که اساساً سوالاتی را که در ابتدا پرسیده بودید، اشتباه بوده اند و شما نیاز دارید که داده های مختلفی را جمع آوری کنید. تجسمات می توانند شما را شگفت زده کنند، اما مقیاس خاصی ندارند، زیرا به هر حال برای تفسیر آنها به انسان نیاز داریم.

مدلسازی (modelling): مدلها ابزارهای کامل کنندۀ تجسم هستند. هنگامی که سوالات خود را به اندازۀ کافی دقیق کردید، می توانید برای پاسخ دادن به آنها از مدل ها استفاده کنید. مدل ها اساساً یک ابزار ریاضی یا محاسباتی هستند، بنابراین به طور کلی مقیاس خوبی دارند. حتی اگر در برخی مواقع اینطور هم نباشند، خرید کامپیوترهای بیشتر ارزان تر از خرید مغزهای بیشتر است! به هر حال هر مدلی مفروضاتی دارد و طبق ماهیت آن یک مدل نمی تواند مفروضات خود را زیر سوال ببرد. این بدان معناست که یک مدل نمی تواند شما را غافلگیر کند.

در نهایت آخرین مرحله در علم داده، برقرار ارتباط با سایرین است که بخشی کاملاً حیاتی و جدایی ناپذیر از هر پروژۀ تجزیه و تحلیل داده است. مهم نیست که مدل ها و تجسم های شما چقدر شما را به سمت درک داده ها هدایت کرده باشد، مگر اینکه بتوانید نتایج را با سایرین نیز به اشتراک بگذارید.

تمامی این ابزارها در محاصرۀ برنامه نویسی قرار دارند. برنامه نویسی ابزاری است که در تمامی مراحل پروژۀ تان از آن استفاده می کنید. برای اینکه یک علم داده کار حرفه ای باشید، نیازی نیست که یک برنامه نویس حرفه ای باشید، اما هر چقدر بیشتر در مورد برنامه نویسی بدانید ارزشش را خواهد داشت زیرا برنامه نویس بهتر شدن به شما این امکان را می دهد که کارهای معمولتان را خودکار کنید و مشکلات جدید را با سهولت بیشتری حل و فصل کنید. شما از ابزارهای موجود می توانید برای حل کردن حدود 80 درصد مشکلاتتان در علم داده استفاده کنید اما به هر حال آن 20 درصد باقیمانده را هم باید طوری حل و فصل کنید. برای همین هم هست که اساساً اینگونه محیط ها را با امکان برنامه نویسی ارائه می دهند.

برای علم داده از R استفاده کنیم یا از پایتون؟


کتاب آموزش نرم افزار R
در اینجا می خواهیم پاسخ یک سوال رایج در زمینۀ انتخاب زبان برنامه نویسی برای کار با علم داده را بدهیم. معمولاً کسانی که در حوزۀ علم داده فعالیت می کنند این سوال را دارند که کدام ابزار برنامه نویسی مناسب تر است، امروزه تبلیغات وسیعی در حوزۀ زبان R و همینطور زبان پایتون در علم داده وجود دارد که مخاطب را کمی سر در گم می کند. واقعیت اینست که در حوزۀ علم داده از تمامی توان و ظرفیت ابزارهای ممکن استفاده می شود و در خیلی از پروژه های داده های عظیم (بیگ دیتا) شاهد این هستیم که ترکیبی از این دو را هم استفاده می کنند. با این حال برخی از آمارها که در دنیای وب هم می توانید با جستجو آمارهای بروز شدۀ شان را نیز بیابید حاکی از این هستند که استفاده از R در حوزۀ علم داده به شدت بیشتر از استفاده از پایتون در این حوزه می باشد.

اگر نیاز به افزایش مهارت های برنامه نویسی تان در حوزۀ علم داده یا سایر حوزه ها هستید، مجموعه آموزش برنامه نویسی فرادرس مرجعی کامل و بسیار ارزشمند برای شما می باشد.

جهت مشاهده آموزش های بیشتر در این زمینه و البته آموزش های بیشتر در سایر حوزه های فنی می توانید از سایت فرادرس بازدید نمایید. در این سایت می توانید موضوعات فراوانی در حوزه های برنامه نویسی، مهندسی نرم افزار، هوش مصنوعی، رباتیک، و ... را بیابید.


نمایش دیدگاه ها (0 دیدگاه)

دیدگاه خود را ثبت کنید:

انتخاب تصویر ویرایش حذف
توجه! حداکثر حجم مجاز برای تصویر 500 کیلوبایت می باشد.


دسته بندی مطالب خوش آموز