@article { author = {Jamshidi, Mohammad and Delavar, Mohammad Amir and Taghizadeh, Ruhollah and Brungard, Colby}, title = {Evaluation Extrapolation of Random Forest Model to Predict Soil Classes at Subgroup Level}, journal = {Journal of Soil Management and Sustainable Production}, volume = {9}, number = {1}, pages = {45-64}, year = {2019}, publisher = {Gorgan University Of Agricultural Sciences}, issn = {2322-1267}, eissn = {2322-1275}, doi = {10.22069/ejsms.2019.15779.1847}, abstract = {Background and objectives: Many soil maps that produced in Iran are in medium scale related to the soil survey projects that have done over the past six decades. In many cases, soil maps have not updated due to the high cost of soil survey activities in conventional methods. A proposed solution to overcome limitations of the conventional soil survey is digital soil mapping (DSM) that extensively used for producing soil maps in many countries recently. The extrapolation method in which soil pattern rules in reference area is used for soil class prediction in other areas as a cost-effective method have been mentioned by some soil surveyors. To achieve the main advantages of extrapolation in DSM, in this research we evaluated the use of random forest model in a reference area (donor area) for producing soil taxonomic classes at subgroup level in a site out of the reference area (recipient area).Materials and methods: In this study two neighboring areas in Fars Province in southern Iran were selected: 1) Saadat Shahr plain as donor site and, 2) Seidan plain as recipient area. Two agricultural plain have a moderately similar environmental condition such as elevation, geology, physiography, and climate and agriculture behavior. In donor area, 82 soil profiles were excavated, described and analyzed. Latin hypercube sampling (LHS) was used as a statistical method in donor area. In recipient area, 27 locations were determined on some parallel transects across the plain. All soils were classified according to USDA soil taxonomy System (2014). Random forest (RF) in R statistical software was used to predict soil classes in donor area. Then the constructed model in donor area saved and applied to the recipient area. 25 variables related to soil forming factors consist of 1) primary and secondary train attributes and 2) remote sensing indices obtained from Landsat 8 satellite, OLI sensor imagery were used in this study. All auxiliary environmental covariate layers were resampled to a 30 resolution. Producer's, users and overall accuracy and kappa index calculated according to the agreement of the field surveyed with predicted soil classes.Results: Using RF algorithm from the 25 variables related to soil forming factors, five primary and secondary train attributes consist of slop, multiresolution index of valley bottom flatness (MRVBF), terrain ruggedness index, topographic wetness index and modified catchment area were selected as influential covariates. An overall accuracy of 72%, and a Kappa index of 0.59 in the donor area, illustrating the relatively desirable agreement between observed and predicted soil classes. For extrapolating evaluation, the result of RF model with 70% of soil samples in the donor area was compared with the output of the transported RF model using 27 observations of the validation dataset. The overall accuracy of the external validation was 45%, and the Kappa index was 0.28. Transferring the RF model constructed by all soil samples of the donor area (100%) showed a better result of soil prediction in the recipient area. The overall accuracy and the Kappa index of the external validation was 52% and 0.38, respectively. From the six soil subgroup classes, the best predicted classes were Typic Calcixerepts and Typic Xerorthents. Some classes were too sparse and the model was unable to predict them correctly.Conclusion: The results showed that the model extrapolation in the framework of DSM could be a powerful tool for producing soil map in the area of Iran that soil maps are not available or updating the present soil maps are time and cost consuming. The low-cost and time saving method reported here, encourages soil surveyors to select model extrapolation for their survey activities.}, keywords = {Digital soil mapping,Soil forming factors,Latin hypercube sampling (LHS)}, title_fa = {ارزیابی تعمیم‌پذیری مدل جنگل تصادفی برای پیش‌بینی کلاس‌های خاک در سطح زیرگروه}, abstract_fa = {سابقه و هدف: در ایران بیشتر نقشه‌های خاکی که طی شش دهه گذشته با روش سنتی تهیه شده‌اند، به‌دلیل نیاز به هزینه و زمان زیاد به روز نشده‌اند. در سال‌های اخیر روش نقشه‌برداری رقومی خاک با هدف تهیه نقشه‌های دقیق بر مبنای مدل‌سازی کمی روابط بین کلاس‌ها یا خصوصیات خاک و داده‌های کمکی ارزان نماینده عوامل خاک‌سازی به‌عنوان روش جایگزین روش‌های سنتی معرفی شده است. در این رابطه یک روش استفاده از مدل‌سازی داده‌های موجود خاک در یک منطقه برای پیش‌بینی کلاس‌های خاک در یک منطقه دیگر فاقد نقشه خاک است. این مطالعه با هدف ارزیابی تعمیم‌پذیری مدل جنگل تصادفی مستخرج از منطقه دهنده اطلاعات برای تهیه نقشه کلاس‌های خاک در سطح زیرگروه برای منطقه گیرنده انجام شد.مواد و روش‌ها: دشت سعادت‌شهر استان فارس به‌عنوان منطقه دهنده یا مرجع و دشت سیدان در مجاور آن به‌عنوان منطقه گیرنده اطلاعات با توجه به شباهت متغیرهای محیطی در دو منطقه انتخاب شدند. در منطقه دهنده، موقعیت 82 پدون مشاهده‌ای بر اساس روش مربعات لاتین تعیین و طی مطالعه خاکشناسی مطابق سامانه رده‌بندی خاک آمریکایی (2014) طبقه‌بندی شدند. 25 متغیر کمکی پستی و بلندی و داده-های سنجش از دور با قدرت تفکیک 30 متر در مطالعه استفاده شدند. در منطقه دهنده با کاربرد روش جنگل تصادفی برای مدل‌سازی روابط بین کلاس‌های خاک و متغیرهای کمکی مهم، 70 درصد پدون‌ها برای آموزش مدل و 30 درصد برای آزمون به کار رفتند. در منطقه گیرنده با کاربرد متغیرهای کمکی مشابه در مدل‌های استخراج شده از منطقه دهنده (یکی با 70 درصد و دیگری با 100 درصد داده‌ها)، کلاس‌های پیش‌بینی شده با نتایج طبقه‌بندی 27 خاک‌رخ مطالعه شده در این منطقه مقایسه و صحت مدل‌ها در تعمیم داده‌ها مورد ارزیابی قرار گرفت. توانایی مدل در پیش‌بینی کلاس‌های خاک در هر دو منطقه بر اساس نتایج آماره‌های صحت کاربر، صحت تولید کننده، صحت کلی و ضریب کاپا مورد ارزیابی قرار گرفت.یافته‌ها: نتایج نشان داد از میان تمامی عوامل محیطی استفاده شده، شیب، شاخص همواری دره با درجه تفکیک بالا، شاخص ناهمواری‌های توپوگرافی، شاخص خیسی توپوگرافی و مساحت حوزه اصلاح شده بیشترین تأثیر را در پیش‌بینی کلاس‌های خاک در سطح زیرگروه داشته-اند. دستیابی به مقادیر 72 درصد برای صحت کلی و 59/0 برای ضریب کاپا در پیش‌بینی کلاس‌های خاک حاکی از ارتباط خوب بین داده-های مشاهده‌ای و پیش‌بینی در منطقه مرجع بود. در منطقه تعمیم، با استفاده از 70 درصد داده‌های آموزشی منطقه دهنده، صحت کلی و ضریب کاپا به ترتیب 45 درصد و 27/0 و با کاربرد 100 درصد داده‌ها، علاوه بر پیش‌بینی یک کلاس بیشتر در منطقه گیرنده، صحت کلی و ضریب کاپا به ترتیب تا 52 درصد و 38/0 بهبود نشان داد. در بین زیرگروه‌های خاک، بهترین پیش‌بینی مربوط به خاک غالب تیپیک کلسی-زرپتز و تیپیک زراورتنتز و ضعیف‌ترین آن مربوط به خاک‌های مشابه کلاس‌های غالب بود. علاوه بر آن نتایج گویای آن است که مدل قادر به پیش‌بینی کلاس‌های دارای فراوانی ناچیز در هر دو منطقه گیرنده و دهنده نبود.نتیجه‌گیری: این پژوهش نشان داد در مناطقی از ایران که فاقد نقشه خاک بوده یا نقشه‌های موجود به روز نشده است، انتقال مدل‌های ساخته شده بر پایه نقشه‌برداری رقومی در مناطق مشابه دارای داده‌های کافی می‌تواند ابزاری کارآمد برای تهیه نقشه خاک در این مناطق باشد. صرفه‌جوئی در هزینه و زمان و دقت قابل قبول، می‌تواند مشوق‌های اصلی استفاده از این روش توسط خاک‌شناسان باشد.}, keywords_fa = {نقشه‌برداری رقومی خاک,عوامل خاک‌سازی,روش مربعات لاتین}, url = {https://ejsms.gau.ac.ir/article_4587.html}, eprint = {https://ejsms.gau.ac.ir/article_4587_f98ef0c00bcba621032e7745d7e11be9.pdf} }