TY - JOUR T1 - Assessment of Flood Occurrence Potential using Data Mining Models of Support Vector Machine, Chaid and Random Forest (Case study: Frizi watershed) TT - ارزیابی پتانسیل وقوع سیل با استفاده از مدل های داده کاوی ماشین بردار پشتیبان، چاید و جنگل تصادفی (مطالعه موردی: حوزه آبخیز فریزی) JF - jwmr JO - jwmr VL - 13 IS - 25 UR - http://jwmr.sanru.ac.ir/article-1-1140-fa.html Y1 - 2022 SP - 133 EP - 144 KW - Friesian watershed KW - Flood KW - Data mining models KW - ROC curve KW - Zoning N2 - چکیده مبسوط مقدمه و هدف: سیل مانند سایر پدیده­های هیدرولوژیکی یک پدیده غیر قطعی است که در هر زمان و مکان احتمال وقوع آن وجود داشته و تحت تاثیر عوامل مختلف اقلیمی، مشخصات فیزیکی حوضه، وضعیت پوشش گیاهی و کاربری اراضی و دخالت­های انسانی است. تعیین سهم هر یک از پارامترها بر میزان بروز سیل مهم است. در حال حاضر­، با ارتقای سامانه ­های اطلاعات جغرافیایی (GIS)، روش­های سنجش از دور (RS) و ماشین یادگیری (ML) می­توان مدل سازی بسیار دقیقی از احتمال وقوع سیلاب انجام داد. با این وجود، ساخت این مدل­ها نیازمند دانش دقیق و اصولی از فرآیند وقوع سیل، بررسی پارامترهای موثر در شکل­گیری سیل، درک چگونگی تأثیر هر پارامتر بر ایجاد سیل و انتخاب و توسعه مدل مناسب و ارزیابی آن است. با توجه به اهمیت تعیین مناطق مستعد وقوع سیل در مناطق مختلف به خصوص حوضه­ های واقع در مناطق خشک و نیمه­ خشک همچون منطقه مورد مطالعه، تحقیق حاضر به منظور ارزیابی خطر­پذیری سیل با استفاده از مدل­های داده ­کاوی ماشین بردار پشتیبان، چاید و جنگل تصادفی در این منطقه هدف­گذاری شده است. مواد و روش‌ها: در پژوهش حاضر جهت بررسی خطر وقوع سیل از مدل­های داده­کاوی ماشین بردار پشتیبان­، چاید و جنگل تصادفی استفاده شده است. به طور کلی هدف از ارائه مدل­های داده کاوی رسیدن به یک تخمین معقول و دقیق از پیش­بینی مکانی وقوع سیل، مقایسه کارایی مدل­ها و انتخاب مناسب­ترین روش برای تهیه نقشه ارزیابی حساسیت سیل می­باشد. در این پژوهش از اطلاعات مختلف همچون نقشه توپوگرافی مقیاس1:50000 جهت استخراج خطوط تراز­، نقشه زمین شناسی مقیاس 1:100000­، نقشه خاک تهیه شده توسط اداره کل منابع طبیعی و آبخیزداری استان خراسان رضوی، تصویر مدل رقومی ارتفاع (DEM) با قدرت تفکیک مکانی 12/5 متر، تصاویر ماهواره­ای گوگل ارث، داده ­های هواشناسی باران­سنجی دوره آماری 20 ساله (98-78) ایستگاه­های اندرخ، اولنگ اسدی، سد کارده، مارشک، بلغور، گوش بالا، آل، چناران، مغان، چکنه علیا، آبقد فریزی، تلغور، قدیر آباد و کبکان استفاده شده است. طبقات ارتفاعی، شیب، جهت شیب، شبکه­ های زهکشی و آبراهه ­های اصلی، تحدب سطح زمین از روی تصویر DEM و خطوط تراز استخراج گردیدند. کاربری اراضی منطقه از روی تصاویر ماهواره­ای گوگل ارث مربوط به سال 2020 و به روش طبقه ­بندی نظارت شده تهیه گردید. نقشه پوشش گیاهی منطقه نیز بر اساس شاخص NDVI و از روی تصاویر ماهواره­ای لندست 8 سال 2018 تهیه گردید. یافته‌ها: عامل ارتفاع نقش کلیدی در کنترل جهت حرکت سیل و عمق سطح آب دارد. در ارتفاع 2000 متر و بیشتر با افزایش ارتفاع پتانسیل سیل­ خیزی در منطقه مورد مطالعه افزایش می ­یابد­. بر اساس نتایج در بین کاربری­های حوضه مورد مطالعه، اراضی آبی و باغی به علت نفوذ بیشتر، رواناب کمتری تولید نموده و کمتر مستعد سیل­ خیزی می­باشند. در منطقه مطالعاتی در شیب 60 درجه به دلیل افزایش شیب، زمان تأخیر حوضه کم، میزان نفوذ آب در خاک کم و در نتیجه حجم سیلاب و رواناب سطحی افزایش خواهد یافت. کلاس 0/0120-0/0074 بیشترین تاثیر را در وقوع سیلاب حوضه دارد­. دامنه ­های شمالی، شمال غربی و غربی به دلیل دریافت بارش زیاد، ماندگاری طولانی مدت برف و داشتن رطوبت دارای پتانسیل سیل­خیزی می­ باشد­. در منطقه مورد مطالعه بارش بیش از 250 میلی متر بیشترین تأثیر را در رخداد سیلاب دارا است. در منطقه مورد مطالعه خاک مزیک به دلیل نفوذ­پذیری نسبتا کم باعث تولید رواناب بیشتر و ایجاد سیل می ­شود­. بر اساس نتایج طبقات شاخص رطوبت توپوگرافی در منطقه مورد مطالعه کلاس 359/99-268/38 تاثیر زیادی در وقوع سیلاب داشته است. در منطقه مورد مطالعه مناطق مقعر در ایجاد سیل تأثیر زیادی دارد به این دلیل که مهمترین و موثرترین فاکتورها در وقوع سیل شیب و انحنا زمین می­باشد. در حال حاضر قابلیت پیش ­بینی حساسیت سیلاب منطقه مطالعاتی با استفاده از سطح زیر منحنی مورد بررسی قرار گرفت و از مقدار AUC­، درصد نرخ موفقیت و قابلیت پیش­ بینی هر دو در پژوهش حاضر 16 سناریو با ترکیب پارامترهای مختلف به عنوان ورودی مدل ایجاد شدند .نتایج این تحقیق نشان می­دهد که در مدل ماشین بردار پشتیبان خطی با بهترین سناریو M3 با بالاترین ضریب همبستگی 0/972 و کمترین مقدار 0/538=MAE­، در مدل جنگل تصادفی بهترین سناریو M10 با بالاترین ضریب همبستگی 0 /961و کمترین مقدار خطا 0/685=­MAE، در مدل درخت تصمیم نوع چاید بهترین سناریو M8 با بالاترین ضریب همبستگی 0/954 و کمترین مقدار خطا 0/723= MAE بوده است. نتیجه­ گیری: به طور کلی بر اساس نتایج تحقیق حاضر طبقات با پتانسیل سیل­خیزی کم و متوسط بیشتر در بخش­های شرقی و جنوبی حوضه قرارگرفته­اند به طوری­ که در بخش شرقی حو­ضه به علت شیب کم و نفوذپذیری مناسب خطر سیل­ خیزی متوسط می ­باشد. بر اساس نتایج به دلیل وجود کاربری­های مرتعی فقیر در نیمه غربی و شمال غربی حوضه بیشترین پتانسیل سیل­ خیزی مشاهده شده قرار دارند. همچنین نتایج نشان داد قسمت­های شمالی و غربی حوضه که از نظر زمین­شناسی و لیتولوژی دارای سازندهای سطحی مانند مارن، رس و سیلت بوده و ضریب نفوذ­پذیری آن­ها بسیار کم و پوشش گیاهی ناچیز دارن، از پتانسیل بالایی در بروز سیلاب برخوردار هستند. در این پژوهش ارزیابی مدل­ها با استفاده از ضریب همبستگی (R) و مقادیر میانگین قدر مطلق خطا (MAE) صورت گرفت. بررسی نتایج مدل­ها نشان داد که به ترتیب مدل های ماشین بردار پشتیبان، چاید و جنگل تصادفی با سناریوی M3، M8 و M10 با بیشترین میزان همبستگی و کمترین خطای میانگین، از دقت بالایی در برآورد خطر وقوع سیل در منطقه مطالعاتی برخوردار هستند. علاوه بر این، به منظور ارزیابی مدل های ارائه شده از مساحت زیر منحنی (ROC) استفاده شد. بر این اساس این مقادیر هم در داده­ های تعلیمی و هم در داده ­های آموزشی در الگوریتم (SVM) و مدل الگوریتم نوین جنگل تصادفی دارای نتایج دقیق­تری می­باشد. این نتیجه بیانگر این مطلب است که هر دو مدل از نظر صحت و اعتبار مدل­سازی مورد تأیید قرار گرفته­اند. M3 10.52547/jwmr.13.25.133 ER -