دوره 22، شماره 84 - ( 2-1401 )                   جلد 22 شماره 84 صفحات 38-9 | برگشت به فهرست نسخه ها

XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Bakhtiyari Shahri A, Noferesti S, Eftekhari N, Jahantigh N. (2022). Extraction of Drug Crime Patterns and Identifying People at Risk Using Data Mining Techniques. refahj. 22(84), : 1
URL: http://refahj.uswr.ac.ir/article-1-3897-fa.html
بختیاری شهری احمد، نوفرستی سمیرا، افتخاری نصرت، جهانتیغ نادیا. استخراج الگوهای جرائم مواد مخدر و شناسایی افراد در معرض خطر با استفاده از تکنیکهای داده‌کاوی رفاه اجتماعی 1401; 22 (84) :38-9

URL: http://refahj.uswr.ac.ir/article-1-3897-fa.html


متن کامل [PDF 607 kb]   (1400 دریافت)     |   چکیده (HTML)  (2562 مشاهده)
متن کامل:   (91 مشاهده)
مقدمه
یکی از اصلی‌ترین معضلات موجود در مناطق مرزی به‌ویژه در استان سیستان و بلوچستان، قاچاق مواد مخدر است که آسیبهای اجتماعی جبران‌ناپذیری را برای خانواده‌ها و به‌تبع آن برای کشور دارد. استان سیستان و بلوچستان به دلیل موقعیت جغرافیایی و هم‌جوار بودن با دو کشور تولیدکننده مواد مخدر، شرایط اقتصادی نامناسب نظیر نرخ بیکاری بالا، فقر و محرومیت، گستردگی و تنوع محیط جغرافیایی مرزهای شرقی و کمبود تجهیزات مراقبت از مرز یکی از مراکز ترانزیت قاچاق این بلای خانمان‌سوز است؛ به‌طوری‌که سالانه حدود 120 تن مواد در این استان کشف شده و تعداد مجرمان این حوزه تقریباً 4000 نفر است (رحیمی و کاویان، 2015). ازاین‌رو بررسی عوامل مؤثر بر قاچاق مواد مخدر، شناسایی افراد در معرض خطر و ارائه راهکارهای مناسب برای کاهش جرائم مواد مخدر باید یکی از اولویتهای مسئولان مربوطه در استان سیستان و بلوچستان باشد (رحیمی و کاویان، 2015).
مطالعات نشان داده است بسیاری از افراد ناخواسته، به دلیل فقر، محرومیت و نبود فرصت شغلی برای امرارمعاش و یا از روی کنجکاوی طعمه این سودای مرگ‌آور می‌شوند؛ لذا یکی از روشهای مورداستفاده برای رفع این معضل اجتماعی شناسایی افراد مستعد به فعالیت در حوزه قاچاق مواد مخدر است (بختیاری و افتخاری، 2019).
 یکی از روشهای شناسایی افراد مستعد به فعالیت در حوزه قاچاق مواد مخدر که در سالهای اخیر موردتوجه قرار گرفته است، داده‌کاوی است. سرعت رو به رشد فناوری اطلاعات و توسعه سیستمهای اطلاعاتی، سازمانها را در دریایی از داده‌ها غرق کرده است. تحلیل این داده‌ها و کشف دانش نهفته در آنها می‌تواند مدیریت و مسئولان سازمانهای مربوطه را در انجام تصمیم‌گیریهای دقیق‌تر و سریع‌تر یاری کند. در این راستا، با گسترش سامانه‌های اطلاعاتی برخط ثبت جرائم و ذخیره اطلاعات مجرمان در بانکهای اطلاعاتی، تحقیقات متعددی در سطح جهان در خصوص استفاده از تکینکهای داده‌کاوی برای شناسایی جرائم، پیش‌بینی جرائم و پیشگیری از وقوع آنها انجام گرفته است (تایل و همکاران، 2015).
 با این وجود مطالعات انجام گرفته در کشور ما به دلیل عدم دستیابی به داده‌های قضایی مواد مخدر اندک و عمدتاً محدود به شناسایی و کشف جرائم مرتبط با سرقت است (اسکندری، علیزاده و کاظمی، 2011).
پیش‌بینی جرم شاخه‌ای از آینده‌پژوهی است که به مطالعه ‌آینده‌های فرضی به منظور کسب آمادگی برای مقابله با آن می‌پردازد؛ که کاربردهای فراوانی در تصمیم‌گیریهای قضایی ازجمله اعطای آزادی مشروط به فرد محکوم دارد. علاوه بر این، پیش‌بینی جرم می‌تواند به شناسایی مجرمان کم‌خطر پرداخته و از این طریق به تنظیم سیاستهای کیفری متناسب در مورد محکومان و زندانیان و به‌تبع آن برقراری عدالت در بین مجرمان کمک کند(غلامی و برزگر، 2018).
با وجود داده‌های با ارزش و باکیفیت درباره جرائم و مجرمین مواد مخدر، تاکنون مطالعات انجام گرفته در زمینه پیش‌بینی ارتکاب جرم در کشور ما به حوزه مواد مخدر تعمیم نیافته است (بختیاری و افتخاری، 2017). لذا این مقاله سعی دارد با استفاده از تکنیکهای داده‌کاوی، تحلیلهای دقیقی بر روی داده‌های ذخیره‌شده درباره جرائم مربوط به مواد مخدر انجام دهد و با استخراج الگوهای پنهان موجود در داده‌ها، مدیران را در شناسایی افراد مستعد به قاچاق مواد مخدر در استان سیستان و بلوچستان یاری کند.
 سامانه شناسایی افراد مستعد به قاچاق مواد مخدر می‌تواند به عنوان یک سیستم تصمیم‌یار پلیس برای کوچک‌تر کردن دایره تحقیقات و بررسیهای پلیس و شناسایی مجرمان با صرف زمان و هزینه کمتر استفاده شود. همچنین الگوهای جرم استخراج‌شده به پلیس و مددکارهای اجتماعی برای شناسایی دلایل اصلی ارتکاب جرم وضع قوانین پیشگیرانه برای کاهش جرائم حوزه مواد مخدر کمک می‌کنند.
مبانی نظری و پیشینه پژوهش
چارچوب این پژوهش بر اساس مفاهیم ماده مخدر، اعتیاد، قاچاق مواد مخدر و داده‌کاوی استوار است که در ادامه موردبحث قرار می‌گیرند.
ماده مخدر، ماده‌ای طبیعی یا شیمیایی است که از طریق آثاری که در احساسات و ذهن انسان می‌گذارد، باعث آثار مخربی در جسم و رفتار می‌شود. اغلب منظور از مواد مخدر موادی مانند هروئین یا تریاک است که منع قانونی دارند. سازمان بهداشت جهانی اعتیاد را حالت سرمستی مزمنی که براثر استفاده مکرر از مواد مخدر در فرد و جامعه اختلال ایجاد می‌کند تعریف می‌کند. خصوصیات بارز اعتیاد شامل میل شدید و غیرقابل‌کنترل برای به دست آوردن مواد به هر قیمتی، ازدیاد مقدار استفاده از آن به نحو تصادفی و اتکای شدید روانی و گاهی جسمانی به استفاده از آن مواد است (ابراهیمی و بافندره، 2017). در حقوق ایران، جرائم صادر کردن، واردکردن، حمل کردن، ارسال و ترانزیت مواد مخدر از مصادیق جرائم قاچاق مواد مخدر است (رحمدل، 2015).
داده‌کاوی، یک شیوه خودکار استخراج روابط ناشناخته و الگوهای پنهان در حجم زیادی از داده‌ها است که شامل سه تکنیک طبقه‌بندی، خوشه‌بندی و الگوکاوی می‌شود. طبقه‌بندی، فرآیند ساخت مدلی است که روی یکسری از داده‌هایی که برچسب آن از پیش تعیین‌شده آموزش می‌بیند، سپس بر اساس آن برچسب داده‌های ناشناخته را پیش‌گویی می‌کند.
 درواقع طبقه‌بندی فرآیندی دومرحله‌ای است. در گام اول، یک مدل بر اساس مجموعه داده‌های آموزشی موجود در پایگاه داده ساخته می‌شود. مجموعه داده‌های آموزشی از نمونه‌ها و مثالهایی تشکیل شده‌اند که هر کدام شامل مجموعه‌ای از ویژگیها هستند. هر نمونه در مجموعه آموزش یک برچسب کلاس معلوم دارد. سیستم بر اساس این مجموعه آموزشی به خود آموزش می‌دهد یا به عبارتی پارامترهای طبقه‌بندی را برای خود مهیا می‌کند. گام بعدی پس از آموزش، پیش‌بینی یعنی تعیین برچسب کلاس نمونه‌های جدید است. درواقع مدل ساخته شده می‌تواند برای پیشگویی برچسبهای کلاس برای داده‌های جدید مورداستفاده قرار گیرد.
در این پژوهش از طبقه‌بندهای ماشین بردار پشتیبان (SVM)، بیزین ساده (NB)، رگرسیون لجستیک (ME)، درخت تصمیم (J48) و k نزدیک‌ترین همسایه (IBk) به منظور پیش‌بینی تکرار جرم استفاده شده است که در ادامه به طور مختصر شرح داده شده‌اند. شرح مفصل این الگوریتمها در پژوهشهای گذشته آورده شده است (گناناپریا، سوگانیا، دوی و کومار ، 2010).
ماشین بردار پشتیبان به یکی از رایج‌ترین الگوریتمهای پیش‌بینی در داده‌کاوی تبدیل شده است که در سالهای اخیر به کارایی بهتری در مقایسه با دیگر روشهای طبقه‌بندی دست یافته است. اساس کاری ماشین بردار پشتیبان دسته‌بندی خطی داده‌ها است که برای داده‌های با ابعاد بالا پیش‌بینیهای موفقیت‌آمیز دارد و صحت آن نسبت به سایر طبقه‌بندهای شناخته شده بالاتر است.
الگوریتم بیزین ساده بر پایه قضیه بیز برای مدل‌سازی پیش‌گویانه ارائه شده است. طبقه‌بندی بیز سریع‌تر از رگرسیون لجستیک همگرا می‌شود و برای طبقه‌بندی دودویی و چندگانه نتایج دقیقی ارائه می‌دهد.
رگرسیون لجستیک، یک مدل آماری رگرسیون برای متغیرهای وابسته دو سویی است. منظور از دو سویی بودن، رخداد یک واقعه تصادفی در دو موقعیت ممکنه مانند تکرار جرم یا عدم تکرار جرم است. این مدل را می‌توان به عنوان مدل خطی تعمیم‌یافته‌ای که از تابع لوجیت به عنوان تابع پیوند استفاده می‌کند و خطایش از توزیع چندجمله‌ای پیروی می‌کند، به حساب آورد.
درخت تصمیم از کاربردی‌ترین و محبوب‌ترین روشهای طبقه‌بندی محسوب می‌شود. این درخت یک روش گرافیکی قابل‌درک است که برای تصمیمات با هزینه بالا و خطرات زیاد مورداستفاده قرار می‌گیرد. درخت تصمیم به کمک مجموعه‌ای از قوانین به پیش‌بینی مقادیر متغیر هدف می‌پردازد. در این مطالعه از الگوریتم درخت تصمیم J48 در وکا که همان پیاده‌سازی درخت تصمیم معروف بهC4.5 است استفاده می‌شود.
الگوریتم K نزدیک‌ترین همسایه که تحت عنوان جستجوی مجاورت نیز شناخته می‌شود یک مسئله بهینهسازی است که به پیدا کردن نزدیک‌ترین نقطه‌ها در فضاهای متریک می‌پردازد.
الگوها روابط پنهان و ناشناخته درون داده‌ها را توصیف می‌کنند. الگوکاوی یکی از روشهای شناخته شده در استخراج الگوها کاوش قواعد انجمنی[1] است که کمک می‌کند تا بتوان به‌صورت خودکار حجم زیادی از داده‌ها را تحلیل کرد و الگوهای پر رخداد این داده‌ها را استخراج کرد. قواعد انجمنی ماهیتی احتمالی دارند و به شکل اگر و آنگاه و به همراه دو معیار پشتیبان و اطمینان تعریف می‌شوند. این دو معیار به ترتیب مکرر بودن و اطمینان از قواعد مکشوفه را نشان می‌دهند. اگر قاعده‌ای، حداقل پشتیبانی را داشته باشند، «مکرر» خوانده می‌شوند. «قواعد قوی» قواعدی هستند که به طور توأمان دارای مقدار پشتیبان و اطمینان بیشتر از آستانه باشند. با استفاده از این مفاهیم کاوش قواعد انجمنی در دو گام خلاصه می‌شود: پیدا کردن مجموعه‌های مکرر و استخراج قواعد قوی. در پایان قواعد قوی به عنوان الگوهای پر رخداد مجموعه داده‌ای در نظر گرفته می‌شوند. یکی از معروف‌ترین الگوریتمهای کاوش قواعد انجمنی، اپریوری[2] نام دارد.
در سالهای اخیر، با رشد فناوری اطلاعات و گسترش سیستمهای اطلاعاتی، داده‌کاوی موردتوجه سازمانهای مختلف در سطح جهان قرار گرفته است. در این راستا تحقیقاتی نیز برای استفاده از تکنیکهای داده‌کاوی در حوزه کشف جرائم صورت گرفته است (کاپور، سینگ و چریکوری، 2020؛ تانگاموتو، وادیول و پریادهارشینی، 2019). ازجمله کارهای انجام گرفته در سطح جهان می‌توان به خوشه‌بندی جرائمی نظیر سرقت و قتل برای شناسایی سریع‌تر جرم توسط پلیس (نث ، 2006) و تشخیص نوع جرم و شناسایی مجرم در هند اشاره کرد (تایل و همکاران، 2015). ادامه این پژوهش به معرفی مطالعات انجام گرفته در ایران می‌پردازد.
کاظمی و حسین‌پور (2009) معتقدند که می‌توان با به‌کارگیری الگوریتمهای داده‌کاوی روابط نامحسوس داده‌های مرتبط با جرم و بزهکاری را کشف کرده و الگوهای جرم را استخراج کرد. این الگوها به پلیس کمک می‌کند تا بتواند وقوع جرم را پیش‌بینی کرده و با آرایش نظامی نیروها در منطقه جرم و کنترل دقیق‌تر آنها، از وقوع جرائم پیشگیری کند. به همین منظور آنها در پژوهش خود به بررسی تجارب و اقدامات صورت گرفته در استفاده از تکنیک داده‌کاوی برای تحلیل جرم در سازمانهای پلیسی و قضایی پرداختند.
احمدوند و آخوندزاده (2009) کاربرد تکنیکهای داده‌کاوی در حوزه پلیس را در سه حوزه شناسایی جرائم، پیش‌بینی جرائم و پیشگیری از جرائم را با تحلیل مطالعات گذشته موردبررسی قرار دادند. آنها دریافتند که تکنیکهای پیش‌بینی بیش از سـایر ابزارهای داده‌کاوی در این خصوص مورداستفاده قرار گرفته است. از بین الگوریتمهای پیش‌بینی، مدلهای رگرسیون حجم بیشتری از تحقیقات را به خود اختصاص داده‌اند. نتیجه تحقیق آنها ارائه یک چارچوب کاربردی برای به‌کارگیری داده‌کاوی در مسائل مرتبط با پلیس است.
اسکندری، علیزاده و کاظمی (2011) با به‌کارگیری ابزارهای داده‌کاوی روی بانکهای اطلاعاتی جرائم مدلی برای شناسایی و کشف جرم ارائه کردند. با استفاده از دو روش قوانین تلازمی و روش خوشه‌بندی، الگوهای موردنیاز را در شناسایی جرم سرقت کشف کردند. به‌عنوان‌مثال، نتایج نشان داد احتمال وقوع سرقت جیب بری توسط زنان 5/1 برابر بیشتر از مردان است. استفاده از این مدل برای پیش‌بینی جرائم دیگر به منظور پیشگیری از وقوع جرم توصیه شد.
ابراهیمی و همکاران (2015) از تکنیکهای داده‌کاوی برای تحلیل و بررسی اطلاعات گردآوری شده جرائم و جامعیت بخشی به بانکهای اطلاعاتی موجود استفاده کردند. آنها به کشف روابط نامحسوس میان داده‌ها و استخراج الگوهای جرم پرداختند. همچنین با استفاده از الگوریتمهای طبقه‌بندی، مدلی برای پیش‌بینی خصیصه‌های جرائم ارتکابی در آینده ارائه کردند.
در تحقیق ذکرشده از الگوریتمهای خوشه‌بندی روی مجموعه داده‌های گردآوری‌شده برای شناسایی نوع جرم استفاده شد. ارزیابی مدلهای حاصله با توجه به ویژگی هدف نوع جرم نشان داد که مدل ایجادشده توسط الگوریتم LogitBoost دارای میانگین وزن بیشتری از مدلهای دیگر است. علاوه بر این داده‌کاوی روی اطلاعات جرائم شهر لندن نشان می‌دهد که مدل ایجادشده توسط الگوریتم Bayesnet با توجه به ویژگی هدف نوع جرم دارای میانگین وزن معیار Measure-F بیشتری از مدلهای دیگری است که با استفاده از الگوریتمهای RandomSubSpace و IBK ارائه شدند.
صمیری و عباس‌نژاد (2015) با استفاده از ابزارهای داده‌کاوی مدلی برای کمک به نیروی پلیس برای پیش‌بینی وقوع جرم و درنهایت پیشگیری از آن ارائه دادند. آنها داده‌های مرتبط با جرم و بزهکاری را مورد تحلیل قرار داده، روابط پنهان میان این داده‌ها را کشف کرده و الگوهای جرم را استخراج کرده‌اند.
ابراهیم‌زاده و زرین کمری لف (2015) به بررسی چگونگی عملکرد کشف الگوهای جرم توسط سیستمهای داده‌کاوی پرداختند. در این تحقیق از خوشه‌بندی برای شناسایی الگوهای جرائم و همچنین از تکنیک یادگیری نیمه نظارتی برای افزایش ضریب پیش‌بینی صحیح استفاده شده است. به علاوه برای جبران محدودیتهای موجود در تکنیکها و ابزارهای خوشه‌بندی از طرح وزن‌دهی کمک گرفته شده است. نتایج تحقیق نشان داد که تکنیک مدل‌سازی در این پژوهش می‌تواند الگوهای جرم را در بین بسیاری از جرائم شناسایی کند. البته باید به این نکته توجه داشت که این روش نیازمند یک کاوشگر ماهر و یک تحلیل‌گر متخصص برای جرم نیاز دارد.
مانیان و همکاران (2016) با استفاده از تکنیکهای داده‌کاوی به تحلیل داده‌های مربوط به مجرمان دستگیرشده توسط گشتهای انتظامی تهران در بهار سال 2009 پرداختند. آنها با کمک الگوریتمهای درخت تصمیم و شبکه عصبی روشی برای شناسایی مجرمان واقعی ارائه دادند. دلشاد و همکاران (2017)، با به‌کارگیری الگوریتمهای شبکه عصبی و خوشه‌بندی، گزارش‌های متنی پلیس را مورد تحلیل قرار دادند. همچنین از شبکه‌های عصبی برای کشف پیشدستانه جرم استفاده کردند. در این تحقیق تحلیل رفتار مجرم در زمان ارتکاب جرم به عنوان کلید فرایند کشف جرم شمرده شده است.
مطالعات دیگری نیز برای پیش‌بینیهای کوتاه‌مدت جرم مبتنی بر مکان، از مدل الگوریتم جنگل تصادفی (Random Forest) استفاده کرده‌اند (مولر و پورتر، 2018). ویلر و استین بیک (2021) نیز ازاین‌روش استفاده کرده و پیش‌بینیهای بلندمدتی از جرم در مکانهای کوچک ارائه دادند. آنها در این روش با استفاده از درخت تصمیم جرم را شناسایی کردند. در مطالعه آنها پیش‌بینی جرم بر اساس نزدیکی به مراکز حمل‌ونقل عمومی صورت می‌پذیرد.
برخی دیگر، از تجزیه‌وتحلیل‌های سلسله مراتبی نزدیک‌ترین همسایه (HNNC) که به طور مکرر خوشه‌های مرتبه اول و بالاتر را شناسایی می‌کند برای شناسایی نقاط با احتمال جرم بالا و بررسی همپوشانی انواع مختلف جرم استفاده کردند. به این طریق که خوشه‌های مرتبه اول با گروه‌بندی نقاطی که در فضا نزدیک‌تر از فاصله آستانه حداقل هستند ایجاد می‌شوند. سپس خوشه‌های مرتبه اول را می‌توان بر اساس فواصل میانشان، به خوشه‌های مرتبه دوم گروه‌بندی کرد. الگوریتم همچنان به تلاش برای گروه‌بندی خوشه‌ها در کلاسترهای درجه بالاتر ادامه می‌دهد تا زمانی که شکست بخورد. نتایج آنها پیامدهای مهمی برای جرم‌شناسی جغرافیایی دارند. بااین‌حال در تکنیک HNNC پارامترهای ورودی، ذهنی بوده و لذا نمی‌توان از این تحلیلها با اطمینان نتیجه‌گیری اساسی کرد (هابرمن، 2017).
اخیرا، او و ژنگ (2021) مطالعه‌ای در خصوص پیش‌بینی میزان جرم و جنایت بر اساس یادگیری ماشینی انجام داده‌اند. آنها به منظور پیش‌بینی میزان جرم و جنایت شهر در محله‌های مختلف از شبکه‌های عصبی استفاده کردند؛ و استفاده از ایدههای این مقاله را برای پیش‌بینی جرائم متعدد پیشنهاد کردند.
همچنین راتکلیف و همکاران (2021) از الگوریتمهای یادگیری ماشین استفاده کردند. این الگوریتم ابتدا از یک ماشین تقویت‌کننده گرادیان استفاده می‌کند که پیش‌بینی کند که آیا جرمی در هر سلول شبکه رخ می‌دهد یا خیر. این فرآیند متکی بر چندین سال داده‌های جرم تاریخی است که به مجموعه داده‌های آموزشی و آزمایشی تقسیم می‌شوند. بخشی از مجموعه داده آموزشی به درخت تصمیم داده می‌شود و پیش‌بینی می‌کند که آیا جرمی در یک مکان خاص (سلول شبکه) رخ خواهد داد یا خیر. این آزمایش کاهشهایی در جرم اموال ناشی از گشتهای متمرکز بر ماشین مشخص‌شده پیدا کرد. بااین‌حال تخمین و جلوگیری از جرم و جنایت در مناطق خرد انجام شده است.
مطالعه‌ای دیگر استفاده از روش نقشه‌برداری جرم و جنایت را برای پیشگیری از جرم بررسی کرد که می‌توان از آنها برای پیشگیری از جرم با استفاده از روش نقشه‌برداری جرم و جنایت روشهای بهتری نسبت به ساختارهای موجود استفاده کرد.
 ابتدا تکنیکهای Crime Mapping با روشهای مختلف شناسایی و برچسب‌گذاری کانونهای جرم در نظر گرفته می‌شوند. سپس تکنیکهای پلیسی پیش‌بینی شده با مفاهیم مختلف برای طبقه‌بندی جرم موردبررسی قرار می‌گیرد. نظریه‌های جرم‌شناسی زیربنایی نیز موردبررسی و بحث قرار می‌گیرند. درنهایت، رویکردهای ممکن برای مقاوم‌سازی این تکنیکها در شهرهای هوشمند در نظر گرفته می‌شوند تا راه‌حلی جامع برای مشکل حل جرم ارائه کنند (ویلر و استین بیک، 2021).
هرچند مطالعات زیادی در خصوص استفاده از داده‌کاوی در زمینه‌های مختلف توسط محققان صورت گرفته است (نوفرستی، شمشادی نژاد و حیدری، 2018)؛ اما مطالعات موجود در زمینه داده‌کاوی جرائم در کشور ما به حوزه مواد مخدر تعمیم نیافته است. لذا این تحقیق در نظر دارد به طور خاص به شناسایی افراد مستعد به قاچاق مواد مخدر در استان سیستان و بلوچستان با استفاده از تکنیکهای داده‌کاوی بپردازد.

روش
با توجه به متغیرهای موجود در پرونده‌های مجرمان مدل مفهومی پژوهش مطابق شکل (1) رسم شده است. همان‌طور که مشاهده می‌شود 16 متغیر (ویژگی) تحقیق انتخاب شده است که در چهار رده متغیرهای شخصی، متغیرهای مرتبط با جرم، متغیرهای مرتبط با مجرم و متغیرهای زمانی دسته‌بندی شده‌اند. پایایی پرسشنامه با محاسبه آلفای کرونباخ (α) که یکی از پرکاربردترین ابزارهای آماری برای شناسایی میزان پایایی یک متغیر است محاسبه شد. مقدار آن برای کل آزمون، بالاتر از 7/0 محاسبه شد؛ که حاکی از پایایی مناسب است. علاوه بر این، برای تعیین روایی پرسشنامه از نظرات سه نفر متخصص در حوزه جرائم مواد مخدر استفاده شد. توصیف متغیرها و نحوه انتخاب آنها در ادامه به تفصیل آمده است. مطابق شکل (1)، بر اساس متغیرهای تحقیق به پیش‌بینی و طبقه‌بندی متغیر هدف (متغیر دو سویی با دو مقدار تکرار جرم و عدم تکرار جرم) پرداخته می‌شود. همچنین بر اساس مقادیر متغیرهای تحقیق الگوهای پنهان استخراج شده و به عنوان خروجی فرآیند کشف دانش مورداستفاده قرار می‌گیرد.


شکل (1) مدل مفهومی

برای انجام این تحقیق از متدولوژی استاندارد CRISP-DM[3] و الگوریتمهای داده‌کاوی ماشین بردار پشتیبان[4]، بیزین ساده[5]، رگرسیون لجستیک[6]، درخت تصمیم[7] و k نزدیک‌ترین همسایه[8] و برای استخراج الگوهای جرم از الگوریتم اپریوری[9] استفاده شده است. برای تحلیل داده‌ها نیز نرم‌افزار داده‌کاوی وکا بکار گرفته شده است.
چرخه حیات یک پروژه داده‌کاوی در متدولوژی CRISP_DM از شش مرحله تشکیل شده است. توالی مراحل مستقیم نیست و حرکت به عقب و جلو بین مراحل مختلف همیشه نیاز است. خروجی هر مرحله مشخص می‌کند که بعد از آن باید چه مرحله‌ای اجرا شود (نوفرستی و شمس فرد، 2015). بردارها وابستگیهای مهم بین مراحل را مشخص می‌کند. این چرخه در شکل 2 نمایش داده شده است. در ادامه خلاصه هر مرحله پروژه حاضر بیان می‌شود.

شکل (2) مراحل انجام پژوهش

شناخت مسئله: در این مرحله به شناخت سیستم و بیان اهداف مسئله مورد نظر پرداخته می‌شود. استان سیستان و بلوچستان به لحاظ وضعیت جغرافیایی، اقتصادی و اجتماعی بیشتر در معرض خطر آلودگی به مواد مخدر به دو شکل اعتیاد و قاچاق قرار دارد. آمار بالای قاچاق مواد مخدر در استان سیستان و بلوچستان و صدمات جبران‌ناپذیر آن بر افراد و خانواده‌های درگیر، شناسایی افراد مستعد به قاچاق مواد مخدر در این استان را حائز اهمیت می‌کند (رحیمی و کاویان، 2015). هدف تحقیق حاضر، ارائه مدل پیش‌بینی کننده‌ای برای شناسایی افراد مستعد به قاچاق مواد مخدر و نیز استخراج الگوهای جرائم است.
جمع‌آوری و درک داده: به منظور استفاده از ابزارها و الگوریتمهای داده‌کاوی نیاز به یک مجموعه داده‌ای قابل تفسیر توسط کامپیوتر است. در این راستا و با توجه به محدودیتهای امنیتی در این حوزه، با همکاری و هماهنگی شورای مواد مخدر استانداری سیستان و بلوچستان، مجموعه داده‌های واقعی با استفاده از روش نمونه‌گیری در دسترس از پرونده‌های 539 مجرم حوزه مواد مخدر در استان سیستان و بلوچستان که در طی سالهای 2013 الی 2020 مرتکب جرم قاچاق مواد مخدر شده و اطلاعات مربوط به آنان ثبت شده است، جمع‌آوری شد. به منظور حفظ حریم خصوصی افراد، اطلاعات هویتی مجرمان شامل نام، نام خانوادگی، نام پدر، شماره پرونده و شماره شناسنامه از پایگاه داده حذف شد.
آماده‌سازی داده‌ها: این مرحله شامل چهار گام استخراج ویژگی، پاک‌سازی داده‌ها، یکپارچه‌سازی داده‌ها و تبدیل داده‌ها می‌شود. در گام اول با مشورت کارشناسان حوزه مواد مخدر و بر اساس مطالعات پیشین، 16 خصیصه جنسیت مجرم، رده سنی مجرم، وضعیت تأهل مجرم، سطح تحصیلات مجرم، محل تولد مجرم، نوع جرم، شریک داشتن مجرم، نوع ارتباط مجرم با همدستان، شغل مجرم، وضعیت مالی مجرم، فصل وقوع جرم، وضعیت سوءپیشینه مجرم، دلیل ارتکاب جرم، تعداد دفعات تکرار جرم، نوع و مقدار ماده مخدر برای پیش‌بینی و شناسایی افراد مستعد به قاچاق مواد مخدر انتخاب شد. بر اساس پرونده مجرمان، مواد مخدر قاچاق شده توسط این افراد شامل تریاک، شیره، حشیش، مرفین و شیشه بوده است. جدول (1) ویژگیهای تحقیق را به همراه نوع آنها نشان می‌دهد. همچنین مجموعه مقادیر یا بازه مقادیر مشاهده شده برای هر ویژگی در داده‌های موردبررسی نشان داده شده است.
در گام دوم داده‌های ناقص و دارای خطا حذف شدند. در این راستا، پس از بررسی 539 پرونده و جمع‌آوری اطلاعات تکمیلی از طریق پرسشنامه، مواردی که دارای داده ناقص یا متناقض بودند کنار گذاشته شدند. در پایان اطلاعات 467 نفر که پرسشنامه را به طور کامل پاسخ داده بودند و مؤلفه‌های لازم برای استفاده در این تحقیق را داشتند، انتخاب شد.
در گام سوم داده‌های جمع‌آوری شده از منابع مختلف به شکل واحد در آمدند و در گام چهارم داده‌ها به فرمت مناسب برای پردازش توسط ماشین تبدیل شدند. به‌عنوان‌مثال، به دلیل پراکندگی مقادیر ویژگی سن، سن افراد به چهار بازه زیر 18 سال، 18 تا 22 سال، 23 تا 30 سال، 31 تا 40 سال و بالای 40 سال تقسیم شده است. به طور مشابه ویژگی مقدار ماده مخدر همراه مجرم به تعدادی بازه تقسیم شده است. دسته‌بندیهای مذکور در جدول (1) نشان داده شده‌اند.

جدول (1) ویژگیهای مورداستفاده و نوع آنها
ردیف ویژگی نوع محدوده مقادیر
1 جنسیت مجرم اسمی {زن، مرد}
2 رده سنی مجرم اسمی {کمتر از 18 سال، 18 تا 22 سال، 23 تا 30 سال، 31 تا 40 سال و بالای 40 سال}
3 وضعیت تأهل مجرم اسمی {مجرد، متأهل}
4 سطح تحصیلات مجرم اسمی {بی‌سواد، ابتدایی، راهنمایی، دبیرستان، دیپلم و تحصیلات دانشگاهی}
5 محل تولد مجرم اسمی {خاش، زاهدان، زابل، ایرانشهر، مشهد، کرمان، سراوان و سایر}
6 نوع جرم اسمی {فروش مواد مخدر، فروش و مصرف مواد مخدر}
7 شریک اسمی {دارد، ندارد}
8 نوع ارتباط مجرم با همدستان اسمی {صاحب مال، همدست، کرایه‌ای}
9 شغل مجرم اسمی {بیکار، شغل آزاد، کارگر، کارمند}
10 وضعیت مالی مجرم اسمی {ضعیف، متوسط، خوب}
11 فصل وقوع جرم اسمی {بهار، تابستان، پاییز، زمستان}
12 سوءپیشینه اسمی {دارد، ندارد}
13 دلیل ارتکاب جرم اسمی {خانواده، فقر، بیکاری، کسب درآمد، دوست ناباب}
14 تعداد دفعات تکرار جرم عددی ]1 ... 10[
15 نوع ماده مخدر اسمی {تریاک و شیره، شیشه، حشیش و مرفین}
16 مقدار ماده مخدر اسمی
{کمتر از 100 گرم، 100 تا 200، 200 تا 400، 400 تا 600، 600 تا 800، 800 تا 1000، 1000 تا 2000، بیشتر از 2000}
مدلسازی: در این مرحله، تکنیکهای مختلف مدلسازی انتخاب و بکار گرفته می‌شوند. در این تحقیق در ابتدا با استفاده از تکنیک طبقه‌بندی به تولید مدل و الگوی بهینه‌ای برای پیش‌بینی افراد مستعد به قاچاق مواد مخدر پرداخته شده است. سپس با استفاده از الگوکاوی الگوهای جرم استخراج می‌شوند.
یک مجموعه آموزش ایجاد شده است که در آن هر نمونه دارای برچسب کلاس تکرار یا عدم تکرار جرم است. سیستم بر اساس این مجموعه آموزشی به خود آموزش می‌دهد و یک مدل پیشگویانه می‌سازد. از این مدل برای پیش‌بینی تکرار جرم توسط فرد استفاده شده است. به بیانی دیگر با دادن 16 ویژگی ذکر شده در بخش آماده‌سازی داده‌ها یا بخشی از این ویژگیها، سامانه طراحی‌شده پیش‌بینی می‌کند که فرد مذکور مجدداً مرتکب جرم می‌شود یا خیر. درواقع سامانه طراحی‌شده قادر به شناسایی افراد مستعد قاچاق مواد مخدر است.
در این پژوهش از طبقه‌بندهای ماشین بردار پشتیبان، بیزین ساده، رگرسیون لجستیک، درخت تصمیم و k نزدیک‌ترین همسایه به منظور پیش‌بینی تکرار جرم برای نمونه‌های جدید (متهمانی که اخیراً دستگیر شده‌اند) استفاده شده است. علت انتخاب طبقه‌بندهای مذکور، رایج بودن استفاده از آنها در کاربردهای مختلف و موفقیت‌آمیز بودن نتایج حاصل بوده است. دقت طبقه‌بندهای مذکور در شناسایی افراد در معرض خطر در بخش تجزیه‌وتحلیل یافته‌ها ارائه شده است. برای پیاده‌سازی الگوریتمهای مذکور از نرم‌افزار وکا استفاده شده است.
در گام دوم از مدلسازی به استخراج الگوهای جرم با استفاده از الگوریتم اپریوری پرداخته می‌شود.
ارزیابی مدل: برای ساخت مجموعه آموزش و مجموعه تست از تکنیک رایج ارزیابی متقابل با 10 حلقه[10] استفاده شد. در این تکنیک مجموعه داده‌ها به 10 قسمت مساوی تقسیم می‌شود که در هر تکرار از الگوریتم یک بخش به عنوان تست و 9 بخش دیگر به عنوان آموزش انتخاب می‌شوند. نهایتاً میانگین 10 بار تکرار الگوریتم به عنوان نتیجه نهایی انتخاب می‌شود.
به منظور مقایسه مدلهای ساخته شده از معیار صحت استفاده شده است که به‌صورت زیر تعریف می‌شود:
 
  1. صحت

متغیر TP یا «مثبت صحیح» به تعداد رکوردهای مثبت (افراد مستعد به قاچاق مواد مخدر) از مجموعه تست اشاره دارد که توسط الگوریتم داده‌کاوی به‌درستی دسته‌بندی شده‌اند یعنی برچسب مثبت (تکرار جرم) گرفته‌اند. به طور مشابه متغیر TN یا «منفی صحیح» به تعداد رکوردهای منفی (افرادی که تکرار جرم نداشته‌اند) از مجموعه تست اشاره دارد که توسط الگوریتم داده‌کاوی به‌درستی دسته‌بندی شده‌اند یعنی برچسب منفی (عدم تکرار جرم) گرفته‌اند. متغیر FP یا «مثبت کاذب» نیز تعداد رکوردهای منفی از مجموعه تست که اشتباهاً به عنوان مثبت دسته‌بندی شده‌اند را نشان می‌دهد. به بیانی دیگر، FP تعداد افرادی است که در واقعیت تکرار جرم نداشته‌اند اما توسط مدل ساخته شده به‌اشتباه برچسب تکرار جرم خورده‌اند. FN یا «منفی کاذب» تعداد رکوردهای مثبت مجموعه تست که به‌اشتباه برچسب منفی خورده‌اند را نشان می‌دهد. درواقع FN تعداد افرادی است که تکرار جرم داشته‌اند اما مدل پیش‌بینی نتوانسته است آنها را تشخیص دهد.
علاوه بر صحت، شاخصهای حساسیت (فراخوانی)، ارزش اخباری مثبت (دقت) و معیار F نیز برای مقایسه مدلها مورداستفاده قرار گرفته‌اند که در ادامه فرمول محاسبه هر کدام ارائه شده است.
  1. حساسیت
 
ارزش اخباری مثبت
فراخوانی* دقت*2
فراخوانی* دقت
  1. (4)
توسعه: با به‌کارگیری طبقه‌بند IBk سامانه‌ای برای پیش‌بینی افراد مستعد به قاچاق موارد مخدر طراحی شد و همچنین برای تأیید قواعد و الگوهای استخراج شده، از کارشناسان حوزه مواد مخدر کمک گرفته شده است. بدین ترتیب الگوهای تأییدشده توسط کارشناسان برای تحلیل دلایل اصلی وقوع جرم و ویژگیهای مجرمان به مسئولان مربوطه ارائه شد.
یافته‌ها
به منظور پیش‌بینی تکرار جرم با استفاده از الگوریتمهای طبقه‌بندی، در ابتدا با روش ارزیابی متقابل با ده حلقه، مجموعه داده‌ای به دو بخش آموزش و تست تقسیم شده است. طبقه‌بند یادگیری ماشین روی مجموعه آموزش، یادگیری انجام می‌دهد. سپس بر اساس مدل یادگرفته شده، به پیش‌بینی تکرار جرم در مجموعه تست می‌پردازد. بر اساس درصدی از نمونه‌های مجموعه تست که پیش‌بینی تکرار جرم در آنها به‌درستی تخمین زده شده است، صحت طبقه‌بند محاسبه می‌شود.
در شکل (3) صحت طبقه‌بندهای مذکور در پیش‌بینی تکرار جرم توسط یک شخص نمایش داده شده است. همان‌طور که مشاهده می‌شود، طبقه‌بند IBk به صحت بالاتری در مقایسه با سایر طبقه‌بندها دست یافته است. طبقه‌بند IBk با صحت حدود 84 درصد قادر به پیش‌بینی تکرار جرم است.

شکل (3) مقایسه صحت طبقه‌بندها در پیش‌بینی تکرار جرم

جدول (2) کارایی طبقه‌بندها در شناسایی افراد مستعد به قاچاق مواد مخدر را بر اساس شاخصهای مختلف شامل صحت، حساسیت، ارزش اخباری مثبت و معیار F مقایسه می‌کند. همان‌طور که مشاهده می‌شود طبقه‌بند IBk بر اساس همه شاخصهای مذکور بر سایر طبقه‌بندها برتری داشته است.
جدول (2) مقایسه طبقه‌بندها در پیش‌بینی تکرار جرم بر اساس شاخصهای مختلف
طبقه‌بند صحت حساسیت (فراخوانی) ارزش اخباری مثبت (دقت) معیار F
NB 94/80 9/80 6/80 8/80
SVM 44/82 4/82 2/81 6/81
ME 38/66 4/66 8/74 1/69
J48 37/78 4/78 62 2/69
IBk 94/83 9/83 2/83 4/83

در جدول (3)، برخی از الگوهای جرم استخراج شده توسط الگوریتم الگوکاوی نمایش داده شده است. به‌عنوان‌مثال الگوی شماره (1) بیان می‌کند که افرادی که شریک جرم ندارند و وضعیت مالی آنها ضعیف است و نوع ماده مخدر همراه آنها تریاک بوده است عمدتاً متأهلند. برای هر الگو رخداد و درصد اطمینان نیز نشان داده شده است. رخداد یا پشتیبان یعنی تعداد دفعاتی که الگو در پایگاه داده مشاهده شده است و اطمینان یعنی درصد مواردی که الگو درست بوده است. به طور مشابه، الگوی شماره (2) مبین این است که مجردهایی که سوءپیشینه داشته‌اند با احتمال 96 درصد بیکارند.

جدول (3) الگوهایجرم استخراج شده
شماره الگو رخداد اطمینان
1 شریک=ندارد، وضعیت مالی=ضعیف، نوع ماده مخدر=تریاک وضعیت تأهل=متأهل 95 99%
2 وضعیت تأهل=مجرد، سوءپیشینه=دارد شغل=بیکار 91 96%
3 محل تولد=زاهدان، وضعیت تأهل=متأهل، وضعیت مالی=ضعیف تکرار جرم=دارد 75 94%
4 رده سنی=31-40، وضعیت تأهل=متأهل تکرار جرم=دارد 58 95%
5 دلیل ارتکاب جرم=کسب درآمد، وضعیت تأهل=متأهل، نوع ماده مخدر=تریاک تکرار جرم=دارد 74 91%
6 محل تولد=زابل، نوع ماده مخدر=تریاک رده سنی=23 تا 30 سال 59 84%
7 رده سنی=31-40 سال، تکرار جرم=دارد وضعیت مالی=ضعیف 58 84%
8 شغل=آزاد، وضعیت مالی=خوب نوع مواد=تریاک 56 92%

با تحلیل الگوهای استخراج شده توسط کارشناسان حوزه مواد مخدر می‌توان دلایل اصلی ارتکاب جرم و افراد مستعد تکرار جرم را شناسایی و راهکارهایی برای کاهش جرائم ارائه داد. همچنین با تحلیل روانشناسانه الگوها توسط مددکارهای اجتماعی و سایر متخصصان مربوطه، می‌توان تا حد زیادی از ارتکاب به جرائم مشابه پیشگیری کرد. به‌عنوان‌مثال الگوهای شماره (3) تا (5) بیان می‌کنند که عمدتاً افراد متأهل متولد زاهدان که وضعیت مالی بدی دارند، متأهلین رده سنی 31 تا 40 سال و نیز متأهلینی که با هدف کسب درآمد تریاک قاچاق می‌کنند، مجدداً مرتکب جرم می‌شوند. بنابراین به منظور کاهش جرائم مرتبط با قاچاق مواد مخدر، بهبود وضعیت معیشتی مردم استان، ایجاد فرصتهای شغلی به ویژه برای متأهلین و نیز رسیدگی به مشکلات و دغدغه‌های افراد در رده سنی 31 تا 40 سال باید در اولویت قرار گیرد.
الگوی شماره (6) نشان می‌دهد که 84 درصد افرادی که تریاک قاچاق کرده‌اند و متولد زابل هستند در رده سنی 23 تا 30 سال قرار دارند.
الگوی شماره (7) بیان می‌کند که در رده سنی 31 تا 40 سال، افرادی که چندین بار مرتکب قاچاق مواد مخدر شده‌اند، وضعیت مالی بدی داشته‌اند. این الگو مبین این است که یکی از دلایل قاچاق مواد مخدر در رده سنی 31 تا 40 سال که عمدتاً متأهل هستند و بار اقتصادی یک خانواده را به دوش می‌کشند، وضعیت بد اقتصادی است. بنابراین رسیدگی به وضعیت معیشتی مردم و ایجاد فرصتهای شغلی توسط مسئولین می‌تواند راهگشا باشد.
در مقابل، الگوی شماره (8) نشان می‌دهد افراد دارای مشاغل آزاد که وضعیت مالی خوبی داشته‌اند عمدتاً تریاک حمل می‌کنند. این الگو مبین این است که حتی برخی از افرادی که وضعیت مالی مناسبی دارند نیز مرتکب جرائم مرتبط با مواد مخدر می‌شوند. علت اصلی این امر می‌تواند ناآگاهی این افراد از عوارض سوء مواد مخدر، تفریح و یا همنشینی با دوستان ناباب باشد. در این راستا راهکارهایی نظیر آگاه‌سازی و آموزش مردم با ساخت برنامه‌های تلویزیونی، همچنین پخش بروشورهای هشداردهنده به ویژه در محلهای تجمع عمومی در روستاها مانند مساجد و محل برگزاری نماز جمعه و گسترش تفریحات سالم در سطح استان به ویژه در رده سنی جوانان می‌تواند مؤثر باشد.
بحث و نتیجه‌گیری
با توجه به اهمیت مسئله قاچاق مواد مخدر در استان سیستان و بلوچستان، ارائه راهکارهایی برای شناسایی الگوهای بیانگر دلایل وقوع جرائم و نیز شناسایی افراد در معرض خطر از ضروریات است. ازاین‌رو در این مقاله، با تحلیل داده‌های مربوط به مجرمان مواد مخدر با استفاده از الگوریتمهای طبقه‌بندی، سامانه‌ای برای تشخیص افراد مستعد به قاچاق مواد مخدر (یعنی افرادی که مستعد تکرار جرم) هستند طراحی شد. نتایج ارزیابیهای انجام گرفته نشان می‌دهد طبقه‌بند IBK قادر است با دقت 84 درصد افراد در معرض خطر را شناسایی کند. همچنین با به‌کارگیری الگوریتم الگوکاوی، الگوهای جرائم استخراج شده است. این الگوها می‌توانند کمک شایانی به مسئولان مربوطه برای تشخیص افراد در معرض خطر و نیز شناسایی دلایل ارتکاب جرم باشند.
ازجمله محدودیتهایی که طی انجام تحقیق حاضر وجود داشت، مشکلات فراوان در مسیر جمع‌آوری داده بود. ثبت سیستمی اطلاعات مجرمان بجای استفاده از پرونده می‌تواند تا حد زیادی از مشکلات جمع‌آوری و آماده‌سازی داده و نیز خطای انسانی ناشی از ثبت دستی اطلاعات بکاهد و باعث صرفه‌جویی در زمان شود. به علاوه با در اختیار داشتن اطلاعات بیشتر مانند یک بانک اطلاعات جامع مکانی که علاوه بر مشخصات جمعیت‌شناختی مجرمان و خصیصه‌های جرم، محل دقیق وقوع جرم و دستگیری مجرم را نیز در خود جای دهد، می‌توان الگوهای بهتر و دقیق‌تر ازجمله الگوهای مکانی جرم را نیز استخراج کرد.
در تحقیقات آتی می‌توان دیگر الگوریتمهای داده‌کاوی را نیز برای پیش‌بینی افراد مستعد به قاچاق مواد مخدر مورداستفاده قرار دارد. به علاوه می‌توان به روشی مشابه به تحلیل و پیش‌بینی سایر جرائم پرداخت.

ملاحظات اخلاقی

مشارکت نویسندگان

همه نویسندگان در تهیه مقاله مشارکت داشته‌اند.

منابع مالی

برای انتشار این مقاله حمایت مالی دریافت نشده است.

تعارض منافع

مقاله حاضر تعارض منافع با سایر مقالات نویسندگان ندارد.

پیروی از اصول اخلاقی پژوهش

در این مقاله همه حقوق مرتبط با اخلاق پژوهش رعایت شده است.

تشکر و قدردانی

بدین‌وسیله گروه تحقیق از همکاری شورای هماهنگی مبارزه با مواد مخدر استانداری استان سیستان و بلوچستان تشکر و قدردانی می‌کند.

منابع

Ahmadvand, A. & Akhondzadeh, M.A. (2010). Framework for the application of data mining techniques in crime modeling, Police Human Development Bi-Quarterly, 17(30), 11-22. (In Persian).
Bakhtiari Shahri, A., & Eftekhari, N. (2017). Detection of people prone to drug trafficking in Sistan and Baluchestan province using data mining techniques. Fourth National Conference on Information Technology, Computer and Telecommunications, Torbat-e Heydarieh. (In Persian).
Delshad, M., Tudeh Zaeem, B., & Rastegar, A. (2017). Computer analysis of crime using artificial intelligence and pre-crime detection data mining methods. National Conference on Vision 1420 and Technological Advances in Electrical Engineering, Computer and Information Technology, Shiraz, Iran New Education Development Center. (In Persian).
Ebrahimi, R.V., & Bafandrh, H. (2017). Components of Temperament and Emotional Intelligence in People Addicted to Drugs and Normal. Paper presented at the Contemporary Psychology.
Ebrahimi, M., Mirroshandel, S. A., & Aghaii, J. A. (2015). Comprehensive part of the crime database in order to predict and identify crimes using data mining techniques. Quarterly Journal of Electronics Industry, 4 (6),. (In Persian).
Ebrahimzadeh, S., & Zarrin Kamri Lef, M. (2015), Investigation of how, function, crime pattern detection by data mining systems. 1404 National Conference on Vision and Technological Achievements of Engineering Sciences. (In Persian).
Eskandari, H. Alizadeh, S., & Kazemi, P. (2011). Application of data mining in identifying and discovering hidden patterns of theft. Journal of Law Enforcement and Security, 4 (4), 35-56. (In Persian).
Gholami, H., & Barzegar, M. (2018). The Function of Methods for Prediction of Recidivism in Grant of Parole.
Gnanapriya, S., Suganya, R., Devi, G., & Kumar, M. (2010). Data Mining Concepts and Techniques. Data Mining and Knowledge Engineering, 2(9), 256-263.
Haberman, C.P. (2017). Overlapping hot spots? Examination of the spatial heterogeneity of hot spots of different crime types. Criminology & Public Policy, 16(2), 633-660.
He, J., & Zheng, H. (2021). Prediction of crime rate in urban neighborhoods based on machine learning. Engineering Applications of Artificial Intelligence, 106,104460.
Kapoor, P., Singh, P.K., & Cherukuri, A.K. (2020). Crime Data Set Analysis Using Formal Concept Analysis (FCA): A Survey Advances in Data Sciences, Security and Applications (pp. 15-31), Springer.
Kazemi, P., & Hosseinpour, J. (2009). Application of data mining in police and judicial organizations in order to model crime and detect crimes. The Second International Conference on Electronic City, Jihad University Information and Communication Technology Research Institute, Tehran. (In Persian).
Manian, A., Jamalo, M., & Biddle, M. (2016). Designing a proposed data mining model to identify criminals. Social Order Quarterly, 8 (3), 109-128. (In Persian).
Mohler, G., & Porter, M.D. (2018). Rotational grid, PAImaximizing crime forecasts. Statistical Analysis and Data Mining: The ASA Data Science Journal, 11(5), 227-236.
Nath, S.V. (2006) of Conference. Crime Pattern Detection Using Data Mining. Paper presented at the International Conference on Web Intelligence and Intelligent Agent Technology Workshops.
Noferesti, S., Shamshadinejad, N., & Haidari, F (2018). Use of data mining techniques for differential diagnosis of iron deficiency and beta thalassemia minor, health informatics and biomedicine, 435-446. (In Persian).
Noferesti, S., & Shamsfard, M. (2015). Resource construction and evaluation for indirect opinion mining of drug reviews. PloS one, 10(5): e0124993.
Rahimi Movagher, A., & Kaviyan, M. (2015). Drug Abuse Prevention Guide for Media Staff. United Nations Office Drugs and Crime.
Rahmdel, M. (2015). Iranian Criminal Policy Vis -a- Vis Drug Offenes (3 ed.): The Organization for Researching and Composing University Textbooks in the Humanities(SAMT).
Ratcliffe, J.H. et al. (2021). The Philadelphia predictive policing experiment. Journal of Experimental Criminology, 17(1), 15-41.
Samiri, Kh., & Abbasnejad, H. (2015). Combining data sources, methods of discovery and research of crime data extraction. The First International Congress of Iranian Law. (In Persian).
Tayal, D.K., Jain, A., Arora, S., Agarwal, S., Gupta, T., & Tyagi, N. (2015). Crime detection and criminal identification in India using data mining techniques. AI & society, 30(1), 117-127.
Thangamuthu, M.A., Vadivel, M.G., & Priyadharshini, M.A. (2019). Detecting Criminal Method using Data Mining. INTERNATIONAL RESEARCH JOURNAL OF ENGINEERING AND TECHNOLOGY, 6(3).
Wheeler, A.P., & Steenbeek, W. (2021). Mapping the risk terrain for crime using machine learning. Journal of Quantitative Criminology, 37(2), 445-480
 
[1]. association rule mining
[2]. Apriori
[3]. cross industry standard process for data mining
[4]. support vector machine
[5]. Naïve Bayes
[6]. logistic regression
[7]. decision tree
[8]. k Nearest Neighbors
[9]. Apriori
[10]. 10-Fold Cross Validation

 
نوع مطالعه: اصیل | موضوع مقاله: جرائم
دریافت: 1400/3/6 | پذیرش: 1400/10/21 | انتشار: 1401/2/23

ارسال پیام به نویسنده مسئول


بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.

کلیه حقوق این وب سایت متعلق به فصلنامه رفاه اجتماعی می باشد.

طراحی و برنامه نویسی : یکتاوب افزار شرق

© 2025 CC BY-NC 4.0 | Social Welfare Quarterly

Designed & Developed by : Yektaweb