Преступность в США и России: сравнительный обзор

в 1:24, , рубрики: geopandas, pandas, python, визуализация данных, Инфографика, открытые данные, преступления, Россия, статистика, статистический анализ, США

Мотивация и цель исследования

Цель исследования -- на основе анализа открытых статистических данных сравнить ситуацию с преступностью в США и России и попытаться понять:

  • какие преступления количественно преобладают;

  • как изменяется преступность по годам;

  • каков уровень преступности в удельном выражении (на 1 млн. населения);

  • как указанные параметры распределяются территориально -- по штатам США и регионам России.

Источники данных

Для анализа используются только открытые официальные данные:

  1. Количество совершенных преступлений по основным преступлениям (убийство, грабёж, нападение при отягчающих обстоятельствах, изнасилование):

    • США: Crime Data Explorer (FBI)

    • Россия: Количество преступлений, зарегистрированных в отчетном периоде: ЕМИСС (данные Генпрокураторы РФ)

  2. Население по регионам России: ЕМИСС (данные Росстата)

Дисклеймер

Зная, как многие любят поспекулировать на тему надежности исходных данных (если не откапывают изъяны в самом анализе), не грех сразу же расставить точки над "ё".

🗣 Вы наверняка "подшаманили" данные как вам нужно...

💁 Все данные были взяты как есть и не подвергались модификации; над ними лишь производятся статистические вычисления. Это вы можете легко проверить, самостоятельно скачав данные по приведенным ссылкам и сравнив их с теми, которые используются мной.

🗣 Да разве можно доверять нашей статистике? В нашем "THE GULAG" нарисуют что угодно!

🤦 А каким тогда данным следует доверять? "Независимым" расследованиям "честных" СМИ? 🤢 Или данным ютуберов / тиктокеров / умных инстраграммеров? 🤮

🗣 Да и ФБР что угодно расскажут, чтобы свой зад прикрыть! Это же ИМПЕРИЯ ЛЖИ!

👆 / 🖕

Поскольку данные по преступлениям в России доступны (в указанном источнике) только с 2008 г., то датасет по США также взят за аналогичный период: с 2008 по 2020 г. включительно.

Для использования в Python данные были предварительно сохранены в CSV файлы.

🌎 Все исходные файлы и Jupyter-ноутбук проекта можно скачать ⚡по ссылке⚡.

Используемые инструменты

Я традиционно использую для анализа Python (у меня версия 3.10) с установленными пакетами:

  • для работы с данными: pandas, numpy

  • для создания карт: folium, geopandas, branca

  • для графиков: matplotlib, seaborn

Работаю в интерактивной оболочке Jupyter.

Всё перечисленное уже идет в комплекте с известными дистрибутивами Python. Я использую WinPython на Windows-машине.

Конечно, вам ничего не мешает проделать то же самое в R, JS, MatLAB или даже Excel. Я выбрал свое оружие :)

Подготовка данных

Итак, после загрузки всех необходимых пакетов, импорта и начальной обработки исходных данных (см. код в Jupyter) получаем следующие наборы данных:

Количество преступлений в США (первые 10 строк из 676)

year

state_abbr

state_name

population

violent_crime

homicide

robbery

aggravated_assault

property_crime

burglary

larceny

motor_vehicle_theft

rape

2008

0

0

304059724

1394461

16465

443563

843683

9774152

2228887

6586206

959059

90750

2008

AK

Alaska

686293

4475

27

645

3356

20090

3237

15225

1628

447

2008

AL

Alabama

4661900

21110

351

7346

11795

190416

50411

126539

13466

1618

2008

AR

Arkansas

2855390

14649

165

2777

10244

110360

33912

69905

6543

1463

2008

AZ

Arizona

6500180

31567

462

9809

19096

266653

58606

169460

38587

2200

2008

CA

California

36756666

185329

2142

69388

104896

1080996

237811

650656

192529

8903

2008

CO

Colorado

4939456

17480

165

3404

11760

139340

28054

97937

13349

2151

2008

CT

Connecticut

3501252

10737

132

4043

5882

87210

15107

63212

8891

680

2008

DC

District of Columbia

591833

8509

186

4430

3707

30211

3788

19958

6465

186

2008

DE

Delaware

873092

6187

57

1847

3912

31385

6783

22045

2557

371

Количество преступлений в России (первые 10 строк из 1118)

year

region

aggravated_assault

armed_robbery

extortion

homicide

larceny

misdemeanor

rape

robbery

population

2008

Алтайский край

926

315

110

377

29218

56

90

4817

2446182

2008

Амурская область

495

183

64

219

10085

21

39

1582

841579

2008

Архангельская область (без а/о)

398

330

91

199

12486

102

87

1953

0

2008

Архангельская область (с а/о)

422

334

101

216

12816

122

88

1998

1251684

2008

Астраханская область

254

265

68

118

8486

175

90

1749

1007911

2008

Белгородская область

232

121

53

98

6864

82

33

789

1523180

2008

Брянская область

334

155

29

155

10997

95

43

1000

1298797

2008

Владимирская область

353

373

50

176

14346

115

28

1910

1462340

2008

Волгоградская область

665

416

89

278

18657

166

153

3283

2620595

2008

Вологодская область

479

345

98

155

12169

257

43

2123

1216955

Как видно, оба датасета имеют сходные столбцы:

  1. year: год, для которого приведены данные

  2. state_abbr, state_name (для США) и region (для России): штат или регион

  3. population: численность населения в указанном регионе в указанный год

  4. остальные столбцы -- количество соответствующих преступлений

Здесь следует отметить два момента:

  • в исходных датасетах уже есть суммарные показатели для всей страны: в датасете по США они соответствуют строкам, в которых название штата равно нулю, а в датасете по России -- где в столбце region стоит "Российская Федерация";

  • столбцы в российском датасете были переименованы из источника в английские наименования преступлений в соответствии со следующей таблицей:

{'по ст.105 УК РФ (Убийство)': 'homicide', 
 'по ст.111 УК РФ (Умышленное причинение вреда здоровью)': 'aggravated assault',
 'по ст.131 УК РФ (Изнасилование)': 'rape',
 'по ст.158 УК РФ (Кража)': 'larceny',
 'по ст.161 УК РФ (Грабёж)': 'robbery',
 'по ст.162 УК РФ (Разбой)': 'armed robbery',
 'по ст.163 УК РФ (Вымогательство)': 'extortion',
 'по ст.213 УК РФ (Хулиганство)': 'misdemeanor'}

Поскольку у двух полученных наборов данных совпадают только несколько видов преступлений, для исследования мы возьмем только четыре самых "ядреных":

  • убийство (homicide)

  • нападение [с причинением вреда здоровью] (aggravated assault)

  • грабёж (robbery)

  • изнасилование (rape)

Годовые показатели по стране

Начнем обзор данных с самого очевидного -- годового количества преступлений в масштабах стран (США и России).

США

В абсолютных показателях (количество преступлений в год * 1000) картина в этой стране выглядит следующим образом:

Преступность в США и России: сравнительный обзор - 1

С большим отрывом лидирует нападение (по-видимому, без цели ограбления, т.к. ограбление -- это отдельный график). Причем, видно, что после некого спада к 2013 г., количество нападений быстро возрастает. За один только 2020 год рост составил 100 тысяч случаев! Количество грабежей, напротив, падает. Что бы это могло значить? Так и напрашивается вывод о том, что жестокость становится все более бессмысленной. Развлекаются ребята, что тут скажешь ;)

Изнасилования также растут, несмотря на то, что в 2020 г. был небольшой спад. На фоне остальных преступлений убийств кажется мало, и график выглядит плоским; но если приглядеться к цифрам, видно, что и здесь есть рост: после "плато" в 15-17 тыс. убийств за 2008--2019 гг., в 2020 г. их количество резко поднялось до 22 тыс.

Давайте теперь посмотрим на удельные показатели, разделив количество преступлений на численность населения * 1 млн. Это поможет проанализировать "преступные наклонности" нации, так сказать. Имеем:

Преступность в США и России: сравнительный обзор - 2

В принципе, здесь картина та же, почти "пуля в пулю", что говорит нам о независимости преступности в США от численности населения: тенденции будут сохраняться при любой численности. Интересно было бы посмотреть, как они меняются в зависимости от состава населения (по расе, возрасту и т.п.), но это как-нибудь в другой раз.

А пока посмотрим, что там делается на нашем дворе.

Россия

Преступность в США и России: сравнительный обзор - 3

При взгляде на этот график сразу бросается в глаза пикирующий тренд грабежей: их количество с 2008 г. снижается нелинейно, приближаясь к некому плато (на 2020 г. падение еще продолжается). За 13 лет количество грабежей упало в 6.5 раз. За этот же период в США грабежи сократились в 2 раза. По состоянию на 2020 г. в США грабят в 3 раза чаще, чем у нас.

Остальные три вида преступлений также обнаруживают тенденцию к сокращению, хотя спад здесь не такой заметный. Так, количество нападений (с причинением тяжкого вреда здоровью) сократилось в 2 раза с 2008 по 2020 г. Убийства сократились 2.5 раза -- с 40 тыс. в 2008 г. до 15 тыс. в 2020 г. Изнасилования сократились почти в 2 раза -- с 12.5 тыс. в 2008 г. до 7 тыс. в 2020 г.

Одним словом, боремся с данными по преступности преступностью :)

Преступность в США и России: сравнительный обзор - 4

В удельных показателях выглядит так:

Преступность в США и России: сравнительный обзор - 5

Подумать только: в 2008 г. почти каждый шестисотый житель России привлекался за ограбление! В целом, картина здесь аналогичная, что опять говорит о том, что в масштабах страны уровень преступности не зависит от численности населения; здесь необходим учет региональных, социально-экономических, этнических и других внешних факторов.

Сравнение показателей на конец периода (2020 г.)

Давайте теперь сравним показатели преступности по США и России на 2020 г. (конец наблюдаемого периода).

Преступность в США и России: сравнительный обзор - 6
Преступность в США и России: сравнительный обзор - 7

При сравнении преступности в США и России можно сделать следующие наблюдения:

  1. Как в абсолютных величинах, так и при расчете на 1 млн. населения в США преступность выше, чем в России по состоянию на 2020 г.

  2. В США уровень преступности растет (за исключением грабежей), а в России -- падает.

  3. В США явным лидером из 4 анализируемых видов преступлений является нападение при отягчающих обстоятельствах (на втором месте -- ограбление, на третьем -- изнасилование, на четвертом -- убийство). В России лидирует ограбление (хотя при продолжающемся стремительном падении ситуация может измениться); далее следуют нападение, убийство и изнасилование. Конечно, у нас нет данных о том, как квалифицируются случаи ограбления с нападением (в российских данных, конечно, есть отдельная статья -- разбой, но таких данных нет по США). Но и без этого напрашивается вывод о том, что в США преобладает бессмысленное / бытовое насилие, в то время как российский условный преступник более конкретно мотивирован (наживой). Нападений при отягчающих обстоятельствах (с нанесением тяжких телесных повреждений) в США совершается в 20 (!) раз чаще, чем в России.

  4. Если сравнивать количество убийств и изнасилований, то в США изнасилований совершается гораздо больше, чем убийств (и рост заметнее): 126 тыс. изнасилований и 21 тыс. убийств в 2020 г. В России же картина обратная: 7 тыс. изнасилований и 15 тыс. убийств в 2020 г. Здесь, наверное, можно подискутировать на тему того, насколько часто в этих двух странах люди заявляют в полицию о совершенном изнасиловании (видимо, в США все же чаще). Также у нас нет информации о том, как отображаются в статистике случаи изнасилования и убийства, совершенные одним человеком в одном и том же месте и времени... Но результат все равно показателен.

  5. По убийствам США обгоняют нашу страну только начиная с 2020 г. и с минимальным отрывом. Если взглянуть на данные 2008 -- 2019 гг., картина была обратная: убивали больше в России (как в абсолютном, так и в удельном выражении). Например, при усреднении показателей за весь период (2008--2020 гг.) в США удельное количество убийств составляет 51 на 1 млн. человек, а у нас -- 85 на 1 млн. человек. Вот вам и "окаянные нулевые"...

Преступность по регионам

Теперь же будет интересно посмотреть на эти данные в разрезе географического распределения по регионам каждой страны. Это может многое рассказать о глубинных причинах совершаемых преступлений.

США

Рейтинг штатов США по суммарному количеству всех 4 видов преступлений в абсолютном выражении:

Преступность в США и России: сравнительный обзор - 8

То, что мы видим на этой диаграмме, подтверждает наблюдения моего предыдущего исследования, которое я позволю себе здесь процитировать:

"Голливудский" штат намного опережает по этой печальной статистике все остальные. Тройка лидеров - южные штаты (Калифорния, Техас и Флорида); именно про эти штаты снято большинство американских фильмов про бандитов.

Посмотрим на десятку лидеров по каждому виду преступлений:

Преступность в США и России: сравнительный обзор - 9

Везде на пьедестале та же "троица" (хотя по грабежам штат Нью-Йорк вытеснил Флориду на 4-е место). Разница между "суперменом"-Калифорнией и Техасом везде примерно одинаковая, кроме изнасилований: здесь эти два штата соперничают на равных.

Так как без данных по численности населения мы не сможем сделать вывод о том, какие же штаты более безопасные для жизни, посмотрим и на удельные показатели:

Преступность в США и России: сравнительный обзор - 10

"Внезапно" в лидеры выбились малочисленные штаты -- Округ Колумбия (где столица страны Вашингтон), Аляска и не такой уж малонаселенный Нью-Мексико.

Топ по видам преступлений выглядит следующим образом:

Преступность в США и России: сравнительный обзор - 11

Ну и чтобы более наглядно было, отобразим удельные показатели преступности на карте:

Аляска против объединенного Юга борются за пальму первенства
Аляска против объединенного Юга борются за пальму первенства

Итак, можно сделать следующие наблюдения по США:

  • самые преступные штаты с точки зрения количества совершаемых преступлений -- самые густо населенные (кэп здесь!); это Калифорния, Техас, Флорида и Нью-Йорк

  • в показателях на душу населения с большим отрывом лидирует Округ Колумбия с г. Вашингтон (столица все-таки)

  • по 3 из 4 видов преступлений также лидируют "столичные", хотя по нападениям этот отрыв (от Аляски и Нью-Мексико) не столь заметен

  • по убийствам на втором месте неожиданно Луизиана -- штат хлопка, работорговли, джаза, блюза и хм... преступности

    Из Википедии:

    In 2015, Louisiana had a higher murder rate (10.3 per 100,000) than any other state in the country for the 27th straight year. Louisiana is the only state with an annual average murder rate (13.6 per 100,000) at least twice as high as the U.S. annual average (6.6 per 100,000) during that period, according to Bureau of Justice Statistics from FBI Uniform Crime Reports.

    Wikipedia contributors. (2022, January 25). Louisiana. In Wikipedia, The Free Encyclopedia. Retrieved 00:26, January 27, 2022, from https://en.wikipedia.org/w/index.php?title=Louisiana&oldid=1067877269

  • по изнасилованиям на душу населения явным "фаворитом" выступает холодная Аляска... греются ребята ;)

Россия

Все регионы России по количеству преступлений (в абсолютном выражении):

Преступность в США и России: сравнительный обзор - 13

Вот она -- Москва, жемчужина нашей Родины! Как десяток других областей вместе взятых. Понимаем, что дело здесь, конечно, в численности населения... До удельных показателей дойдем, а пока топ-10 по количеству преступлений:

Преступность в США и России: сравнительный обзор - 14

Москва или Московская область везде на первом месте, как видите. Особенно что касается грабежей. Вот с "серебряным призером" интереснее: по убийствам Свердловская область потеснила даже столицу, по нападениям на пятки Московской области наступают Кузбасс, Иркутская область и Свердловская область, по изнасилованиям Москву догоняет все та же "жемчужина Урала".

Ладно, что там с удельными показателями?

Преступность в США и России: сравнительный обзор - 15
Преступность в США и России: сравнительный обзор - 16

Ну и где бы вы теперь согласились постоять в "ролексе" в подземном переходе около полуночи? :) Тувинцы зверствуют, поморы из Архангельска тоже не хотят уступать... В Тюменской области процветают ограбления.

На карте России выглядит так:

Суровый русский север, суровая Сибирь... Кавказ меркнет.
Суровый русский север, суровая Сибирь... Кавказ меркнет.

Некоторые наблюдения по России:

  • наибольшее количество преступлений совершается в Москве и Московской области, на втором месте -- Свердловская и Иркутская области

  • в удельных показателях тройка лидеров -- Тюменская область, Республика Тыва и Архангельская область; в первых двух превалируют грабежи, в Тыве -- высокая доля нападений и убийств

  • наиболее преступными регионами в целом являются Сибирь (Иркутская область, Тыва, Забайкалье, Хабаровский край, Кузбасс, Томская область, Тюменская область), Архангельская область и Пермский край

  • наиболее безопасными регионами, согласно официальным данным, является Кавказ (может, просто мало данных?), Центральный и Южный ФО, а также ЯНАО, ХМАО и Камчатка

Что же, наш небольшой обзор на этом завершен. Ссылка на файлы проекта выше (и вот еще раз). В будущем планирую развивать тему и делать новые публикации на Хабре.

Берегите себя в это непростое время! 🖐

Автор: Искандер Шафиков

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js