교정 리포트

Ⅰ. 서론
Ⅱ. 이론적 배경
Ⅲ. 연구 방법론
Ⅳ. 분석 결과
Ⅴ. 결론

국문요약

지난 10여 년간 성범죄자 재범 위험성 평가는 학문적으로나 실무적으로 많은 발전을 이루어 왔다. 이러한 비약적 발전에도 불구하고, 선행연구들은 재범 위험성 평가도구의 한계 중 하나로 범죄자 유형론에 관한 고려가 부족하다는 점을 지적하고 있다. 본 연구는 이러한 주장의 타당성을 검증하는 것을 목표로 한다. 이를 위해 ‘한국형 성범죄자 재범 위험성 평가도구(KSORAS: Korean Sex Offender Risk Assessment Scale)’를 활용하여, KSORAS가 아동/청소년 상대 성범죄자와 성인 상대 성범죄자의 재범 위험성을 적절히 예측하는지를 검증했다. 본 연구 문제에 답하기 위해 전자감독명령이 부과된 성폭력 사범 866명의 재범 상황을 추적했다. 데이터 분석 결과, KSORAS는 아동/청소년 상대 성범죄자의 재범은 잘 예측함에 반해, 성인 상대 성범죄자의 재범은 상대적으로 잘 예측하지 못했다. 두 집단의 재범을 예측하는 문항들도 상이한 패턴을 보였다. 연구의 후반부에서는 성범죄자 유형론의 주장을 고려하여, 아동/청소년 상대 성범죄자 평가도구(KSORAS-MINOR)와 성인 상대 성범죄자 재범 위험성 평가도구(KSORAS-ADULT)를 각각 구성하고 그 예측타당도를 분석하였다. 분석 결과, 성범죄자 유형론을 고려하지 않은 기존의 접근법에 비해, 기존 도구를 수정 개발한 성범죄자 유형별 평가도구의 예측 타당도는 통계적으로 유의미한 수준까지 향상되었다. 이러한 결과를 바탕으로 향후 성범죄자 평가와 관련된 정책방향 및 후속 연구의 제안점을 논의하였다.

※ 주제어 : 재범 위험성 평가, 범죄자 유형론, 성범죄자, KSORAS, 예측타당도

Ⅰ. 서론

우리나라의 형사사법 절차에 재범 위험성 평가(risk assessment)가 본격적으로 활용되기 시작한 지 20여 년이 가까워지고 있다. 학술논문에 강학상 개념으로만 소개되어 오던 재범 위험성 평가가 형사사법 실무에 본격적으로 활용되기 시작한 데에는 보호관찰 현장에서의 분류평가 도구 개발과(김양곤·이수정·이민식, 2005; 최인섭·진수명, 2002) 2000년대 중반부터 논의된 성범죄자에 대한 일련의 보안처분의 도입이 지대한 영향을 미쳤다. 특히 2008년 9월부터 시행된 전자발찌 제도는 고위험 성범죄자에 대한 형기 종료 후 보안처분 부과를 위해 그동안 법률상으로는 존재했으나 사실상 크게 쟁점화되지 않았던 재범 위험성의 측정과 증명을 논란의 한 중심에 위치시켰다(김지선 외, 2013; 김혜정, 2010). 이러한 맥락에서 법무부는 ‘한국형 성폭력 사범 재범 위험성 평가도구’(이하 KSORAS라고 함)라고 명명된 평가도구를 개발하여, 전자장치 부착 명령 청구전 조사 등에 활용해왔다(이수정·고려진·박혜란, 2008). KSORAS는 그동안 성범죄 전과만으로 사실상 추정되어 온 재범 위험성이라는 개념을 경험적으로 측정하여 검찰/법원에 제시하는 등 형사사법 현장에 재범 위험성 평가라는 개념이 확산하는데 큰 역할을 수행해 왔다. KSORAS가 성폭력 사범 보안처분의 부과요건으로 또 보호관찰 현장에서 분류평가 도구로 활발히 활용되면서, KSORAS에 대한 개선 필요성도 꾸준히 제시되어 왔다(김지선 외, 2021).
본 연구는 성범죄자 재범 위험성 평가에 제기된 몇 가지 비판 중 성범죄자 유형론(sex offender typology)에 대한 고려가 부족하다는 지적에 초점을 둔다. 이러한 문제의식은 북미에서도 2000년대 초반부터 제기되기 시작하여, 프렝키와 동료들(Prenky, Janus, Barbaree, Schwartz & Kafka, 2006)은 성범죄자 재범 예측의 타당도와 신뢰도 향상을 위해 성범죄자 하위 유형에 대한 고려가 절실하다고 주장하였고, 국내에서도 박지선(2011)은 유사한 맥락에서 재범 위험성 평가에서 성범죄자 하위 유형의 고려가 필요하다고 지적하고 있다. 특히, 다른 범죄 군에 비해서 범죄자 유형론에 관한 논의가 활발한 성범죄자의 경우, 성범죄자 하위 유형을 고려하여 재범 위험성 평가도구를 구성할 필요성이 있는지는 평가도구의 예측타당도를 향상시키고, 효과적인 성범죄자 처우계획을 수립함에 있어서 반드시 검토되어야 할 중요 이슈 중 하나이다.
본 논문은 성범죄자 집단의 균질성을 가정하여 개발된 KSORAS가 아동/청소년 상대 성범죄자 및 성인 상대 성범죄자의 재범 위험성 골고루 잘 예측하는지를 검증하고, 현행 KSORAS를 ‘아동 상대’ 및 ‘성인 상대’ 재범 위험성 평가도구로 세분화하여 구성할 경우 성범죄자의 재범 위험 예측을 향상시킬 수 있는지를 검증하는 것을 목표로 한다. 본 분석을 위해 2018년 3월 1일부터 2020년 12월 31일까지 전국 57개 보호관찰소에서 전자감독이 개시된 성폭력 사범 866명을 상대로 분석이 실시되었다.

Ⅱ. 이론적 배경

1. 성범죄자 재범 위험성 평가와 KSORAS의 도입

최근 범죄자 교정교화 분야의 최대 관심사는 증거 기반 교정(Evidence-Based Corrections)의 실현이다. 범죄자의 실효적 재범 예방을 위해서는 대상자의 재범 위험성을 과학적으로 평가하고 고위험 대상자를 선별하여, 범죄 유발 욕구에 대한 체계적 개입이 절실하다 (Andrews & Bonta, 2010). 선행연구는 이러한 RNR(Risk-Needs -Responsivity) 원칙이 성폭력 사범의 관리와 치료에도 동일하게 적용되어야 함을 증명하고 있다. 성범죄자 재범 위험성 평가는 RNR 원칙을 구성하는 핵심 구성요소로 증거 기반 교정의 실현에 필수적 역할을 해오고 있다(Hanson & Morton-Bourgon, 2009).
북미의 경우 성범죄자에 대한 재범 위험성 평가는 1970년부터 법정 내 심리진단을 위주로 논의되기 시작하여, 재범 위험성 평가도구가 본격 개발되기 시작한 건 1990년대 후반부터이다. 이 시기 주로 활용되어온 성범죄자 재범 위험성 평가도구는 ‘재범예측’을 주 목적으로 하는 보험 계리적(actuarial) 평가도구이다. 성범죄 전과, 피해자 유형 등 정적 위험요인 중심의 문항으로 구성되어 있으며, 세계적으로 가장 활발히 활용되고 있는 Static-99, MnSOST 등이 이 부류에 속한다(Doren, 2002). 2000년대 중반부터는 성범죄자 치료 프로그램의 효과성 평가와 성범죄자 위험성 관리의 필요성을 고려하여 일탈적 성적 취향, 충동성 등 동적 위험요인을 포함한 재범 위험성 평가도구가 개발되기 시작했다. 핸슨과 동료들이 개발한 STABLE-2007, ACUTE-2007과 같은 도구가 이 시기에 출현한 대표적 도구이다. 2010년 이후부터는 재범 위험성 평가 영역에서 기존 ‘예측’의 이슈가 ‘관리계획’이라는 이슈로 전환되면서, 소위 ‘구조화된 전문가 평가 방식(SPJ)’이 도입되었다. SPJ 방식을 따르고 있는 대표적 성범죄자 재범 위험성 평가도구로는 RSVP가 있다(Thornton & D’Orazio, 2016). 아래 <표 1>은 북미에서 활용되는 대표적 성범죄자 재범 위험성 평가도구와 이들 도구에 포함된 문항과 요인의 구조를 제시하고 있다.

<표 1> 성범죄자 재범 위험성 평가도구에 포함된 위험요인 정리

자료: <Hanson & Guy-Bourgon (2017) 수정>

우리나라에서 성범죄자 재범 위험성 평가도구가 형사사법 실무에 본격 사용되기 시작한 것은 2008년 9월이다. 성범죄자 전자감독제도 시행에 맞추어, 법무부의 연구용역 과제로 경기대 이수정 교수팀이 개발한 한국형 성범죄자 재범 위험성 평가도구(KSORAS)가 그 원형이다(이수정 외, 2008). KSORAS는 연령, 성범죄 및 폭력 범죄 전력 등 총 15개의 정적 문항으로 구성된 2세대 평가도구이다. 평가대상자에 대한 면담과 관련 서류를 참조하여 평가가 진행되며, 평가 결과는 재범 위험성 높음, 중간, 낮음의 3수준으로 제시된다. 총점 기준 13점 이상인 경우 재범 위험성이 높은 집단으로 분류되며, 원칙적으로 전자장치 부착 명령의 청구 대상이 된다. 개발 샘플에서 검증된 KSORAS의 재범 예측력은 AUC 기준, .813으로 매우 높은 수준이었으며, 외국의 STATIC-99, MnSOST 등과도 적정한 수준의 수렴 타당도가 보고되었다(이수정 외, 2008). 개발연구의 샘플을 3년간 추적한 후속 연구에서 성범죄 재범에 대한 KSORAS의 예측타당도는 AUC 기준 .676, 폭력 범죄 재범 예측력은 .682로 개발 당시에 비해 낮은 수준이었지만, 짧은 추적 기간을 고려할 때 비교적 양호한 수준으로 분석되었다. 다만, 성범죄 재범 고위험군과 저위험군을 구분해 주는 변별 기준점으로는 종래의 13점이 아닌 15점이 좀 더 적합하다고 분석되었다(이수정 외, 2010). 2020년에는 일부 문항의 채점과 관련된 혼동을 해소하고, 새로운 문항을 추가하여 총 16문항의 KSORASⅡ가 개발되었다(이수정 외, 2020). KSORAS는 우리나라 최초로 실증적 재범 위험성 평가 체계의 구축이라는 점에서 높은 평가를 받아 마땅하지만, 그에 대한 보완점도 지속 제기되어 왔다(김지선 외, 2013; 2021). 첫째, 정적 문항 위주로 구성되어 있어 성범죄자 처우 계획 수립과 부착 명령 임시 해제 등에 적용될 수 없다는 점, 둘째, 고위험군을 선별하는 변별 기준점이 현행 13점이 맞는지에 관한 변별 타당도에 관한 이슈, 셋째, 비접촉 성범죄자 등 적용 대상이 되는 성범죄의 한정성 이슈 등이 이에 해당한다.

<표 2> KSORAS 문항 구성표

자료: <이수정 외, 2008>

2. 성범죄자 유형론과 재범 위험성 평가

성폭력 사범 치료/관리에 관한 선행연구들은 성폭력 사범이 단일한 하나의 집단이 아니라 심리사회적으로 다양한 특성을 보이는 이질적 집단임을 지적하고 있다(Knight & Prentky, 1990). 대표적으로 가해자와 피해자의 인구 사회적 특징을 기준으로 성인 여성을 주 대상으로 삼는 강간범(rapists)과 아동을 대상으로 하는 아동 성 학대 사범(child sexual abusers)을 분류하고, 이들의 범행 수법 및 동기에서의 차이점을 지적하는 연구들이 많다(Terry, 2006). 두 가지 유형의 성범죄자를 추가로 유형 분류한 연구들도 많다. 먼저 성인 대상 성범죄자에 대해 그로쓰와 동료들은 강간범의 주요 범행동기를 기준으로 권력 확인형(power reassurance), 권력 유입형(power assertive), 분노 보복형(anger retaliatory), 분노 흥분형(anger excitation)으로 4분 하였다(Groth, Burguess & Holmstrom, 1977). 아동 대상 성범죄자에 대해서도 그로쓰와 빔바움은 아동에게 지속적이고, 강박적인 성적 매력을 갖는 고착형 성범죄자(fixated offenders)와 자신의 동년배에게 일차적인 성적 매력을 느끼지만, 다른 이유로 인해 잠시 아동에게 성적 매력을 갖는 회귀형 성범죄자(regressed offenders)를 구분하였다(Groth & Bimbaum, 1978). 우리나라에서도 성범죄자를 상대로 한 의미 있는 유형화 시도가 있어왔다. 대표적으로 김지선과 동료들(2009)은 2000년부터 2007년까지 재판을 받은 400명의 청소년 상대 성범죄자의 하위 유형을 분류했다. 자료 분석 결과, 청소년 대상 성범죄자들은 애착형, 폭력형, 도구형의 세 가지 유형으로 분류되었으며, 이 중 점유율이 가장 높은 유형은 애착형(70.5%)이었다. 장은영과 이수정(2017)은 전자발찌를 부착하지 않은 일반 보호관찰 성범죄자 86명을 대상으로 재범 위험성 평가도구 문항, 심리평가 문항 등 총 21개의 변인을 포함하여 MDS 분석을 실시하였다. 분석 결과 성범죄자는 크게 ‘대인관계 문제집단’, ‘반사회성 집단’, ‘정신질환 집단’, ‘성에 대한 집착 집단’등 4유형으로 구분되었다.¹⁾
성폭력 사범의 이질성과 범죄예측/위험성 평가 간 관계에 대한 문제의식은 미국에서는 2000년대 초반부터 제기되었다. 프렝키와 동료들(Prenky et al., 2006)은 성범죄자 재범 예측의 타당도와 신뢰도 향상을 위해 성범죄자 하위 유형에 대한 고려가 필요하다고 주장하였다. 실제 바르토쉬와 동료들(Bartosh et al., 2003)은 재범 위험성 평가도구의 재범 예측력이 성범죄자 하위 유형에 따라 다르다는 결과를 발견했다. Static-99, SORAG, RRASOR, MnSOST-R 등 4개의 재범 위험성 평가도구는 아동 성추행범의 성범죄 재범 여부는 비교적 잘 예측하였으나, 성인 상대 강간범에 대한 예측타당도는 도구별로 매우 다양한 결과를 보고했다. 해리스와 동료들(Harris et al., 2003)의 연구도 유사한 결과를 보고하였다. Static-99를 활용한 396명의 성범죄자에 대한 재범 추적 연구에서, 전체 샘플에서 보인 Static-99 총점의 재범 예측력은 AUC=.62로 비교적 낮은 편에 속했지만, 아동 상대 성추행범에 대한 예측타당도는 이보다는 상대적으로 높은 AUC=.65, 성인 상대 강간범에 대한 예측타당도는 이보다 훨씬 낮은 AUC=.59를 보고했다. 종합하여 보면 선행연구들은 성범죄자 재범 행동의 근저에 성적 일탈성(sexual criminality)과 일반 범죄성(general criminality)의 두 가지 상이한 요인이 작동함을 보고하고 있다(Doren, 2002). 아동 대상 성범죄의 경우, 일반적으로 문제 되는 것은 성적 일탈성이고, 성인 대상 성범죄의 경우는 일반 범죄성 요인이 문제시되는데. 이들 특징들을 분리하여 고려하지 않는 경우, 재범 행동의 예측에는 한계가 발생할 수 밖에 없다. 이처럼 성폭력 사범의 이질성을 고려하지 않는 단선론적 접근은 성폭력 사범에 대한 재범 예측의 타당도를 저해할 충분한 가능성을 내포하고 있다. 1) 국내의 성범죄자 유형 분류에 관한 선행연구 중 주목할만한 연구로는 고선영과 동료들(2010), 서종한·김경일(2011) 등이 있다.

3. 본 연구: KSORAS의 범죄자유형별 타당도 검증

지금까지 검토된 선행연구들은 성범죄자 재범 위험성 평가에 있어서 성범죄자 하위 유형에 대한 고려가 필요함을 시사한다. 본 연구는 이러한 가능성을 검증하기 위해, 우리나라 형사사법 절차에서 가장 활발히 사용되고 있는 성범죄자 재범 위험성 평가도구인 KSORAS를 활용한다. 선행연구는 다양하고 복잡한 성범죄자 유형론을 보고하기도 했지만, 가장 기본적 분류 기준은 피해자의 연령을 기준으로 성범죄자를 구분하는 접근이다. 이 기준은 성범죄자를 성인을 범죄 대상으로 하는 강간범(rapists)과 아동/청소년을 상대로 하는 아동성추행범(child molesters)으로 구분한다(Terry, 2006). KSORAS가 과연 성범죄자 하위 유형에 상관없이 성범죄자 전체의 재범을 잘 예측하는지를 검토하려는 본 연구의 취지를 고려하여, 두 가지 유형의 성범죄자에 대해서만 KSORAS의 재범 예측력을 검토한다.
구체적으로 본 연구에서 검증될 연구 문제는 두 가지다. 첫째는 과연 현행 KSORAS가 성범죄자 유형에 관계없이 두 유형의 성범죄자, 즉 아동/청소년 상대 성범죄자와 성인 상대 성범죄자의 재범 위험성을 골고루 잘 예측하는지를 분석하는 것이다. 이 부분에서는 추가적으로 KSORAS의 각 문항이 두 하위 집단의 재범을 어떻게 예측하는지도 추가 검토하도록 하겠다. 둘째는 성범죄자 유형별 재범 위험성 평가도구를 구성하여, 이들 새로운 재범 위험성 평가도구의 예측타당도를 기존의 KSORAS와 비교하는 것이다. 이러한 일련의 과정을 거치면, 성범죄자의 유형론적 함의를 기존의 재범 위험성 평가도구에 반영할 필요가 있는지를 검증할 수 있을 것이다.

Ⅲ. 연구방법론

1. 데이터 및 측정

본 연구의 분석 대상은 2018년 3월 1일부터 2020년 12월 31일까지 전국 57개 보호관찰소에서 위치추적 전자감독이 개시된 성폭력 사범 866명이며, 이들에 대한 재범은 2021년 6월 기준으로 추적되었다. 본 연구에 포함된 대상자에 대한 인구 사회학적 통계가 표-3에 제시되어 있다. 대상자의 연령은 평균 45세(표준편차 11세)이고²⁾, 직업은 무직이 56%이며, 학력은 초졸 이하(14.5%), 중졸 이하(17.9%), 고졸 이하(49.1%), 대재 이상(18.3%)으로 약 80%가 고졸 이하의 학력을 갖고 있었다. 결혼상태는 기혼상태(11.2%), 미혼(58.3%), 이혼(30.4%)로 대부분 불안정한 결혼상태를 보였다. 대상자의 징역형 선고 기간은 평균 67개월(표준편차 40개월)이며, 전자감독 선고 기간은 평균 101개월(표준편차 51개월)이었다. 연구에 포함된 대상자들의 명령유형은 대상자의 약 83%가 형기 종료 후 대상자였고, 소급 대상자를 포함하면 약 95%가 형기 종료 후 대상자에 포함되었다. 연구의 종속변수는 전자감독 감독 기간 중 성범죄로 동종 재범을 했는지 여부이다. 전체 분석 대상자 중 약 7.9%의 대상자가 관찰 기간 내에 성범죄로 동종 재범을 한 것으로 분석되었다. 2) ‘전자장치 부착에 관한 법률’에 따라 만 19세 미만의 자에 대해서는 전자장치를 부착할 수 없으므로 연구에 포함된 모든 성폭력 사범은 성인에 국한되었다.

<표 3> 연구 대상자의 인구사회학적 특징

재범 위험성 평가 관련 KSORAS 개별 문항의 기술 통계는 표-4와 같다. 전체 대상자의 KSORAS 총점은 평균 13.7점(표준편차 3.01점)이었다. 문항별로 비교적 높은 점수 분포를 가진 문항은 혼인 경험 없음(0.883), 본범 유형 접촉형(2.986), 피해자 낯선 이/가족(.739) 등이 있었고, 낮은 점수 분포를 가진 문항은 남성 피해자(0.040), 감독 기간 중 문제행동(0.301) 등이 있었다.

<표 4> KSORAS 문항별 기술통계

2. 분석방법: ROC 분석

본 연구는 범죄자 유형별 재범 위험성 평가도구의 예측타당도(predictive validity)를 검증하는 것을 연구 문제로 삼는다. 재범 위험성 평가도구가 평가 대상자의 재범 가능성을 얼마나 잘 예측하는가에 관한 기준을 예측타당도라 지칭하며, 예측타당도의 검증과 관련되어 선행연구에서 활용되는 주요한 개념으로는 ‘판별력’(discrimination)과 ‘교정력’(calibration)이 있다. 재범 위험성 평가도구의 판별력은 평가도구가 재범집단과 비재범집단을 얼마나 잘 변별해 줄 수 있느냐의 문제이고, 교정력은 재범 위험성 평가도구의 예측 내용과 실제 발생 결과가 얼마나 일치하는가에 관한 문제이다. 전통적으로 판별력과 관련된 통계치가 재범 위험성 평가도구의 예측타당도 지표로 활용되어 왔으며, 교정력에 대한 관심은 최근에야 발생하기 시작했다(Helmus & Babchishin, 2017).

재범 위험성 평가도구의 예측타당도 중 ‘판별력’을 평가하는 기준으로는 다양한 통계치가 활용되어 왔으나, 학자들 사이에서 가장 활발히 사용되는 통계분석 방법은 ROC(Receiver Operating Characteristic) 분석법이다(이수정·윤옥경, 2003). ROC 분석법은 다른 통계치에 비해 표준화된 메트릭이며, 재범 기저율에 독립적인 성격을 갖고 있어 해당 통계치를 재범 위험성 평가도구의 예측타당도를 비교하는 목적으로 활용할 수 있다는 장점이 있다. ROC 분석법은 4가지 예측 가능성, 즉 ①재범할 것이라고 예측된 범죄자가 추후 재범한 경우(True Positive: TP), ②재범할 것이라고 예측된 범죄자가 재범하지 않는 경우(False Positive: FP), ③재범하지 않을 것이라고 예측한 범죄자가 재범하지 않는 경우(True Negative: TN), ④재범하지 않을 것이라고 예측한 범죄자가 재범한 경우(False Negative: FN)를 활용하여 민감도(sensitivity)와 특이도(specificity)라는 두 가지 지표를 생성하고 이에 근거하여 재범 예측 도구의 효용성을 결정한다. 민감도는 실제 재범자 중 재범 위험성이 높다고 예측된 자의 비율을, 특이도는 실제 비 재범자 중에서 재범 위험성이 낮다고 예측된 자의 비율을 지칭하며, 재범 위험성 평가도구의 총점이 이 두 수치를 가장 높게 산출해주는 경우를 AUC(Area Under the Curve)라는 통계수치를 통해서 제시한다. 과연 어느 수준의 AUC 수치를 적정한 통계치로 간주할 것인지에 대해 학자 간 견해가 일치되지는 않고 있다. 다만, AUC .50은 통계적‘우연’인 가장 낮은 수준을 의미하여, AUC가 .50 - .63는 예측타당도 ‘낮음’으로, AUC가 .64 - .70은 ‘중간’ 수준으로, AUC가 .71 이상인 경우 예측타당도 ‘높음’ 수준으로 분류하는 견해가 일반적이다(Rice & Harris, 2005; Cohen, 1992).

Ⅳ. 분석 결과

1. 성범죄자 유형별 재범 위험성 평가도구의 필요성 탐색

1) KSORAS의 집단별 예측타당도 분석

KSORAS 총점이 전체 성범죄자, 아동/청소년 상대 성범죄자, 성인 상대 성범죄자의 재범을 잘 예측하는지에 관한 예비분석을 실시하였다. 먼저 전체 성범죄자 866명을 상대로 KSORAS의 재범 예측력을 분석한 결과, KSORAS 총점의 성범죄 재범 예측력은 AUC 기준 .678로 ‘중간’ 수준이었다. 다음으로 전체 분석 대상자 중 아동/청소년을 대상으로 성범죄를 저지른 429명³⁾에 대해서만 KSORAS 총점의 재범 예측력을 추정하였을 때, 예측타당도는 AUC 기준 .744로 ‘높음’ 수준이었다. 그러나, 분석을 성인 대상 성범죄자 437명에 한정했을 때, 그 재범 예측력은 AUC 기준 .643으로 대폭 감소하였다. 다만, KSORAS의 범죄피해자 유형에 따른 재범 예측력 차이는 통계적으로 유의미한 차이를 보이지는 않았다(chi2(1)=2.31, Prob>chi2 = 0.128). 비록 작은 샘플 수로 통계적 유의미성에 이르지는 못했지만, 분석 결과는 피해자 유형을 고려하여 성범죄자의 재범 위험성을 별도로 추정할 필요성을 어느 정도 입증하고 있다고 해석할 수 있다. 3) 피해자 연령집단 구분을 위해서는 KSORAS 8번 문항을 기본으로 활용하였다. 따라서 본 연구의 경우 피해자가 아동/청소년 집단인 경우의 연령 기준은 만 18세 미만을, 성인은 만 18세 이상을 지칭한다.

<표 5> KSORAS 재범 예측력 비교

2) KSORAS의 문항별 효용성 탐색

KSORAS가 성범죄자 유형에 상관없이 재범 위험성을 잘 예측할 수 있는가에 관한 추가 분석을 위해, KSORAS의 문항별 재범 예측력을 분석하였다. 이를 위해, 성범죄 재범 여부를 종속변수로 하는 로짓분석을 실시하였다. 먼저 개별 문항과 재범 여부 간 단순로짓분석을 실시한 후, 전체 문항을 포함한 다변인 로짓분석(multi-variate logit)을 실시하였지만, 결과는 다변인 로짓분석 위주로 제시하였다.⁴⁾ 우선 전체 성범죄자에 대한 KSORAS 개별 문항별 재범 예측력을 살펴보았다. 분석 결과, 전체 15개 문항 중 총 4개 문항이 성범죄 재범 여부와 통계적으로 유의미한 관계를 보였다. 이 중 5번(성범죄 전과), 6번(폭력 전과), 7번(시설수용 기간)은 원래 문항의 취지대로 각 문항 1점 증가 시마다 재범 위험성을 각 69%, 49%, 82% 증가시키는 것으로 분석되었다. 13번(현저한 폭력의 사용)의 경우에는 문항의 구성 취지와는 반대로 재범 위험성을 약 51% 감소시키는 것으로 분석되었다.⁵⁾
다음으로 아동/청소년 대상 성범죄자만을 상대로 KSORAS 개별 문항의 재범 예측력을 살펴보았다. KSORAS가 아동/청소년 대상 성범죄자에게는 비교적 높은 예측타당도를 보여줬던 것처럼(AUC=.744), 총 6개 문항이 성범죄 재범 여부와 통계적으로 유의미한 관계를 갖는 것으로 나타났다. 이 중 2번(혼인 여부), 5번(성범죄 전과), 6번(폭력 범죄 전과), 7번(시설수용 기간), 14번(감독 중 문제행동)은 원래 문항의 취지대로 각 문항의 1점 증가 시마다 재범 위험성을 각각 증가시켰다. 일부 문항은 문항의 취지와 달리 재범 위험성을 감소시키는 것으로 분석되었는데, 특히 3번(최초 입건 연령)의 경우에는 재범 위험성을 약 65% 감소시키는 것으로 분석되었다.
마지막으로 성인 대상 성범죄자만을 상대로 KSORAS 개별 문항의 재범 예측력을 살펴보았다. KSORAS가 성인 대상 성범죄자에게는 비교적 낮은 예측타당도를 보여줬던 바와 같이(AUC=.643), 총 2개의 문항만이 성범죄 재범 여부와 통계적으로 유의미한 관계를 보였다. 이 중 5번(성범죄 전과)은 원래 문항의 취지대로 각 문항의 1단위 증가 시마다 재범 위험성을 약 81% 증가시키는 것으로 분석되었으나, 일부 문항은 문항의 취지와 달리 재범위험을 감소시키는 것으로 분석되었고, 특히 13번(현저한 폭력의 사용)의 경우에는 재범 위험성을 약 48% 감소시킨 것으로 분석되었다. 4) 단순 로짓분석결과 KSORAS 8번(피해자 연령), 9번(피해자 관계), 13번(현저한 폭력) 문항은 양변인 수준에서도 재범 여부를 정확히 예측하지 못했다. 이들 문항들은 재범 위험성을 오히려 감소시키는 것으로 분석되었다(8번 오즈비 .79, 9번 오즈비 .85, 13번 오즈비 .59)
5) 13번 문항의 예측력은 기존의 예상과는 다른 것이었는데, 이에 대해 추가 분석을 거듭했음에도 불구하고 이 관계는 지속되었다. 이것이 “현저한 폭력”이라는 추상적 개념의 측정 오류에서 발생하고 있는 것인지, 실제로 이러한 이론적 관계가 존재하는 것인지에 대해서는 후속 연구가 필요할 것으로 보인다.

<표 6> KSORAS 문항별 재범 예측력 비교

Legend: * p＜.1; ** p＜.05; *** p＜.01

2. 성범죄자 유형별 재범 위험성 평가도구 개발 및 타당도 검증

전술된 분석 결과는 KSORAS가 아동 상대 성폭력 사범과 성인 상대 성폭력 사범에 대한 재범 위험성을 차등적으로 예측할 가능성을 제시한다. 이하에서는 이러한 한계점을 극복하기 위하여 아동/청소년 대상 성범죄자와 성인 대상 성범죄자별로 각각 별개의 재범 위험성 평가도구를 구성하여 예측타당도를 분석하고, 수정 개발된 유형별 평가도구의 예측타당도와 종전의 대상자 유형을 고려하지 않은 KSORAS의 예측타당도를 비교하여 그 효용성을 검증하도록 하겠다.⁶⁾ 6) 아동/청소년 대상 평가도구 및 성인 대상 평가도구를 구성함에 있어서는 연구 기간이 단기이고, 현재 개발되어 있는 도구와의 예측타당도 비교를 위해 불가피하게 법무부의 데이터베이스에 포함되어 있는 문항의 풀에서 문항이 선별될 수밖에 없는 한계가 존재하였다. 후속 연구는 각 유형별 대상자의 재범 위험성을 더 잘 평가할 수 있는 신규문항을 수집할 필요가 있다.

1) 아동/청소년 대상 재범 위험성 평가도구 개발
아동/청소년 대상 재범 위험성 평가도구를 구성하기 위해, 일차적으로 기존 KSORAS 문항 중 단순 로짓분석 결과, 유의수준 .10 수준에서 재범 여부를 예측하지 못하는 변수를 우선 제외하였다. 다음으로는 법무부의 데이터베이스에서 활용 가능한 문항들을 추출하였는데, 대부분 성인보호관찰대상자 재범 위험성 평가도구(KPRAI-R)⁷⁾의 문항을 사용하였고, 문항 선발 기준은 동일했다.⁸⁾ 이러한 일련의 과정을 통해 아래와 같은 10문항을 아동/청소년 대상 성폭력 사범 재범 위험성 평가도구(약칭: KSORAS-MINOR)로 구성하였다. 문항별 가중치를 점검한 결과, 일부 문항의 가중치 변경 필요성이 제기되었으나, 현재의 가중치와 변경된 가중치 적용 시 전체 AUC에는 큰 변화가 없고, 기존 도구와의 비교의 측면에서 상대적으로 단순한 기존 가중치 법을 유지하였다. KSORAS-MINOR의 총점은 최소 1점에서 최대 14점까지 분포하였으며, 평균은 5.26점 표준편차는 2.69점이었다. 7) 성인보호관찰대상자 재범 위험성 평가도구(KPRAI-R)는 성인 보호관찰 대상자의 분류 평가를 위해 개발된 도구로 8가지 요인, 30가지 문항으로 구성되었으며, 북미의 LSI-R을 모델로 개발되었다.
8) 신규 추가된 문항은 일차적으로 통계적 우선성을 기준으로 하였다. 신규 추가된 세 가지 문항은 이 외에도 아동 성폭력 사범의 특징(8번 대인관계 부적응)과 일반 범죄 위험요인(9번 반사회적 친구관계, 10번 음주 문제)과 연관된 특징을 보이는 문항이다.

<표 7> KSORAS-MINOR 문항 구성표

본 연구의 주요 연구 문제를 검증하기 위해, 아동/청소년 상대 성범죄자만을 상대로 하여 KSORAS-MINOR의 재범 예측 타당도를 기존 KSORAS의 재범 예측타당도와 비교 분석하였다. ROC 분석을 통해서 확인한 KSORAS-MINOR의 재범 예측력은 AUC 기준 0.887로, 기존 KSORAS의 재범 예측력인 0.744보다 대폭 향상되었다. 실제 두 도구의 재범 예측타당도를 통계적으로 비교한 결과 신규 개발 도구의 재범예측력은 기존의 그것을 통계적으로 유의미한 수준에서 향상시켰음을 알 수 있었다(chi2(1)=15.19, p=0.001).

<그림 1> KSORAS-MINOR와 KSORAS 간 재범 예측력 비교

2) 성인 대상 재범 위험성 평가도구 개발
성인 대상 재범 위험성 평가도구의 개발을 위해 KSORAS-MINOR 구성과 같은 동일한 절차가 진행되었다. 다양한 변수의 조합을 통해 아래와 같은 10문항을 성인 대상 성폭력 사범 재범 위험성 평가도구(KSORAS-ADULT)로 구성하였다.⁹⁾ 문항별 분포와 가중치를 재점검한 결과, 4번(범죄경력), 5번(수용 기간)은 문항 구성과 가중치를 재조정하였고, 기타 문항은 단순한 기존 가중치 법을 유지하였다. KSORAS-ADULT의 총점은 최소 3점에서 최대 16점까지 분포하고 있으며, 평균은 9.0점 표준편차는 2.31점의 분포를 가졌다. 9) 신규 문항으로는 가족과의 부정적 관계있음(7번, 8번), 음주 문제 전력 있음 또는 의심됨(9번), 정신과적 증상전력 또는 의심됨(10번)으로 RNR 이론에서 제시하고 있는 통상의 재범위험요인에 포함된 문항을 추가 하였다.

<표 8> KSORAS-ADULT 문항 구성표

본 연구의 주요 연구 문제를 검증하기 위해, 성인 상대 성범죄자만을 상대로 하여, KSORAS-ADULT의 재범 예측 타당도를 기존 KSORAS의 재범 예측 타당도와 비교 분석하였다. KSORAS-ADULT의 재범 예측력은 AUC 기준 0.752로, KSORAS의 예측타당도인 0.643에 비해 대폭 향상된 결과를 보였다. 실제 두 도구의 재범 예측 타당도를 비교한 결과, 신규 개발 도구의 재범 예측력은 기존의 그것을 통계적으로 유의미한 수준으로 향상시켰음을 알 수 있었다(chi2(1)=6.89, p=0.008).

<그림 2> KSORAS-ADULT와 KSORAS 간 재범 예측력 비교

Ⅴ. 결론

본 연구는 성범죄자 유형론적 관점에서 현행 성범죄자 위험성 평가도구의 재범 예측 타당도 분석을 주요 연구 문제로 삼았다. 본 연구의 주요 결과를 요약하면 다음과 같다. 첫째, 현행 KSORAS는 대체로 성범죄자의 재범 위험성을 중간 정도 이상으로 예측하는 것으로 나타났다. 특히 본 연구샘플의 짧은 재범 추적 기간을 고려하면 이 수치는 낮은 수치가 아니다. 다만, 본 연구의 관심의 초점인 성범죄자 유형별 재범 예측력을 검증하였을 때, KSORAS의 재범 예측력은 아동/청소년 상대 성범죄자의 경우에는 비교적 높은 예측력을 보였지만, 성인 상대 성범죄자에게는 상대적으로 낮은 재범 예측력을 보였다. 둘째, KSORAS의 문항별 분석에 있어서도 전체 15개 문항이 아동/청소년 상대 성범죄자 및 성인 상대 성범죄자의 재범에 미치는 영향은 각각 상이했다. 아동/청소년 상대 성범죄자의 재범을 예측함에 있어서는 KSORAS의 많은 문항이 재범을 신뢰롭게 예측했지만, 성인을 상대로 한 성범죄자에 있어서는 사실상 성범죄 전력이라는 하나의 변수만이 통계적으로 유의미한 수준에서 재범을 예측했다. 셋째, 기존 KSORAS 문항을 바탕으로 다른 예비 문항들을 포함하여 각각 아동/청소년 상대 성범죄자와 성인 상대 성범죄자의 재범 예측 도구를 구성한 결과, 기존의 KSORAS를 두 집단에 각각 적용한 예측타당도보다 훨씬 높은 수준의 예측력을 나타냈다. 이러한 결과들은 성범죄자의 재범 위험성 평가에 있어서 범죄자 유형론에 대한 논의가 심도 있게 고려되어야 할 필요성을 제시한다.

본 연구는 재범 위험성 평가에 있어서 범죄자 유형론의 고려가 필요하다는 일반적 결론을 도출했지만, 사실상 성범죄자 유형론을 둘러싼 쟁점은 이보다 훨씬 복잡하다. 본 연구의 주요 발견 사항 중 하나는 아동/청소년 상대 성범죄자와 성인 상대 성범죄자 간의 재범 기제가 상이하다는 사실이다. 선행연구들은 아동 상대 성폭력 사범의 재범위험 요인은 성적 일탈성(sexual criminality)을 중심으로 군집화되고, 성인 상대 성폭력 사범의 경우는 일반 범죄성(general criminality)을 중심으로 특징 지워진다고 주장한다(Doren, 2002; Harris, Mazerolle & Knight, 2009; Whitaker et al., 2008), 그러나 본 연구에서는 아동/청소년 상대 성범죄자의 경우 오히려 통상의 일반 범죄성을 상징하는 변수들(예: 폭력 범죄 전력, 감독 기간 중 문제행동, 수용 기간)이 재범 위험성을 더 잘 예측하는 반면, 성인 상대 성범죄자의 경우에는 이러한 변수보다는 성적 일탈성을 상징하는 ‘성범죄 전력’의 영향력이 가장 강했다. 물론 이러한 발견 사항은 아동/청소년 상대 성범죄자와 성인 대상 성범죄자라는 단순한 이분형적 분류가 추가 분화할 수 있다는 가능성을 시사하는 것일 수도 있고, 전자발찌를 부착할 정도로 재범 위험성이 상습화된 고위험 성범죄자의 또 다른 특성일 수도 있다. 후속 연구는 이러한 성범죄자 유형별 특징에 대해서도 지속적 관심을 기울일 필요가 있다.
본 연구의 핵심 관심사는 아니지만, KSORAS 일부 문항에 대한 조정은 KSORAS의 예측타당도를 향상시킬 수 있을 것으로 보인다. 전술된 바와 같이, ‘피해자와의 관계’를 측정하는 9번 문항은 단순 로짓분석 수준에서도 재범 행동을 예측하지 못하고 있다. 외국의 도구들(예: STATIC-99, MnSOST-R)이 ‘낯선 피해자’에만 1점에서 3점까지의 점수들을 부과함에 반해, KSORAS는 본 문항에 ‘낯선 피해자’외 ‘친족 피해자’를 포함하여 모두 1점을 부과하고 있다. 서구의 선행연구들은 대체로 가족 구성원이 성범죄의 피해자가 되는 경우, 재범 위험성이 낮은 것으로 보고(Rice & Harris, 2002)하고 있다는 점을 고려하여, 해당 문항을 ‘낯선 피해자’만 측정하는 문항으로 변경하는 경우 재범 예측력은 향상될 것이다. 이 외에도 가해자 연령대의 절단점 조정, 성범죄 전과 횟수 측정 방법 세분화, 피해자 나이 문항과 피해자 장애인 여부의 분리, 현저한 폭력 사용의 측정과 관련된 이슈들에 대한 추가 검토 역시 필요해 보인다.
본 연구는 성범죄자 평가, 치료 및 관리와 관련하여서도 강력한 실천적 함의를 제시한다. 향후 성범죄자에 대한 판결 전 조사, 청구 전 조사에는 현행 KSORAS 외에 아동/청소년 상대 성범죄자 재범 위험성 평가도구 및 성인 상대 성범죄자 재범 위험성 평가도구를 추가 사용할 것을 제안한다. 학계에서의 재범 위험성 평가도구에 관한 논의도 조금 더 심도 깊이 진행될 필요가 있다. 많은 경우 데이터의 제한으로 인한 문제이지만, 재범 위험성 평가를 둘러싼 학계의 논의는 피상적이다. 과연 재범 위험성은 어느 정도까지 증명되어야 형기를 종료한 국민의 자유를 추가 제한하는 보안처분이 정당화될 수 있는 것일까? 개별도구의 예측타당도는 검증되고 있는 것일까? 재범 위험성 평가도구의 절단점은 통계적으로 의미가 있는가? 재범 위험성 평가결과는 어떻게 형사사법 실무자들에게 의사소통되어야 하는가? 재범 위험성 평가도구가 두 개 이상 병행 사용될 때 불일치된 결과는 어떻게 결정되어야 하는가? 본 연구는 이런 다양한 질문 중 하나에 대한 답변이다. 향후 조금 더 심도 있는 후속 연구가 계속되기를 기대해 본다.

참고문헌

■ 국내문헌
고선영 · 김경옥 · 정연대 · 최대호, (2010), ‘범죄현장 행동에 근거한 연쇄 강간범죄자의 유형 분류’, 한국심리학회지: 법 제1권 제3호, pp.171-183.
김양곤 · 이수정 · 이민식, (2005), ‘소년보호관찰대상자에 대한 분류평가도구 개발에 관한 연구’, 형사정책연구원.
김지선·장다혜·김정명·김성언·한영수·강호성·박상옥, (2013), ‘성폭력범죄자 사후관리시스템에 대한 평가연구(II): 전자감독제도에 관한 평가연구’, 형사정책연구원.
김지선 · 김영중 · 최지선 · 성유리 · 고기원, (2021), ‘중형주의 형사제재의 실효성 평가연구(Ⅱ): 전자감독제도의 실효성 평가연구’, 형사정책연구원.
김지선 · 박지선 · 최수형, (2009), ‘청소년 대상 성범죄자 유형분류와 프로파일링’, 보건복지부.
김혜정, (2010), ‘성폭력범죄에 대한 법적 통제 현황과 개선방안’, 보호관찰 제10권 제2호, pp.7-38.
박지선, (2011), ‘Sex Offender Risk Assessment: Current Limitations and Future Directions’, 한국범죄학 제5권 제1호, pp.275-296.
이수정 · 고려진 · 박혜란, (2008), ‘한국 성범죄자 위험성 평가도구 개발 및 타당도 연구’. 형사정책연구 제19권 제4호, pp.309-345.
이수정 · 고려진 · 최혜림, (2010), ‘재범추적을 통한 한국성범죄자위험성평가척도(KSORAS) 타당도 연구’, 한국심리학회지 제29권 제4호, pp. 999-1016.
이수정 · 윤옥경, (2003), ‘범죄위험성의 평가와 활용방안’, 한국심리학회지 제22권 제2호, pp.99-126.
이수정 · 장은영 · 강지은 · 노주애 · 이경화 · 정지은 · 조경은 · 홍정윤 · 이승원 · 박경선 · 서혜란 · 서혜정 · 차유나, (2020), ‘한국 성범죄자 재범위험성 평가척도(KSORAS) 개정연구’, 법무부.
서종한 · 김경일, (2011), ‘성범죄자 군집유형분석과 프로파일링 연구’. 한국심리학회지: 사회 및 성격 제25권 제1호, pp.155-172.
장은영 · 이수정, (2017), ‘성범죄자 하위유형 분류 및 차별화된 처우방안 제안’. 한국범죄학 제11권 제1호, pp.79-111.
최인섭 · 진수명, (2002), ‘보호관찰대상자의 재범예측에 관한 연구’. 한국형사정책연구원.

■ 외국문헌
Andrews, D. A. & Bonta, J. (2010). The psychology of criminal conduct. Newark, NJ: Lexis Nexis.
Barbaree, H. E., Seto, M. C., Serin, R. C. Amos, N. L. & Preston, D. L. (1994). Comparisons between sexual and nonsexual rapist subtypes : Sexual arousal to rape, offense precursors, and offense characteristics. Criminal Justice and Behavior, 21, pp.95-114.
Bartosh, D. L., Garby, T., Lewis, D. & Gray, S. (2003). Differences in the predictive validity of actuarial risk assessments in relation to sex offender type. International Journal of Offender Therapy and Comparative Criminology, 47, pp.422-438.
Cohen, J. (1992). Quantitative methods in psychology: A power primer. In Psychological bulletin.
Doren, D. M. (2002). Evaluating sex offenders: A manual for civil commitments and beyond. Sage Publications.
Groth, A. N. & Birnbaum, H. J. (1978). Men who rape: The psychology of the offender. Springer.
Groth, A. N., Burgess, A. W. & Holmstrom. L. (1977). Rape, power, anger and sexuality. American Journal of Psychiatry, 134, pp.1239-1248.
Hanson, R. K. & Morton-Bourgon, K. E. (2009). The accuracy of recidivism risk assessments for sexual offenders: A meta-analysis of 118 prediction studies. Psychological Assessment, 21, pp.1-21.
Hanson, R. K. & Bourgon, G. (2017). Advancing sexual offender risk assessment: Standardized risk levels based on psychologically meaningful offender characteristics. In Handbook on Risk and Need Assessment (pp. 260-284). Routledge.
Harris, D. A., Mazerolle, P. & Knight, R. A. (2009). Understanding male sexual offending: A comparison of general and specialist theories. Criminal Justice and Behavior, 36(10), pp.1051-1069.
Harris, G. T., Rice, M. E., Quinsey, V. L., Lalumiere, M. L., Boer, D. & Lang, C. (2003). A multisite comparison of actuarial risk instruments for sex offenders. Psychological Assessment, 15, pp.413-425.
Helmus, L. M. & Babchishin, K. M. (2017). Primer on risk assessment and the statistics used to evaluate its accuracy. Criminal Justice and Behavior, 44(1), pp.8-25.
Knight, R. A. & Prentky, R. A. (1990). Classifying sexual offenders: The development and corroboration of taxonomic models. In W. L. Marshall, D. R. Laws & H. E. Barbaree (Eds.), The handbook of sexual assault: Issues, theories, and treatment of the offender (pp. 27-52). New York: Plenum.
Knight, R. A., Warren, J. I., Reboussin, R. & Soley, B. J. (1998). Predicting rapist type from crime-scene variables. Criminal Justice and Behavior, 25, pp.46-80
Prentky, R. A., Lee, A. F. S., Knight, R. A. & Cerce, D. D. (1997). Recidivism rates among child molesters and rapists: A methodological analysis. Law and Human Behavior, 21, pp.635-659.
Prentky, R. A., Janus, E., Barbaree, H., Schwartz, B. K. & Kafka, M. P. (2006). Sexually violent predators in the courtroom : Science on Trial. Psychology, Public Policy, and Law, 12(4), pp.357-393.
Rice, M. E. & Harris, G. T. (2005). Comparing effect sizes in follow-up studies: ROC Area, Cohen’s d, and r. Law and human behavior, 29(5), pp.615-620.
Terry, K. J. (2006). Sexual offenses and offenders: Theory. Practice, and Policy. Thompson.
Thornton, D. & D’Orazio, D. M. (2016). Advancing the evolution of sexual offender risk assessment: The relevance of psychological risk factors. The Wiley handbook on the theories, assessment and treatment of sexual offending, pp.667-693.
Whitaker, D. J., Le, B., Hanson, R. K., Baker, C. K., McMahon, P. M., Ryan, G. & Klein, A. (2008). Risk factors for the perpetration of child sexual abuse: A review and meta-analysis. Child abuse & neglect, 32(5), pp.529-548.