|
욕설은 유저들이 게임 내에서 겪는 가장 불쾌한 경험 중 하나다.
첫 번째는 우회가 쉽다는 점이다. 중간에 다른 문자를 섞어 욕설을 할 수 있기 때문이다. 두 번째 문제는 잦은 오탐이다. 금칙어로 욕설을 판별하다다 보니 일반적으로 사용하는 단어와 비속어를 구분하는데 한계가 존재한다.
마지막은 비속어와 공격적인 표현을 구분하기 어렵다는 점이다. 공격적이지 않은 자연스러운 비속어가 제재되는가 하면, 반대로 비속어를 사용하지 않고 공격적인 표현을 사용할 경우 제재하지 못하는 상황이 발생한다.
|
딥러닝 기반 욕설 탐지 기술은 '데이터', '모델링', '해석'의 3가지 과정을 거쳐 개발됐다. 이 작업은 고도화를 거쳐 반복적으로 작용한다.
데이터는 '안녕하세요', '즐겜하세요'는 '정상', '게임 ㅈ같이 하네'는 '욕설' 같이 태그를 다는 방식이며, 모델링은 CNN(Convolutional Neural Network)을 활용했다. 특히, 욕설을 자음과 모음으로 분류하고 이를 쉽게 분류하기 위해 숫자로 변환했다. 해석은 LIME이라는 알고리즘을 사용했다. LIME은 텍스트에서 글자를 번갈아 빼면서 욕설을 판단하는 방식을 빠르고 효율적으로 진행할 수 있게 도움을 준다.
딥 러닝 기반의 욕설 탐지 기술은 넥슨의 슈팅게임 '서든어택'에 시범적으로 적용됐다. 조 연구원은 "1분 당 모니터링 건수를 비교한 결과 기존 프로세스가 1분당 23건의 신고를 확인했는데, 딥 러닝 기반의 욕설 탐지기를 사용했을 때 35건을 확인했다. 또한 기존 프로세스는 23건 중 41%가 제재 대상이었던 반면, 딥 러닝 기반 프로세스의 경우 36건 중 96%가 제재 대상에 포함됐다."라며 딥 러닝 기반의 욕설 탐지 기술의 효용성을 설명했다.
마지막으로 "인공지능이 사람을 완벽히 대체하기는 어렵다. 한 건이라도 무고한 유저가 처벌을 받는 일이 없어야 하기 때문이다. 대신 인공지능은 아이언맨의 '자비스' 같은 역할을 할 수 있다. 인간을 도와 업무를 편리하고 효율적으로 할 수 있게 만드는 가치를 발휘한다."며 딥 러닝 기반 욕설 탐지 기술의 필요성을 강조했다.
게임인사이트 김동준 기자 kimdj@gameinsight.co.kr