메뉴 건너띄기
상단메뉴 바로가기 본문 바로가기

소마사람들

BWAI팀 - 딥 러닝 기반 비속어 제재 시스템

  • 2020-11-09 23:54
  • SW마에스트로


Q. 간단한 팀 소개와 자기소개 부탁드립니다.

이현배 : BWAI 팀의 팀장 이현배이고, 웹 프론트앤드 개발을 맡고 있습니다. BWAI(비와이)는 ‘Bad Word AI’의 약자로 비속어를 AI를 통해 막는 프로젝트입니다.

서정민 : 저는 백엔드 서버 개발을 담당하고 있습니다.

한석현 : 저는 딥러닝 개발을 맡고 있습니다.

Q. 프로젝트에 대한 아이디어는 어디서 얻으셨나요?

이현배 : 저희가 프로젝트를 시작할 당시 웹에서 욕설이나 비속어와 같은 것 때문에 상처를 받고, 안 좋은 사건이 계속해서 일어났습니다. 그래서 저희는 웹에서 일어나는 이러한 불건전한 사건을 막고자 조사를 진행했습니다. 그러던 중 기존에 욕설을 막는 시스템(금칙어 시스템)에 많은 문제가 있는 것을 확인할 수 있었고 저희는 이를 AI를 통해 해결하고자 BWAI 프로젝트를 구상하게 되었습니다.

Q. 금칙어 시스템은 어떤 문제가 있었나요? BWAI가 기존의 욕설 방지 시스템과 가지는 차이점이 무엇인가요?

서정민 쉽게 말해서 “아저씨 발 냄새 나요”라는 글을 금칙어 시스템은 (띄어쓰기를 제대로 인식하지 않고) 중간에 비속어가 들어갔다고 인지하는 문제점이 있었습니다. 저희 프로젝트는 AI를 활용해 문장의 의미를 확인하고, 이를 구분할 수 있습니다.

또 ‘음식물 쓰레기, 일반 쓰레기’와 ‘너는 쓰레기야’처럼 같은 단어여도 욕설로 사용되지 않은 경우와 욕설로 사용된 경우를 구분하고자 딥러닝을 도입했습니다.

Q. 프로젝트 진행은 어느 정도 되었나요? 프로젝트를 진행하는 중 어려운 점은 없으신가요?

이현배 : 프론트엔드가 80%, 백엔드가 80% 완성되었다면 딥러닝은 50~60%정도 완성된 것 같습니다. (각자 포지션에 맞춰 일을 세분화해 두었는데) 마지막에 가서 이것저것 합치려면 너무 오래 걸릴 수 있어서, 가장 기본적인 프로토타입을 먼저 제작해놓고, 기존에 목표한 수준으로 발전시키고 있습니다.

한석현 : 아무래도 코로나19로 인해서 오프라인에서 주기적으로 만날 수 있었으면 채찍질이 되었을 것 같은데, 그렇지 못하다 보니 느슨해지는 것이 있었습니다. 그래도 기존에 목표했던 지점까지 도달하기 위해 나아가고, 노력하고 있습니다. 아직 개발하다가 막히거나 ‘더는 어떻게 개선해야 할지 모르겠다’라고 느낀 적이 없고, 목표했던 길에서 막히지 않아서 계속 개발을 진행하고 있습니다.

한 가지 문제가 있었다면 프로젝트를 위해 욕설 데이터를 수집하고 라벨링을 해야 하는데, 네이버 등 일반 웹사이트를 이용하기 힘들었습니다. 일반 웹사이트에선 클린봇이 이미 욕설 댓글을 지우거나 사용자의 신고로 없어지는 등 조치가 이뤄졌기 때문입니다. 그래서 일베, 디씨인사이트 등의 커뮤니티를 이용했는데, 여기서 크롤링을 하고 라벨링을 하다 보니 정신이 피폐해지는 듯한 느낌을 받았습니다. 욕설도 욕이지만 플랫폼의 특성상 느껴지는 것들도 있고, 무슨 단어인지 의미를 모르겠는데, 프로젝트 데이터를 위해 이를 검색하다 보면 충격을 받을 때가 있었습니다.

Q. 개발 중인 시스템의 이름은 무엇인가요? 완성이 된다면 어떤 형태로 제공하게되나요?

이현배 : 서비스 이름도 BWAI이고, API의 형태로 제공됩니다. 기존의 게임이나 커뮤니티들에서 채팅이나 게시물이 올라오는데, 이런 것들을 저희한테 네트워크 상으로 요청하면 여기에 ‘욕설이 있다/없다’, 욕설이 있으면 ‘어떤 부분이 확률적으로 욕설일 가능성이 높다’를 분석을 해서 결과를 알려주면, 기존의 커뮤니티 서비스 개발자들이 비속어에 대한 조치를 쉽게 할 수 있습니다.



Q. 프로젝트의 최종 목표는 어떻게 진행되나요

한석현 : 우선 저희 시스템은 어떠한 문장에서 욕이 있는지 없는지를 먼저 파악하고, 욕이 있다면 어떤 것이 욕설인지를 찾아내서 마스킹하는 수준을 목표하고 있습니다. 비속어뿐만 아니라 문맥상에서 욕설로 사용되는 것까지 잡아내는 것을 목표로 노력하고 있습니다.

Q. SW마에스트로 연수 과정을 하면서 느낀 좋은점과 아쉬운점은 무엇인가요?

이현배 : SW마에스트로의 지원을 바탕으로 평소에 하기 힘들었던 시도를 해볼 수 있다는 점이 가장 좋았습니다. 저는 웹 프론트앤드 개발을 맡고 있는데, 이를 위해 웹 디자인이나 UI적인 지식이 필요하지만, 개발자가 이를 모두 갖추긴 어려웠습니다. 그래서 전문가와 협업하며 이러한 부분을 채울 수도 있고, 전문가의 작업과 기존에 내가 진행한 작업을 비교하며 자신을 성찰할 수도 있었습니다.

서정민 : 코로나 때문인지 멘토링을 필요한 시기에 신청해서 받는 것이 아니라, 정해진 시기 안에 몇 회 이상 멘토링을 해야 한다는 제약이 있다 보니, 프로젝트 관련 문제나 궁금한 점이 발생하지 않았던 시기에는 멘토님과 프로젝트에 대한 이야기보단 프로젝트 외의 이야기를 나누게 되었던 점이 아쉬웠습니다. 물론 이때에도 평소에 들어볼 수 없는 내용들을 들을 수 있어서 좋았지만, 아무래도 프로젝트 외의 이야기다 보니 아쉬움이 있습니다.

한석현 : SW마에스트로에서 프로젝트를 진행하며 전문가와 일해볼 수 있고, 전문적인 장비를 사용해볼 기회를 얻어서 좋았습니다. (딥러닝 개발을 위해 전문적인 장비가 필요한데) SW마에스트로를 통해 고가의 장비를 부담 없이 활용하며 개발을 할 수 있었습니다. 또 SW마에스트로에 대한 자부심도 가질 수 있었습니다.

Q. SW마에스트로는 어떻게 알고 참여하게 되었나요?

이현배 : SW마에스트로는 고등학교 때부터 알고 있었는데, 그전에는 시기가 안 맞아서 참여하지 못해다가 이번에 기회가 되어 참여하게 되었습니다.

서정민 : SW마에스트로를 하기 전에는 전공 관련 공모전에 참여하는 등 평범하게 지냈었는데, 친구 따라서 연수 과정을 지원했다가 좋은 기회로 참여하게 되었습니다.

한석현 : 이전에 친구 중에 좀 잘하는 애들이 SW마에스트로를 참여했다더라~ 정도는 들었었지만, 연수 과정에 대해서 잊고 지냈습니다. 그러던 중 백준 사이트에 알고리즘을 풀러 들어갔다가 광고를 보고 지원했습니다.

Q. 프로젝트 이후 목표나 개인의 인생 목표가 있다면 무엇인가요?

이현배 : 저는 웹 프론트앤드 개발자인데, 회사에 들어가면 디자이너와 함께 기획하고 개발하게 됩니다. 하지만 학생 때에는 실제 디자이너와 이러한 기회를 얻기 어려웠는데, SW마에스트로를 통해 이러한 기회도 얻고, 실력과 경험을 함께 늘릴 수 있다고 생각합니다. 또 서로 다른 분야의 3인이 모여서 서로 모르는 부분에 대해서 물어보고, 답하며 (다른 분야에 대해서도) 알 수 있어서 좋은 것 같습니다. 언젠가 올 좋은 기회를 기다리며 그때를 위해 계속 열심히 할 생각입니다.

서정민 : 멘토분들도 물론이고, 팀원들도 현업에서 일하는 인재들인데, SW마에스트로를 통해 현업에서 일하는 인적 네트워크를 얻을 수 있는 것이 저에게 많은 도움이 될 것이라고 기대하고 있습니다.

한석현 : 저는 이전에는 딥러닝 개발을 연구 위주로 해오다가, 이번에 SW마에스트로 연수과정을 통해 서비스를 처음 제작해보게 되었습니다. 서비스를 개발하는 과정이 저에게 많은 도움이 될 것이라고 생각합니다. 또 지금 프로젝트를 개발하는 데에 최근에 주목받는 딥러닝 모델을 사용하고 있는데, 회사에서 해당 모델을 사용해보거나 해당 모델로 서비스를 개발한 경우 우대해주는 경우를 많이 봤습니다. 이런 측면에서 저에게 경험이 되고, 도움이 될 것이라고 생각합니다.

첨부파일 (1)