스마일게이트 AI센터, 악플·혐오 발언 데이터셋 공개

[빅데이터뉴스 심준보 기자] 스마일게이트 AI센터(센터장 한우진)는 악플 및 혐오 발언 데이터셋을 공개한다고 20일 밝혔다.

스마일게이트 AI 센터는 최근 혐오 표현이 온라인 공간에서 광범위하게 증가하고 있고, 사회적 문제로 이어질 수 있다는 점을 고려해 혐오 표현을 선제적으로 감지하고 대응할 수 있도록 악플 및 혐오 발언 데이터셋을 구축했다.

악플 및 혐오 발언 데이터는 지난 2019년 1월 1일부터 2021년 7월 1일까지 기간 동안 포털 사이트, 커뮤니티 등 다양한 웹사이트의 게시글을 대상으로 수집했다.

수집 과정에서 혐오 관련 데이터의 시의성과 편향성을 띄고 있는 특성을 감안했으며, 약 55만 여 개의 데이터를 기반으로 1만 개의 데이터셋을 구축했다.

특히 데이터셋 구축 과정에서 ‘여성/가족’ ‘성소수자’ ‘남성’ ‘인종/국적’ ‘연령’ ‘지역’ ‘종교’ ‘기타혐오’ 등 8개의 대상으로 범주화 했다.

이번에 수집된 데이터는 스마일게이트 AI 센터 깃허브 페이지(링크)를 통해 1월 중 공개 될 예정이다.

심준보 빅데이터뉴스 기자 news@thebigdata.co.kr

심준보 기자의 다른 기사 보러 가기

스마일게이트 AI센터, 악플·혐오 발언 데이터셋 공개

헤드라인뉴스

재계뉴스

빅데이터 라이프

칼럼·인사동정

기업집단 빅데이터