본문 바로가기

프로젝트/Project1

Toy Project 1 (1) - 약관 분류기 만들기

약관 요약 및 위험도 분류기 만들기

 

 

 

문제점

 

우리는 수많은 인터넷 서비스를 이용한다. SNS, 게임, 온라인 쇼핑 등의 서비스에서 사용자들은 이용 약관에 동의하고 서비스를 이용한다. 이용 약관에는 마케팅 수신 동의, 개인 정보 이용 동의 등 나의 개인 정보가 다른 서비스에 이용되거나 원하지 않는 곳에 사용되기도 하기 때문에 주의할 필요가 있다. 하지만 현대인들은 하루에 방대한 양의 콘텐츠를 소비하기 때문에 약관을 읽는데 큰 피로감을 느낀다. 인터넷 커뮤니티에는 3줄 요약을 요구하는 유저들도 많이 볼 수 있다. 따라서 약관의 내용을 사용자들이 쉽게 알아볼 수 있도록 요약해주고 위험도를 분류해 주는 프로그램을 만들어 볼 것이다.

 

요즘의 약관은 웬만한 책 한 권 분량인데 이 약관을 다 읽는 사람도 없거니와, 읽으려고 해도 굉장히 읽기 불편하게 되어있다. 이는 결국 약관 작성자가 유리하게 될 수밖에 없는 구조인 것이다. 즉, 길고 딱딱하지만 어떤 내용인지 읽어두지 않으면 손해 봐도 할 말 없는 물건이라고 할 수 있다. 특히 부동산 거래, 금융 거래, 보험 등의 약관을 제대로 이해하지 못하면 큰 피해를 입을 수 있다.

 

약관 - 나무위키 (namu.wiki)

 

“인터넷 사이트들 회원가입 약관 한번 읽는데만 80분, 길고 어렵다” - 경향신문 (khan.co.kr)

 

 

 

 

용어, 현황

 

 

약관:

 

계약의 한쪽 당사자가 여러 명의 상대방과 계약을 체결하기 위하여 일정한 형식으로 미리 마련한 계약의 내용을 말한다. 다수인을 상대로 동종의 거래를 반복하는 경우에 그 거래를 위하여 미리 작성해 놓은 정형적인 계약조건, 문서화된 약속이다.

 

 

 

 

 

 

 

약관에 대한 법, 규제 현황:

 

제1조(목적) 이 법은 사업자가 그 거래상의 지위를 남용하여 불공정한 내용의 약관을 작성하여 거래에 사용하는 것을 방지하고 불공정한 내용의 약관을 규제함으로써 건전한 거래질서를 확립하고, 이를 통하여 소비자를 보호하고 국민생활을 균형 있게 향상하는 것을 목적으로 한다.

 

제30조(적용 범위)
특정한 거래 분야의 약관에 대하여 다른 법률에 특별한 규정이 있는 경우를 제외하고는 이 법에 따른다. 상법, 근로기준법에 속하는 계약은 제외한다.

 

예를 들어 부동산 가격 등의 특정 재화에 대한 조항은 약관이 아니다. 모든 계약이나 조항이 약관법에 속하는 것은 아니며, 공정위에서 모든 약관을 관리하지 않는다.

 

 

 

 

 

 

약관 규제에 대한 법률:

약관법 - 공정거래위원회 (ftc.go.kr)

 

개인 정보 처리, 보호:

namu.wiki/w/%EA%B0%9C%EC%9D%B8%EC%A0%95%EB%B3%B4%20%EB%B3%B4%ED%98%B8%EB%B2%95#s-5

 

디지털 콘텐츠 이용 표준 약관:

www.law.go.kr/행정규칙/디지털콘텐츠%20이용%20표준약관

 

 

 

 

이용 현황, 사례:

 

공정거래위원회에서는 약관심사지침을 가지고 불공정 약관을 방지한다. 이 심사 지침은 사례를 예시하고 추상적 판단이 포함되어 있어 구체적인 상황에 따라 법원의 판결은 다를 수 있다. 일반적으로 약관이 어떻게 심사되는지 알 수 있다.

국가법령정보센터 | 행정규칙 > 본문 (law.go.kr)

주요상담사례(Q&A) - 공정거래위원회 (ftc.go.kr)

 

 

 

 

 

 

데이터

 

 

공기관에서 사용하고 있는 약관, 사기업에서 사용하고 있는 약관, 금융 관련 약관, 온라인 거래 관련 약관, 서비스 사용 동의 약관, 개인 정보 처리에 대한 약관 등의 데이터를 활용할 수 있다. 이 프로젝트에서 주로 다룰 데이터는 온라인 쇼핑, 서비스 사용 동의 관련 약관, 회원가입 약관, 개인 정보 처리에 대한 약관이다. 약관 규제에 관한 법률 제3조에서는 약관을 소비자가 이해하기 쉬운 한국어로 작성하는 것으로 정했기 때문에 한국어 데이터를 사용한다.

 

일반 약관 데이터:

 

www.data.go.kr/tcs/dss/selectDataSetList.do?dType=FILE&keyword=약관&detailKeyword=&publicDataPk=&recmSe=N&detailText=&relatedKeyword=&commaNotInData=&commaAndData=&commaOrData=&must_not=&tabId=&dataSetCoreTf=&coreDataNm=&sort=&relRadio=&orgFullName=&orgFilter=&org=&orgSearch=&currentPage=1&perPage=10&brm=&instt=&svcType=&kwrdArray=&extsn=&coreDataNmArray=&pblonsipScopeCode=

 

data.seoul.go.kr/dataList/OA-2256/S/1/datasetView.do

 

불공정 약관에 대한 데이터

 

www.ftc.go.kr/www/cop/bbs/selectBoardList.do?key=127&bbsId=BBSMSTR_000000002351&bbsTyCode=BBST04

 

www.ftc.go.kr/www/ReportUserList.do?key=125&tribu_type_cd_S=100

알고리즘

RNN을 사용할 예정

 

 

프로젝트 진행 계획

 

이 프로젝트의 결과물은 두 가지 기능을 제공한다.

1. 사용자가 입력한 약관을 요약

2. 약관의 위험도 or 신뢰도를 표시

 

이를 위해서 2개의 데이터 셋을 만든다.

1. 모든 약관들을 카테고리로 분류한 데이터 셋 (가능한 모든 약관 데이터)

2. 공정위에서 공개한 시정된 약관들이 모여있는 데이터 셋 (정보가 제한적, 시정된 이유도 포함, 시정된 이유는 왜 위험한지 설명하기 위함)

 

프로그램 순서:

1. 사용자가 약관을 입력한다.

2. 입력된 약관을 비슷한 내용끼리 묶고 그룹화한다. (여기서 중요한 내용들로 압축할 수도 있음)

3. 그룹화된 약관들을 1번 데이터 셋과 비교하여 비슷한 카테고리를 찾는다. (요약)

4. 그룹화된 약관들을 2번 데이터 셋과 비교하여 위험 요소를 찾는다. (경고)

 

 

프로젝트를 진행하면서 기능 상세를 추가할 예정