데이터 상품 목록

No 상품명 상품설명
1 학술 연관어 사전 ㅇ 학술문헌에 등장한 한글 240만, 영어 820만, 한자 11만건 어휘의 연관어 데이터.
ㅇ 연구재단의 학술분류별 고빈도 어휘를 제시
2 법률 연관어 사전 ㅇ 학술문헌 및 판례의 주요 어휘 한글 42만, 영어 8만건의 연관어 데이터
ㅇ 2009헌마170와 같은 사건번호도 포함
3 정보통신 연관어 사전 ㅇ 전기전자공학, 전자/정보통신공학, 컴퓨터공학 분야의 문헌에 등장한 한글 6만, 영어 16만건 어휘의 연관어 데이터
4 경제/경영 연관어 사전 ㅇ 경영학, 경제학, 회계학, 무역학 분야의 문헌에 등장한 한글 9만, 영어 12만의 어휘의 연관어 데이터
5 의약학 연관어 사전 ㅇ 내과학, 외과학, 산부과학, 면역학, 병리학, 약학 등 의약학 문헌에 등장한 한글 10만, 영어 18만건 어휘와 연관어 데이터
6 중국 연관어 사전 ㅇ 중국 문헌에 등장한 「중국 어휘와 영어 어휘의 빈도수」와 「영어-한국어 사전」을 분석하여 제작된 영어-중국어, 중국어-한국어 대역어 및 관련어 데이터
ㅇ 중국어 28만건, 영어 36만건, 한국어 18만건의 동의어 데이터로 구성
7 뉴스 연관어 사전 ㅇ 2017~2018년 언론기사에 등장한 주요 어휘 23만건과 연관어 데이터
ㅇ 늘공, 꿀알바, 닥공, 미투, 스몸비,쌍궤병행, 어공, 연명의료 등 신조어 조회 가능
8 한의학 연관어 사전 ㅇ 한의학 고전에 등장한 한의학 어휘 10만건과 한글어휘 10만건의 연관어 데이터
ㅇ 한자용어를 중심으로 구성하여 한글로 한의학 용어 조회 가능
- 예컨대 복통을 통해 ‘腹痛’을 조회 또는, 나팔꽃씨를 통해 ‘牽牛子’ 조회
9 북한 연관어 사전 ㅇ 북한의 문헌에 등장한 30만건의 주요 어휘의 연관어 데이터
ㅇ 북한용어와 우리나라 용어의 대조표 10만건 포함
- 러시아, 컴퓨터 같은 어휘의 북한어가 로씨야, 콤퓨터 라는 것을 확인 가능
10 연상어 사전 ㅇ 5,000개의 주제어에 대해 연상되는 어휘 12만건을 분류한 데이터
ㅇ 대분류와 중분류 주제는 「Roget, Thesaurus of English Words and Phrases」 참조
11 다국어 언어자원 ㅇ 한글 500만, 영어 1,300만, 한자 300만, 중국어 500만 어휘의 식별 데이터
ㅇ 실제 문헌에 출현했던 어휘로서 데이터마이닝, 텍스트마이닝에 활용 가능
12 토픽 동의어 DB ㅇ 10만 건 이상의 어휘에 대한 동의어 데이터(유의어, 이칭, 북한어 등 포함)
ㅇ 국어사전과 각종 사전을 참조하여 제작된 데이터
13 토픽 영어대역어DB ㅇ 한국어 320,000 건과 영어 310,000 건의 어휘를 대역어로 매핑시킨 사전
ㅇ 한국어를 앞에 놓으면 한-영 대역어, 영어를 앞에 놓으면 영-한 대역어
14 토픽 카테고리DB ㅇ 30만 건 이상의 어휘를 5가지 카테고리 1,000개 분류코드로 분류한 데이터
ㅇ 법률/행정분류, IPC분류, 정보통신분류, 생물분류, 문화유산분류
15 토픽 관련어DB ㅇ 45만 건 이상의 어휘에 대한 관련어 데이터로서, 관련어, 상위어, 하위어 포함
ㅇ 국어사전 및 각종 사전의 설명 및 인터넷 정보를 참조
16 K2R 연관검색어DB ㅇ 2,000만건의 어휘에 대한 연관어 1억2천만건을 수록한 데이터
ㅇ 1,000만건의 학술논문 키워드로부터 자체 알고리즘으로 연관어 데이터를 추출
17 K2R 복합명사-한국어편 ㅇ 어떤 단순명사에 대해 어떤 복합명사가 있는지 조회할 수 있는 데이터
ㅇ 40만건의 한글 단순명사에 대해 150만건의 한글 복합명사를 조회
18 K2R 복합명사-영어편 ㅇ 어떤 단순명사에 대해 어떤 복합명사가 있는지 조회할 수 있는 데이터
ㅇ 35만건의 영어 단순명사에 대해 280만건의 영어 복합명사를 조회