K2R: 시소러스 교차검색 API

1. K2R(케이투알)서비스 개요

k2r한국어를 입력하면 의미, 동의어, 관련어, 영어, 일본어 어휘를 제시합니다.
영어를 입력하면 한국어와 일본어 어휘를 제시합니다.
일본어를 입력하면 한국어와 영어 어휘를 제시합니다.

storytelling2

  • 사용자의 검색의도를 파악하여 적합한 검색어 제공을 통해 이용자가 더 편리하게 정보탐색을 할 수 있도록 지원하는 서비스
  • 연관검색어 500만건 이상, 영어 교차검색어 50만건 이상, 일본어 교차검색어 20만건 이상 제공

2. 사례

  • 네이버의 연관검색어, ERIC(교육정보 온라인 도서관) 검색결과의 Descriptor 서비스, EBSCO Host의 Thesaurus Search, Primo Central의 주제별 Facet 등 포털과 해외 유명 온라인 서비스에서 적용되고 있습니다.

3. 특징

  1. 500만 건 이상의 연관검색어(동의어, 관련어, 이칭 포함), 60만 건 이상의 다국어(한국어, 영어, 일본어 : 12만 건의 학술용어 포함) 등 국내 최대 규모입니다.
  2. 각 연관어에 대해 속성이 부여되어 있으므로 목적에 맞게 서비스의 커스터마이징이 가능합니다.
  3. 매년 10만 건 이상의 안정적인 업데이트(학술용어 중심)
  4. API로 제공되므로 저렴한 비용으로 이용 가능 및 유지보수 비용 절감

4. 장점

이지메타의 API를 이용하면 다음과 같은 서비스 제작이 가능합니다.

  1. 정보의 실시간 제공으로 추가 관리 불필요 – 제공하는 정보는 현재 이지메타에서 구축한 연관검색어 db와 동일하며, 실시간 연계되어 제공되기 때문에 추가적인 관리 및 정보의 갱신 등이 불필요합니다.
  2. 검색어에 대한 다양한 정보제공 – 어휘의 한자, 영어, 일본어, 동의어, 관련어 등이 제공되기 때문에 자신만의 서비스를 구축할 수 있습니다.
  3. 이지메타 세만틱 아카이브의 연계 서비스 제공(예정)

5. 세부내용

  1. 의미상 연관어 – 검색어의 동의어, 유의어, 이형어, 저서, 이칭, 관련어, 하위어를 제공합니다.
    “유성룡”을 검색하면 강복성, 권극례, 권문해 등의  관련인물 뿐만 아니라 서애, 문충 등의 시호, 징비록 같은 저서명을 연관검색어로 제공합니다.
    “잡음모델”을 검색하면 지수잡음, 가우시안잡음, 임펄스잡음, 균일잡음 등의 하위어를 연관검색어로 제공합니다.
  2. 복합명사 연관어 – 연관어의 어휘성격까지 제공합니다.
    “관절염”을 검색하면 결핵성관절염, 골관절염, 류마티스관절염, 다발성관절염 등의 연관어를 제공하며, 이 연관어들은 ‘병명’이란 것을 알 수 있습니다.
    “스위치”를 검색하면 공간스위치, LAN스위치, 광전스위치 등 정보통신용어와 구분스위치, 광스위치 등  IPC 용어들을 연관검색어로 제공합니다.
  3. 동일분류 어휘 – 이지메타 K-시소러스 분류체계에 의한 동일분류의 어휘들을 연관검색어로 제공합니다.
    “관악기”를 검색하면 더블 바순, 리코더, 바순, 색소폰, 색스혼, 오보에, 오카리나 등의 관악기 이름을 연관검색어로 제공합니다.
  4. 외국어(Multilingual) – 검색어의 영어, 일본어 정보를 제공합니다.
    “영상복원”을 검색하면 ‘映像復原’, ‘image restoration’, ‘画像復元’의 교차검색어를 제공합니다.

6. 기대효과

  1. 도서관 이용률 증대
  2. 학술연구의 생산성 향상

7. 활용예시

추천검색어, 다국어 교차검색 등 다양한 서비스가 가능합니다.

croessreference

8. 이용방법

  1. 요청 URL

    http://api.ezmeta.co.kr/v1/search.php?k=

  2. 샘플 URL
    http://api.ezmeta.co.kr/v1/search.php?k=가상현실

9. 출력결과 필드

상위필드 하위필드 설명
descriptions description 검색한 어휘의 설명을 CDATA 로 제공
thesaurus synonym 동의어. 동의어와 이칭을 구분할 수 있습니다.
[속성값]
synonym : 일반적인 동의어.
altername : 이칭(특히 인명의 경우)
related 관련어. 관련어는 속성값으로 구분됩니다.
[속성값]
general : 일반적인 관련어들
narrower : 하위어
broader : 상위어
nonstandard : 이형어, 비표준동의어
sameCategory : 같은 카테고리로 분류된 어휘들
composit : 검색어를 포함한 복합어
multilanguage termen 영어 : 한글 검색어에 대한 영어 어휘
termjp 일본어 : 한글 검색어에 대한 일본어 어휘
termkr 한국어 : 영어 검색어에 대한 한글 어휘

10. XML 샘플

<?xml version=”1.0″ encoding=”UTF-8″?>
<result>
<query>가상현실</query>
<records>
<descriptions>
<description><![CDATA[○ 컴퓨터(가상공간)를 통하여 정보가 오가거나 실제 생활처럼 벌어지는 현실.]]></description>
</descriptions>
<thesaurus>
<synonym at=”synonym”>VR</synonym>
<synonym at=”synonym”>버추얼 리얼리티</synonym>
<synonym at=”synonym”>브이알</synonym>
<synonym at=”synonym”>Virtual Reality</synonym>
<related at=”general”>가상공간</related>
<related at=”general”>컴퓨터 가상공간</related>
<related at=”broader”>컴퓨터</related>
<related at=”nonstandard”>버츄얼리얼리티</related>
<related at=”sameCategory”>단말기</related>
<related at=”sameCategory”>디지털 컴퓨터</related>
<related at=”composit”>가상 현실 모델링 언어</related>
<related at=”composit”>가상 현실 모델 언어</related>
<related at=”composit”>가상 현실 생성 언어</related>
</thesaurus>
<multilanguage>
<termen>Virtual reality</termen>
<termen>Réalité Virtuelle</termen>
<termen>VR</termen>
<termjp>仮想現実</termjp>
</multilanguage>
</records>
<copyright>ezmeta</copyright>
</result>

※ 관련된 글