Monday, May 29, 2006

RDF 기반의 문서와 XML 문서처리 비교 및 분석

RDF 기반의 문서와 XML 문서처리 비교 분석

- 오지훈, (주)인프라밸리

sonny@infravalley.com

XML 문서를 처리할 때와 RDF 기반의 온톨로지를 처리할 때는 큰 차이점이 있다. XML 문서를 처리할 때는 해당 문서를 트리 구조화하여 분석하지만, RDF(S) 기반의 DAML+OIL 문서를 처리할 때는 해당 문서가 트리구조가 아닌 subject, predicate, object로 구성되는 트리플(triple) 구조로 분석된다는 것이다.

<표 1> XML과 RDF의 특징 비교

구 분

XML

RDF

데이터 모델

순서화된 트리지향 모델

객체의 관계지향 모델

스키마

문법적 해석

의미적 해석

순서 중요도

노드의 순서가 매우 중요. 노드의 배치가 다르게 되어 있다면, 파서는 문서를 다르게 인식.

트리플들의 발생 및 배치 순서는 중요치 않음. 각각의 트리플들은 독립적으로 존재.

문서구조

이해도

XML 데이터를 사용하기 위해서 문서의 전체 구조를 이해.

사용될 부분만 이해. 나머지 부분은 고려할 필요 없다.

질의어 처리

복잡한 트리구조로 되어 있어서 쿼리하기 복잡. XPath 메커니즘 이용

XML에 비해 간단한 쿼리. 서로 독립적인 트리플들의 집합이므로 쿼리하기가 간단.

문서교환

XML을 사용하여 두 기업간에 문서를 교환하기 위해서 먼저 교환될 문서에 대한 공통 구문 정립 후에, 새로운 구문에 맞춰 문서 규격을 리엔지니어링

RDF를 사용하여 두 기업들은 동일한 개념(concept)을 사용하는 서로 다른 구문상에서 통신 가능

<표 1>은 XML 문서와 RDF 기반의 문서의 특징을 비교해 놓은 것이다. RDF가 데이터 모델을 표현하기 위해 XML을 이용하지만, RDF 데이터 모델과 XML 데이터 모델에는 상이한 점이 존재한다.

<표 1>과 같이 XML 데이터 모델은 객체의 배열된 순서가 중요한 트리 지향 모델의 텍스트 마크업 모델이고, RDF 데이터 모델은 객체 사이의 관계를 정의하는 데이터 모델이다. XML은 트리 형태의 문서로 고정되게 설계되어 노드가 문서에 포함되어 인덱스되기 때문에 메타데이터를 표현하기 위한 유연성이 부족하다.

반면 RDF에서는 노드는 인덱스되지 않고 URI를 갖는 자원이기 때문에 메타데이터를 표현하기 위한 유연성을 지원할 수 있다.

XML 스키마가 생성 가능한 XML 문서의 집합을 제약하는 문법적 해석이 주된 기능인 반면, RDF는 의미 해석에 이용된다. 다시 말해 XML 스키마는 XML 문서의 구조를 모델링하여 사용하는 데이터 모델링 언어이고, RDF는 지식을 모델링하기 위한 메타데이터 모델링 언어이다.

따라서 메타데이터가 데이터로 인코딩될 때 XML 구문은 매우 유용하지만, 순수한 XML로 메타데이터를 모델링할 때는 의미적 상호운용성에 한계가 있다. 즉, 웹 정보자원을 표현하는데 있어 XML이 구문적 계층에서 데이터의 구조를 정의하는데 이용되고, RDF가 의미적 계층에서 지식표현을 위한 기능을 하는 것이다. 따라서 두 언어는 베타적이기 보다는 상호 보완적인 특성을 갖고 있다.