초고속 시계열 데이터베이스

마크베이스

오직 IoT를 위한.
TPC 국제인증 1위 데이터베이스.

마크베이스의 시계열 데이터베이스(Time-Series Database, TSDB)는 산업 현장의 운영 최적화와 예측 분석을 위해,
데이터 병합과 모니터링 기능을 제공하고,
에지 컴퓨터 기반 지능화 운영에 최적의 데이터 처리 기반을 제공합니다. 

산업용 사물 인터넷을 위한 데이터베이스

마크베이스의 성능 도약

마크베이스는 전세계 데이터베이스의 성능 인증 공식 기관인 TPC.org에서 IoT 분야의 1등을 기록함으로써 세계 최고의 성능을 인정받았습니다.

대량의 IoT 센서 데이터를 실시간으로 저장하고, 이를 추출하는 최고의 시계열 데이터베이스, 마크베이스의 경이로운 성능을 확인하십시요.

마크베이스는 ANSI SQL 92를 지원하기에 다른 종류의 언어를 새로 학습할 필요가 없습니다. 

이는 엔지니어들의 기존 지식을 재활용함으로써 보다 빠르게 제품을 개발할 수 있게 하여, 귀사의 시간과 비용을 극적으로 줄이게 합니다.  

대량의 시계열 데이터 저장으로 인한 디스크 용량의 증가는 서비스의 비용을 지속적으로 증가시키는 가장 큰 문제 중 하나입니다. 

마크베이스는 심지어 원본 데이터보다 더 작게 데이터를 압축함으로써 응용 프로그램의 성능의 향상은 물론 사용시간을 단축함으로써 FEMS로 에너지 사용량을 줄여주고 사용자의 디스크 유지 비용도 극적으로 줄일 수 있습니다.

오라클이나 MS-SQL과 같은 전통적인 데이터베이스는 트리 기반의 인덱스 한계로 인해 대량의 센서 데이터에 대한 처리 성능이 데이터 양에 비례하여 느려 집니다.

마크베이스는 특허 받은 혁신적인 시계열 인덱스를 통해 수백억 건의 시계열 센서 데이터를 효율적으로 저장할 뿐만 아니라, 추출 성능도 독보적으로 빠릅니다. 

또한, 자동화된 통계 테이블을 통해 어느 때나, 한 번의 클릭으로 분,시,월,년 별 그래픽 차트를 볼 수 있어 실시간 모니터링, 작업 내역 추적관리, 상태 파악 등 MES 현장 시스템에 최적화되어 있습니다.

마크베이스는 ODBC, JDBC, C# 등의 표준 개발 도구를 제공합니다.

뿐만 아니라, 서버 내부에 내장된 웹 서버를 통해 초고속의 Restful API를 지원하여, 간편하게 응용 프로그램을 개발하고, 신속하게 제품을 출시할 수 있습니다. 

포그 에디션 ❯

서버 급 단일 노드에서 대량의 센서 데이터를 저장하기 위한 최고의 선택입니다. MS-SQL과 같은 전통적인 데이터베이스에 저장된 데이터의 처리 성능을 극적으로 개선합니다.

에지 에디션 ❯

게이트웨이로 불리는 소형 에지 컴퓨터에 내장되어 수일에서 수개월치의 센서 데이터를 저장하고, 관리할 수 있습니다. 이를 통해 혁신적인 에지 컴퓨팅 구현이 가능해집니다.

클러스터 에디션 ❯

다중 노드 간의 클러스터링을 통해, 예측할 수 없는 소프트웨어 및 하드웨어 장애에도 무정지 서비스가 가능합니다. 또한, 선형적인 확장(scale-out)을 통해 저장 공간 확보 및 성능 향상을 위한 인프라 구축이 매우 쉽습니다.

유틸리티

콘솔을 통한 데이터 조작 및 데이터 관리 도구를 기본적으로 제공합니다. 또한, 웹 기반의 데이터 조작 도구인 MWA(Machbase Web Analytics)도 함께 제공하여, 편리하게 마크베이스를 활용할 수 있습니다.

퍼포먼스

경쟁 제품들에 비해 최대 17배 높은 속도를 기록중인 마크베이스의 시계열 데이터베이스는 국제 공인 성능 테스크 기구인 TPC의 IoT 부문에서 끊임없이 신기록을 달성하고 있습니다.  

더보기

마크베이스 - 1위
3,410,800 IoTps
하둡(Hadoop)
742,256 IoTps
시계열 데이터의 특성

센서의 성능이 향상되고, 설비들의 디지털화가 진행되면서 고속 데이터 샘플링이 일반화되고 있습니다.

샘플링 된 데이터의 활용을 위해 그 이상의 속도를 지원하는 데이터 저장 및 처리 솔루션이 필요합니다. 

디지털화된 사물이 생성할 수 있는 데이터의 양은 일반 응용 프로그램의 데이터 양과 비교할 수 없습니다. 10개의 센서가 장착된 사물1000개가 초당 20건의 데이터를 생성한다면 하루 170억건 데이터가 발생합니다.

IoT 데이터 분석에서 가장 중요한 것은 원시 값이나 집계 데이터에 빠르게 접근하여 MES의 핵심을 파악하고 통찰을 얻는 것입니다. 일부 긴급한 상황에서는 분석이 조금만 늦어도 그 가치를 잃을 수 있습니다. 

더 높은 정확성과 안정성 위한 인공지능 솔루션이 도입되고 있습니다.  이 인공지능 학습을 위해 모든 데이터를 더 오래 저장해야 합니다. 

시계열 데이터베이스가 필요한 이유

기존 솔루션들의 한계

관계형 데이터베이스는 은행 거래와 같은 트랜잭션 처리를 위해 설계되어, 매우 복잡한 구조를 가지며 성능도 느립니다. 

따라서, IIoT에서 생성되는 시계열 데이터의 처리에 적합하지 않고, 이를 대용량의 센서 데이터 처리에 활용하는 것은 마치 고속도로에서 마차를 끄는 것과 같습니다. 

NoSQL은Key-Value 기반의 컴퓨터 클러스터에 대한 수평적 확장을 목적으로 개발된 것으로 데이터베이스 구조인 스키마를 없애고, 설계를 단순화하였습니다. 

이러한 Key-Value 형태의 데이터 처리 모델은 복잡한 대량의 시계열 데이터를 저장하고, 추출하는 데에 매우 비효율적입니다.

Apache Hadoop, Apache Spark, Apache Storm과 같은 분산 처리 시스템은 비정형 텍스트 데이터를 배치(Batch) 형식으로 처리하고, 거기에서 나온 결과물을 빨리 활용하는 것에 목적이 있습니다.

작지만 폭발적으로 유입되는 센서 데이터를 실시간으로 저장하고 처리하는 것에는 적합하지 않습니다. 특히, 하둡을 구성하기 위한 복잡한 시스템 아키텍처, 네트워크 의존성, 엔지니어의 부재는 비용대비 데이터 처리 효율성을 극단적으로 떨어뜨리고 있습니다. 

일반적인 데이터베이스에서 데이터를 저장하려면 테이블과 필드를 정의해야 하는 반면, 스플렁크(Splunk)와 엘라스틱서치(Elasticsearch)는 고정된 스키마가 없기 때문에 거의 모든 종류의 데이터를 텍스트 형태로 받아들이고, 키워드를 기반으로 데이터를 추출하는 방법을 사용합니다.

이런 이유로 데이터 량이 급격하게 증가될 때, 데이터 처리를 위한 인덱싱 시간이 극단적으로 늘어나는 문제로 인해 실시간 센서 데이터 처리에 매우 불리합니다.

많은 기업들이 시계열 데이터를 처리하기 위해 히스토리안(Historian)이라는 형태의 솔루션을 개발했습니다. 이러한 제품에는 AspenTech IP21, 슈나이더의 eDNA, OSISoft PI GE Proficy Historian 등이 있습니다.

실시간 히스토리안은 일반적인 데이터베이스가 아니라 데이터 포인트의 이름, , 시간 값 등으로 구성된 레코드를 플랫 파일형태로 저장하는 임시 저장소입니다. 물론 속도와 데이터 압축면에서는 뛰어난 성능을 보이지만, 도입 비용이 매우 비싸며 비표준화된 아키텍처로 시스템 통합이 제한적이기 때문에 시장 경쟁력이 약화되고 있습니다.