WAT Note(III).

RDBとNoSQL、システム要件に応じた最適なデータベースの選び方

Tatsuroh Wakasugi
Tatsuroh Wakasugi

過去に AWS 上で個人開発をやっていた時に、データベースを RDS(リレーショナルデータベース:RDB)か DynamoDB(NoSQL)のどちらにすべきかで迷った事があった。当時はとにかく節約したかった面から安易に DynamoDB を選択したのだが、開発を進めていくうちにシステムと性質上合わないことが分かって DB を RDS にリプレース・・という面倒な事態に出くわしてしまった。

その復習がてら、今回は開発するシステムの性質から、利用するデータベースとして RDB と NoSQL のどちらが向いてるか、及び向いてないかをまとめてみようと思う。

NoSQL

まず NoSQL 型データベースが適している・適していないパターンを記載する。

NoSQL 型データベースが適しているパターン

  • スケーラビリティが重要な場合
    • 大量のデータや高トラフィックを処理する必要がある場合、NoSQL は水平スケーリングが容易な事がある。
  • データモデルが柔軟な場合
    • スキーマが固定されていないか、頻繁に変更される場合、NoSQL の柔軟なスキーマ設計が役立つ。
  • 高速な読み取り/書き込みが必要な場合
    • 低レイテンシが求められるシステム、特にリアルタイムのデータストリームやログデータの処理に適している。
  • データの種類が多様で非構造化データが多い場合
    • ドキュメントデータベースやグラフデータベースなど、特定の用途に特化した NoSQL データベースは、非構造化データや複雑なデータ関係に適している。

NoSQL 型データベースが適していないパターン

  • 複雑なクエリが必要な場合
    • 関連データ間の複雑なクエリや結合が必要な場合は、RDB の方が適している。
  • トランザクションの一貫性が重要な場合
    • 銀行業務や財務システムなど、ACID 特性が重要なシステムでは、RDB の方が信頼性が高い。
  • 既存のシステムやレガシーアプリケーションとの互換性が必要な場合
    • 既存のシステムが RDB を前提としている場合、NoSQL への移行は困難な場合がある。
  • データの整合性と正規化が重要な場合
    • データの整合性やリレーションが厳密に管理される必要がある場合、RDB が適している。

RDB

次に、RDB が適している・適していないパターンを記載する。

RDB が適しているパターン

  • 複雑なトランザクション管理が必要な場合
    • 多くの商用アプリケーションは複雑なトランザクション処理を必要とするため、そのような場合は RDB が適している。
  • 明確なスキーマが必要な場合
    • 事前に定義されたスキーマがあり、データ構造が変更されない場合は、RDB の方が適している。
  • 標準的なデータ管理と SQL の利用
    • 標準的な SQL を使用してデータを管理したい場合、RDB が便利。

RDB が適していないパターン

  • 高いスケーラビリティが必要な場合
    • RDB は垂直スケーリングに依存することが多いため、大規模なスケーリングが必要な場合には限界がある。
  • 非構造化データの管理が必要な場合
    • テキスト、画像、音声などの非構造化データを扱う場合、RDB は適さない事がある。

コスト面での比較

次に、コスト面に関して両者の比較をする。

NoSQL のコストメリット

  • スケーリングコスト
    • 必要に応じた段階的な拡張が可能。
    • クラウドサービスでは柔軟な料金体系となっているものが多い。
  • 運用コスト
    • シャーディングを行える。
  • 開発コスト
    • スキーマレスによる柔軟な開発が可。

RDB のコスト面での考慮点

  • ライセンスコスト
    • 商用データベースの場合、高額なライセンス費用がかかる場合がある。
  • 運用コスト
    • スケールアップ時の計画的な投資が必要。
    • DBA の専門知識が必要。
  • 開発コスト
    • スキーマ設計に時間が必要。
    • 変更管理のコスト。

ハイブリッドアプローチ

実際のシステムでは、RDB と NoSQL を組み合わせて使用することも有効である。例えば

  • RDB: トランザクション処理、マスターデータ管理
  • NoSQL: セッション管理、ログデータ、キャッシュ

などがある。


最終的な選択は、これらの要素を総合的に判断して行う必要があるが、システムの要件によっては、両方のデータベースを適材適所で使い分けるハイブリッドアプローチも検討できると思う。

コスト面だけでなく、長期的な運用性、保守性、スケーラビリティなども考慮に入れ、システム全体の最適化を図ることが重要なので、そこも踏まえて決定しよう。