分散処理とは、処理速度の向上とサーバー負荷軽減のために、1つの処理を分散して行う方式のことです。
分散処理には、1台のコンピュータに多数のプロセッサを搭載して処理する方法と、大規模データ処理を複数のサーバーに分散させ、処理結果をネットワーク上で共有する方法の2種類があります。
後者の分散処理では、1台のサーバーで処理するよりも処理速度を向上させることができます。また、特定のサーバーが稼働しなくなった場合でも、他の複数のサーバーが処理を継続するため、1台のサーバーで処理するよりも信頼性を保つことができます。
近年、データの量が爆発的に増加しています。しかし、単独のサーバーで大量のデータを処理すると負荷がかかり過ぎ、いずれサーバーのパフォーマンスに問題を抱えることになります。分散処理は、このような問題を解決する技術として注目を集めています。
超大量のデータをリアルタイムで分析したり、Webサイトにアクセスした訪問者のすべての行動分析を行ったり、分散処理の需要は高まっています。このような注目の中、分散処理システム基盤である「Hadoop」が多くのWebサービス企業から採用されています。
関連ワード