Zmanda はバイオテクノロジーのデータをバックアップ

「データは企業にとって非常に大切で、設備故障に伴うリスクから保護する必要がある。」とPrognosysのPh.DのMike Thompsonは語ります。
ヒトゲノムには30億塩基対があります。塩基の配列は人同士の違いを決め、これらの違いについて情報は、医学の進歩や特定の薬品の効果を理解するのに使用されます。PrognosysはIllumina Genome Analyzer IIと呼ばれるシーケンサーを利用しており、それはゲノミクス上の発見において成果を生み出します。シーケンス装置の各実行の結果、およそテラバイトのデータになります。一度収集されると、raw データは変わりません。動的データはrawデータで実行された計算により生じます。
Zmanda の Amanda Enterprise バックアップサーバソフトウェア及びSolarisクライアントを選んだ理由は、価格(Amanda Enterpriseバックアップサーバは商用ソフトウェアより80%安価)クライアント側またはサーバ側でデータを暗号化可能、オープンソースコードのアクセスの容易さ、カスタマーサービス契約などがあります。
「約70%でデータを圧縮してから、テープに書き込みます。今後Zmanda ソフトウェアに万が一何かが起こり使えなくなっても、標準zipを使用して、データを解凍することができます。」とThompsonは言います。「Zmandaはバックアップサーバ及びストレージサーバ上にソフトウェアを遠隔操作でインストールし、製品テストを実施し、我々が製品に満足しているかを確認しました。価格の割に、我々とZmandaとの交流は素晴しいものです。」
インストール時に、Zmandaの技術者はPrognosysがネットワークの課題を克服するのを手助けしました。さらに、企業がrawデータセットをより効率的にバックアップできるようにしました。Zmanda の技術者はPrognosys がバックアップサーバ及びストレージサーバ間の帯域幅を増やすのを手伝いました。それによって、Prognosysはマシンがデータを収集する間、ネットワークトラフィックを低く保つスマートなスケジュール機能を利用します。
rawデータセットの静的バックアップはZmandaにとって初めてでした。Zmandaエンジニアはスクリプトを記述し、バックアップを自動化しました。 彼らは今まで行ってきたことに関してただ単に知識が豊富なだけではありませんでした。 Zmandaエンジニアは我々にとって最適なソリューションを見つけ出してくれました。
計算はLinuxサーバ上で行われます。そして、Illumina Genome Analyzer II のデータを分析し、ヒトとその他のゲノムに対して配列データを整理します。Genome Analyzer II は、実行毎に、50万の36塩基を読み込みます。
Dell PowerEdge 2950サーバをバックアップサーバとします。Dell PowerEdge 2950サーバーはバックアップサーバです。これはクアドコアの Xeon プロセッサで、1.5TBのキャパシティがあり、Red Hat Enterprise Linux 5を備えています。この2950 は、Solarisで動作するSun Fire X4500 RAID ストレージサーバーに接続し、Dell PowerVault ML600テープライブラリが一杯だと、日々データをバックアップし、ダンプします。
TDell ライブラリには、800GB LTO テープ用の36のスロットがあります。動的データは4週間のローテションで再利用するテープ4本を追加します。その他のテープはrawデータのバックアッップの専用です。PrognosysがIllumina Genome Analyzer IIの実行した後、Analyzer IIはそのデータをテープに書き込みます。バックアップテープはオフサイトの安全なストレージに送られます。
rawデータセットの1週間の平均バックアップサイズは1テラバイトで、日々の平均バックアップサイズは約500GBです。テープへ1週間のフルバックアップにかかる平均時間は7時間で、ディスクへの動的データの増分アップにかかる平均時間は2.5時間です。
Prognosysは製品の導入から、約20TBをバックアップしてきました。 Thompsonはリストアのテストも行いました。データがテープにダンプされると、Amanda Enterpriseでリストアタブが選択されます。Amanda Enterpriseは、バックアップされたすべてのディレクトリ及びファイルの情報を含むデータベースを保持します。ユーザーは、特定の時間からリストアをリクエストし、Amanda Enterpriseはユーザーにどのテープをロードするか伝えます。サーバ負荷はサーバーとクライアント間の帯域幅により、改善されました。
「Zmanda backup ソフトウェアを好きな点は、Webアプリケーションだからです。」 「ネットワーク上のあらゆるマシンから、バックアップの進捗がモニター可能です。」とThompsonは語ります。
さらに、Webアプリケーションインターフェースを利用することで、バックアップを技術スタッフでなくとも、管理が可能となります。専用のストレージ管理者が必要なく、企業にとってプラスとなります。
大量のデータを処理する企業にとって、堅牢かつ信頼できるバックアップとリカバリは成功のために必要なものです。さまざまなバーティカルマーケットの企業は、過度に技術的で高価な専用ソフトウェアではなく、融通の利くオープンソースソリューションを利用して、うまくデータ資産をバックアップしています。