第3回
株式会社創夢(以下創夢)には、千台超規模の計算機サーバから構成されたクラスタ計算機システムやグリッド・コンピューティング・システムを利用し大規模かつ高性能な科学技術計算、あるいはクラスタやグリッド技術そのものの研究に役立てていらっしゃるお客様がいます。こうしたお客様の運用を支え、システムを拡張するといった仕事を、創夢は長年にわたってお手伝いしてきました。その技術と経験は、これからはじまるクラウドの時代における創夢の強みとなっていきます。(2010年6月取材)
大規模な2つのクラスタ計算システム(以下クラスタ)、1つは1000台以上、もう1つも100台以上の計算機サーバから構成されたクラスタに対して、効率よくソフトウェアを導入し、パッチを適用し、障害に対応するなどの運用管理の業務を、創夢は独立行政法人 産業技術総合研究所様から請け負っています。
一般にこうした大規模クラスタでは、すべての計算機サーバに必要なソフトウェアを導入する手間だけでも膨大なものになります。それだけでなく、バックアップやストレージ管理、故障したハードウェアの対応など、日々のメンテナンスも欠かせません。クラスタを活用し続けるためには新たな処理のためのライブラリの追加や環境構築なども必要で、効果的な運用管理には多くの課題があります。創夢はこうした課題の解決のためにお客様と相談しつつ、周辺ソフトウェアの環境整備とともに既存のクラスタ用ソフトウェアをベースに改良を加え、運用管理の効率化、自動化などを行っています。
また同法人から2003年以来請け負っている別の案件では、複数のクラスタにまたがるグリッド・コンピューティング・システム(以下グリッド)用のミドルウェアの運用管理も実施。グリッドではPKIによるユーザー証明書を用いて個人を認証し、複数の組織の資源を利用できます。そのための認証局の立ち上げと証明書の発行も行うなど、大規模システムの運用基盤にかかわる幅広い技術を駆使しています。創夢ではその他にも、国立大学法人 東京大学様の大規模クラスタやグリッドの運用支援、その他国立系研究機関様でのクラスタやグリッドなど、多くの大規模システムに関する構築、導入、運用管理についてのお手伝いをしてきました。
左上から時計回りに、先端技術部部長 宇羅博志(うら ひろし)、運用技術部プロジェクトマネージャ 飯島昭博(いいじま あきひろ)、運用技術部部長 津嶋基邦(つしま もとくに)、運用技術部シニアプロジェクトマネージャ 渡邊欣一(わたなべ きんいち)
先端技術部は、運用技術部におけるシステム構築・運用の経験から、それらの業務に必要とされるソフトウェアの研究・開発を専門に行うために設立された比較的新しい部署
(所属・役職は取材当時のもの)
大規模なクラスタやグリッドの運用管理では何がポイントでしょうか。管理の自動化が1つの鍵となると、運用技術部シニアプロジェクトマネージャの渡邊欣一。「計算機サーバの数が膨大になるので、1台1台をそれぞれ人が目視するわけにもいきません。監視ツールを用いて運用状況や故障の状況などを把握することになりますので、それをいかに使うかが大事なノウハウの1つになります。特に1000台規模ではビジュアルで分かりやすいものにしないと管理しきれないでしょう」
こうした大規模システムの運用管理ノウハウは、創夢のエンジニアが知識や経験を重ねてきた分野です。例えばオープンソースソフトウェアとしてグリッドの構築や管理を行う目的で配布されている「NAREGIミドルウェア」あるいは「gLite」など、かつては使いこなすのに非常に手間がかかるものを取り入れつつ、使いこなすテクニックを磨き、独自に使いやすさや自動化のための改良などをしてきました。
先端技術部 部長の宇羅博志は「新しい技術でもすぐに習得して、キャッチアップできるというのは創夢の売りだと思う」と言い、運用技術部 部長の津嶋基邦も「大規模なクラスタ計算機システムやグリッド・コンピューティング・システムの運用管理、グリッド技術において、創夢は他社にはない技術や経験を持っている」と自社を評します。
創夢が提供するのは運用管理にとどまりません。お客様に対する大規模システムの付加価値も実現しています。前述の産業技術総合研究所様の案件では、地球観測衛星から送られてくる画像のクラスタへの蓄積に関連した、画像変換処理の研究支援なども行っています。別の案件では、システム拡張のための投資は何が最適なのか、演算性能なのか、ネットワークなのか、ストレージ性能なのか、というお客様の選択肢の中で、運用を任され、システムの動作やボトルネックなどをよく知る立場からアドバイスを行うこともあります。
創夢の開発部門と連係してシステム開発を行うことも得意とするところ。前述の画像蓄積クラスタとグリッド技術を結びつける研究ではJavaを使ったWebポータル上でグリッド認証を利用するシステムを創夢の開発部門が開発。運用と同様に大規模システムに対応しています。運用技術部 プロジェクトマネージャ 飯島昭博は、これらをこう表現しています。「お客様の言うことを単に聞くだけではなく、こちらから改善のための助言や提案もしますし、無理な設計などには技術的に無理な理由を説明して、代替案をお客様と一緒に検討します。もしも必要な開発があれば創夢にはそれを行う能力もある。コンシェルジュのようないろんな対応が可能で、それが創夢のよさではないかと思います」
運用を効率化するだけでなく、それを基盤にして何が可能になるのか、お客様と一緒に考えつつ、あがってくる柔軟な要望に応える。創夢が提供するのはそうした創造的な運用であるといえるでしょう。
先端技術部 担当案件
3
CentOS 5, Scientific Linux 3, Xen 3
シェルスクリプト, Python
10
CentOS 5, Scientific Linux 3, Xen 3
CentOS 5, openSUSE 10.3
シェルスクリプト, RPM, C言語, Java
CentOS 5, Scientific Linux 3, Xen 3
シェルスクリプト, Python, JavaScript, XML
運用技術部 担当案件
約20
Scientific Linux CERN 3/4/5
オープンソース
約106
Scientific Linux CERN(SLC)3/4/5, Red Hat Enterprise Linux Advanced Server 4/5, Solaris 9/10, Microsoft Windows Server 2003/2008
オープンソース
約20
Scientific Linux CERN 3/4
オープンソース
約10
Scientific Linux CERN 3/4/5
オープンソース
約100
Red Hat Linux 8.0/9, Solaris 9/10, CentOS 4, CentOS 5
オープンソース
プロダクトソフトウェア
UNIXサーバ
約170
SUSE LINUX Enterprise Server 8,9, IRIX64 6.5
オープンソース
プロダクトソフトウェア
約100
Red Hat Enterprise Linux, Cent OS
オープンソース
プロダクトソフトウェア