qpstudy 2016.04 でITインフラ監視の今後について発表しました #qpstudy

qpstudy 2016.04 でITインフラ監視の今後について発表しました #qpstudy

昨日は、qpstudyというITインフラの話題を中心に取り上げる勉強会で、ITインフラ監視の今後について発表してきました。

発表内容について

「ITインフラ監視の今後を考える」と題して、発表しました。

今回は「こうだからこうだよね」という感じではなく、この後に密かに予定されていたグループディスカッションのための種まきをするべく、会場の皆さんと課題を共有する目的でお話ししました。ですので、結論があまりないふわっとした発表のように聞こえた方もいたかもしれません。

会場の中でいろいろお話を聞いていくと、課題に掲げた内容で、いろいろ悩んでいる方が多いのだなという印象を受けました。例えば、今の業務に追われてしまっているのかなと感じる方もいらっしゃいました。

後のグループディスカッションを聞いていると、グループの方々が意図されたかどうかはわかりませんが、投げかけたテーマが織り込まれた状態で議論が繰り広げられていました。今回、一定の役割は果たせたかなと考えています。

グループディスカッション

今回のqpstudyは、Outputしていこうという目的のもとに、グループディスカッションが行われました。人数が多い勉強会というと、どうしても受け身になってしまうところがあります。そこを、どんなことであれOutputすることで、今日のことを一人一人が自分の価値に転換してもらえたら、という運営の皆さんの想いがあってのものだったようです。

私がいたグループ11は、「体系化」をテーマに話をまとめました。「レガシー(ここでは特に負の遺産)」と「経験」は背中合わせの関係であるけども、そこから抽出される物事がモデリング・構造化されることによって監視の知見が明文化・共有できるものに転化できる。その転化の方法として、学術論文や学会の研究会発表といったアカデミックな手法が参考にすることで、業界全体に知見を共有できるのではと考えられるのではというものでした。また、最近の若い人は修士号またはそれ以上を持っていることも少なくなく、そういった若い人に知見の体系化を担ってもらえればいいのではという意見を提案しました。

IMG_3317

各グループの発表は、チームによって、焦点を当てている事柄が違っていて大変興味深いものでした。例えば、監視のしかたをどうするか、実際に業務で困っていることの共有、自動化をどのように推進するかなど、様々なものがありました。私が印象に残ったのは、「重要な監視項目とは何か、それは誰にとって重要なのか。」を議論していたグループでした。技術者だけですとどうしても技術者に偏った意見になりがちだけれど、ステークホルダーとなっている別の業務担当にとって重要なことが見落とされていることがあるのではないか、というものでした。私は、レポートラインを洗い出すことで、誰にとって重要なのかの「誰」の部分を適切に洗い出せるのではないか、その上で「誰」にとって良いものかが考えついたり相談できるのではと考えています。

感想

監視の設計や実装は、私が以前執筆した「ソフトウェアエンジニアのための ITインフラ監視[実践]入門 (Software Design plus)」である程度体系化したのでやり方のモデルは一定の結論が出ていると考えているのですが、実際の運用であったり、組織の中でどのように立ち居振舞うかについてはなかなか答えが出ない悩ましい問題だと改めて感じました。また、自社サービスで監視業務を行っている人は、孤独な人がまだまだいることも、以前同じ境遇にいたことを思い出して辛い気持ちになりました。

今回、グループディスカッションを通して、知見はもちろん、悩んでいるのは自分だけではないということが共有できたことで、少しでも孤独感を軽減できる機会になれば良いなと思いました。そうすることで、今の問題を解決するモティベーションが上がればいいなと応援したくなります。

あと、監視の業務をはじめITインフラの業務を減点法で評価されてしまう悩みもあるなという話がありました。これは、加点で評価される仕組みを自分たちで積極的に考えて提案し、導入してもらうことで解決できないかと考えています。例えば、パフォーマンスを向上させてより多くの負荷に耐えられるようにしたり、運用コストを軽減して同じ人数で支えられる業務量を増やす、などです。または、GoogleのSREではありませんが(See also: Error Budgets and Risks | USENIX, Google – Site Reliability Engineering)、Error Budgetという考え方を導入して、挑戦の中で発生する一定の問題発生は許容してもらうような仕組みがあってもいいかもしれません。

いずれにしても、監視業務は多くの組織でまだまだ改善できる余地があって、そのための知見をどんどん共有・活かす場を作っていくことが今後のITインフラエンジニアの幸せにつながるのではないかと、考えているところです。

運営の皆様、大変お世話になりました。どうもありがとうございました!

LINEで送る
Pocket