はじめに:AI時代におけるデータマネジメントの重要性
AI技術の進化にともない、大量かつ多様なデータを活用し、いかに有益な洞察を得られるかが企業の競争力を左右する時代となりました。しかし「Garbage in, garbage out(ゴミを入れたら、ゴミが出てくる)」という言葉に代表されるようにAIには品質の高いデータが不可欠です。
キンドリルが2024年に実施した調査では、世界の大企業の106社(96%)が生成AI活用を模索していることが判明。しかし、それを使いこなすためのデータ戦略に十分な自信を持つ企業は5分の1に過ぎないことが明らかになりました[1]。またIPA(情報処理推進機構)発行の「DX動向2024」によると、「全社でデータの利活用を進めている」と回答した日本企業は20%に留まり、部門ごとの利活用は37%でサイロ化の課題もうかがえます[2]。
こうした状況下で、「データマネジメント」はこれまでのシステム運用に留まらず、ビジネス全体の成長戦略を直接的に支える役割を担います。様々なソースから取得されるデータを安定的かつセキュアに集約・分析し、その結果を事業成果につなげるには、これまで本連載で紹介したCCoE(Cloud Center of Excellence)、社内コミュニケーション術、SRE(Site Reliability Engineering)の考え方をデータの領域にも応用して、全社的にデータの信頼性を向上させる取り組みが必要です。
今回は、AI活用が進展するなかで求められる「データマネジメント」の重要性を従来のITインフラ運用の視点で再確認し、企業がデジタル変革を成功に導くために押さえるべきポイントを整理します。データ活用の拡大にともない複雑化する運用課題を解決し、競争力を高めるための実践的なアプローチを示すことが今回の狙いです。
[1]Kyndryl「What C-suite leaders say about responsible generative AI at scale」(2024年5月10日公開)
従来のITインフラ運用と何が違うのか?
従来のITインフラ運用では、クラウドやオンプレミスのハードウェアやOS、ミドルウェアなどの資源を管理し、変更要求に対応し、障害があれば迅速に検知・復旧することを運用で担ってきました。一方、AIやデータ分析の進展にともない、信頼できるデータをいかに収集・加工・活用するかが重要となり、従来のインフラ監視やハードウェア管理だけでは十分に対応できない局面が増えてきています。
データに対する運用が求められる背景には、ビジネスの不確実性の増大、ニーズの多様化、変化への対応の迅速化があります。ビジネスの現場でAIやデータ分析の活用領域が広がるほど、扱うデータ形式や処理方式は複雑になり、データ連携もストリーミングやバッチ処理など異なる手法を併用する必要が出てきます。これらを安定して運用するには、セキュリティやガバナンス、プライバシーといった観点も含めて包括的に管理する必要があります。さらに、AIモデルの学習や推論を安全に、かつ継続的に最適化しようとすると、データの鮮度や品質を保つことが欠かせません。
これらを実現するためには、IT部門だけでなく様々なステークホルダーとの協業が必要です。ビジネス部門、データサイエンティストやリスク管理部門とも連携し、データのライフサイクル全体を見据えた新たな視点・アプローチが重要となります。
従来のインフラ運用を軸にしつつ、データを取り巻く様々な要素を統合して俯瞰することで、AI活用の進展を支える最適な運用体制を実現できるのです。ここではデータに対する運用の主要要素として、「データプラットフォーム管理」「データエンジニアリング」「データの品質管理」「セキュリティ・コンプライアンス」の4つを紹介します。