「実践DataOps」(翔泳社, 2024年)を、翻訳者の一人から献本いただいて読んだのでその書評を書きます。本書は「Practical DataOps: Delivering Agile Data Science at Scale」の翻訳で、タイトルの通りDataOpsを必要となった背景から解説した本です。

DataOpsは、データを活用するための分析基盤全体を効率的に行うための管理手法で、DevOpsをデータ分析のパイプラインに拡張したものといえます(DevOpsをDataOpsに拡張していく考え方については本書内で1章を割いて詳しく解説されています)。
まえがきで、データの流れ全体を管理し、フィードバックを受けながらアジャイルに改善したことで、機械学習の品質を高めることに成功した事例が説明されますが、まさにこれがDataOpsの必要性を表す一例で、データの領域にもDevOpsのような開発と運用を分断せずにモニタリングと改善を繰り返すような手法が効果的というわけです。
筆者は、データ分析(データサイエンス)の課題をまず定義したうえで、どのような考え方や組織が必要になるかを実践的な観点から記載しています。つまり、技術や手法だけでなく、それをどう組織に適用するかという実践論を示す部分が多いです。対象の読者は、そういったデータ分析基盤を扱うことになったエンジニアだけでなく、そのマネージャや、組織のデータ活用の方針を決めるリーダーの方までを含みます。
最初のPart 1~2が議論の準備や基本要素の解説といえる部分で、どうしてデータ戦略が必要になるのか、なぜウォーターフォールでは機能せずアジャイルである必要があるのか、効果測定とフィードバックの重要性、などについて説明されています。
文章は平易で読みやすく、前提知識をあまり要求されない形にうまく構成されています。技術の話もありますが、全体を理解する上では深い知識までは必要ありません。むしろ組織と人により紙面を割いた構成になっており、これは本書の特徴の1つと言って良いでしょう。一方で技術的な要素無しではデータ分析の仕組みは回りません。処理の自動化、品質の評価、継続的なインテグレーション等も必須ですので、その点もカバーされています。
こういった組織・人+技術という観点で本書を読むと、個人的には Part 2の最後(Chapter 5)からPart 3 (Chapter 6~8)にかけてが本書で一番面白い部分でした。100ページほどの分量に、効果測定、メタデータ、リネージ、自動テストといった技術的な側面と、フィードバック、チームの作り方、人材育成、レポーティングといった人・組織の管理手法の両方がまとまっています。ある程度前提知識がある方であればこの部分だけ読んでも得るものが多いでしょう。
私はクラウド上でのデータ分析の環境の技術支援をすることを仕事にしていますが、その実感からも、データの活用を進める上で重要かつ大変なのは人や組織に適した手法を見つける、もしくは人や組織をどう変えるかという点であり、実際に変えていくことはとても難しいというを日々実感しています。ですので著者がプロセスの改善と、データ分析をどう組織の目標と合致させるかということに焦点を当てて書いていることは納得がいくものでした。
原著は2019年12月発売の本であるため、技術用語としては最新のものではありませんが、内容は古びていません。むしろ、最新技術(例えば生成AIのサービス)が簡単に誰でも手に入る一方で、技術がどんどん移り変わっていく現在においては、DataOpsのような「どのようにして自分たちのデータから価値を生み出すか」にフォーカスを当てた本書の価値はより高くなっているといえるでしょう。
基本から説明し、人・組織・技術等で幅広い内容を扱いつつも250ページに収まっているため、各内容を深く知りたい場合は別の本をあたる必要がありますが、その分短い時間で俯瞰的な知識を得ることが可能です。データ基盤の関係者すべてに広くお勧めできる本になっています。
- 実践DataOps (Amazon)
目次:
◆Part 1 DataOps序論
・Chapter 1 データサイエンスの問題点
・Chapter 2 データ戦略
◆Part 2 DataOpsの実践に向けて
・Chapter 3 リーンシンキング
・Chapter 4 アジャイルなコラボレーション
・Chapter 5 効果測定とフィードバックの仕組み作り
◆Part 3 さらなるステップ
・Chapter 6 信頼の構築
・Chapter 7 DataOpsへのDevOpsの適用
・Chapter 8 DataOps実現のための組織作り
◆Part 4 セルフサービス型組織
・Chapter 9 DataOpsで用いるテクノロジー
・Chapter 10 DataOpsの導入手順
コメントを残す