数学だけではない –「データサイエンス」という芸術
データサイエンスは、ビジネス、人間行動学、そして数学的に入り込んだ複雑な問題を扱います。そのため、技術的な視点だけでなく、人文主義的で芸術的なアプローチも同様に重要になります。
データサイエンティストには。想像力が求められ、描いたイメージを技術を駆使して具現化するという責任があります。その様子は、表現者としての芸術家にも重なります。頭の中にイメージを描き、コードやデータセットを一つずつ組み立てる入念な作業を経て、ユーザーの誰もが理解しやすい形に作り上げていきます。
一度完成したものでも、それが伝わりやすく、有益で、前向きなものでなければ、最初から工程をやり直すという意気込みが求められます。納得いくものができるまで試行錯誤を重ねるといった姿勢も、芸術家との共通点と言えます。
もう一つデータサイエンティストと芸術家に共通する点は、技術的な作業を始める前に、計画と準備が必要だということです。芸術家に例えれば、「キャンバス」となる前提を熟知し、データや仮説といった必要な「道具」を揃え、理論を忠実に表現するための「絵の具」を混ぜなければなりません。これらは、具体的に以下のことを意味します:
- 問題提起と機会について明確化し、何が成功を意味するのかの定義について、共通理解を図ること
- ブレインストーミングを通じ、仮説、実験、理論を特定すること
- データソースとサンプルを収集し、実験や仮説検証におけるその有用性を精査すること
- 実験に適した方法論的ワークフローと調査手法を開発し、マニュアル化すること
- 作業の開始
レオナルド・ダ・ヴィンチはかつて『アートの科学を学び、科学のアートを学べ。』という言葉を残したと言われています。科学は芸術に通じ、データサイエンスもまた、創意に富んだ精神を通じて、活きた「機会」を生み出すのです。