データマエショリストブログ「Data Practitioner Musings」を始めます
アナリティクスに関連して、データマエショリストの立場から、学んだこと、経験したこと、考えたことをアウトプットする場として、新しくシリーズのブログ「Data Practitioner Musings」を始めてみることにしました。
そもそも、「データマエショリストとは何をするロールなのか」という点ですが、個人的な定義としては「データ分析を行うに当たって分析作業そのもの以外のさまざまな準備やデータ管理を行うロール」と定義しています。
そのような立場から、できれば隔週くらいのペースで何かをアウトプットしていきたいと思っています。
何を書くのか
アナリティクスに関連するトピックは広範ですが、主に以下のような内容について書いてみたいと思っています。
- データウェアハウス、ディメンショナルモデル
- ETL、データプレパレーション(Data Preparation)
- データスチュワードシップ
- データマネジメント
- データガバナンス
これらについて、自分が学んできたこと、現場のプロジェクトで経験したこと、そこから考えたことを、可能な限りリアリティをもって、かつ汎用的にまとめていくつもりです。
また、テクノロジーの話だけではなく、
- スキル、学び方
- チームや組織
- 業務プロセス
や、
- マーケットの状況やトレンド
- 関連して読んだ文献や資料
あたりについても、見つけたことや考えたことなどをいろいろと書いてみたいと思っています。
要するに、アナリティクスに関する話題のごった煮のような感じになる予定です。
一方で
- 特定のプロダクトに関する詳細な情報
- アナリティクスの手法やアルゴリズムの深い話
あたりについては書く予定はありません。
なぜ書くのか
大きな理由としては、自分が学んできたことや経験してきたことが、何もしないと時間の経過とともに(記憶が)薄れていってしまうと思ったからです。自分が学んできたこと、経験してきたこと、考えてきたことを、可能な限り形にして後に残せるようにしたいと考えました。
実際の現場、プロジェクトは必ずしも綺麗には進みません。実際に何かを進めようと試みれば、想定していなかったような泥臭いハードルにぶつかるのは日常茶飯事です。
とは言え、それらを(ある程度)超えてきた、という自負もあるので、そのあたりについて、自分なりにまとめておきたいと思ったのが一つ目の理由です。
もう一つの理由としては、アナリティクス(というかデータマエショリ、データ前処理)に関する情報を集めたい、そして広めて仲間を増やしたい、という思いがあります。
例えば、現在でもアナリティクスの中心であるデータウェアハウスの技術は、昨日今日発明されたものではありません。数十年の蓄積のあるテクノロジーであり方法論です。なのに、なぜ自分はこんなに苦労しているのだろうかと、データウェアハウスの構築中によく感じるのです。OLTP/Web系の技術ならいくらでも情報があるのに。
なので、このような情報交換をする場をもっと広げていけば、将来的には、自分にとっても、他の人にとっても役に立つのではないか、と思った次第です。
「温故知新」という言葉があります。「子曰く、故きを温ねて、新しきを知れば、以って師と為るべし」という孔子の言葉だそうですが、私はこの言葉がとても好きです。
世代の違いもあって、「故きを温ねる」という機会が減っているのではないか、と思うことが多々あります。なので、まずは「故きを温ねる」というプロセスの中で、自分が獲得してきたことを、まとめてみたいと思っています。
なぜ今なのか
エンタープライズITの世界でデータベースや基盤のエンジニアだった自分が、データ分析・アナリティクス関連の業務を手掛けるようになって3~4年経ちました。
自分自身はアナリストでもデータサイエンティストでもないので、データ分析の深いところはほとんど手掛けていないのですが、それ以外の領域についてはそれなりに経験してきたという自負はあります。
そして、一通りこなした今だからこそ、自分の経験を振り返って俯瞰して見ることができるのではないかと最近感じるようになってきました。
そのような中で、数年かけて自分が学んできたこと、経験してきたこと、あるいはその結果として今考えていることを(今後の自分のためにも)明文化しておきたいと思うようになってきたのが最初の理由です。
また、先日後輩と会話をしていた際、アナリティクスのためのデータウェアハウスのモデリングに苦労しているという話を聞き、「あぁなんか自分も同じような道を通ってきたなぁ」と感じるとともに、「自分が経験して学んできたことを、そのプロセスも含めて明文化して伝えられるようにしておく必要性とタイミング」を感じたからでもあります。
とは言え、自分の中でもまだ網羅的・体系的に整理できているわけではないので、このような「Musings」というメモのような形の断片的なアウトプットになってしまうかと思いますが、アウトプットしておくことによって、後からもっとうまく整理したり crystallize できるようになるのではないか、と考えています(願望)。
誰が書くのか
著者は Satoshi Nagayasu です。
バックグラウンドはデータベーステクノロジーのエンジニア、SIにおける基盤やデータセンターのエンジニアで、データ分析・アナリティクス界隈に足を踏み入れて3~4年になります。
ヘルスケア業界におけるアナリティクスのためのデータベース構築(レセプトや健康診断データ)、メディア業界におけるデータウェアハウス構築やデータマネジメント、データガバナンス等々を手掛けてきました。
詳細なプロフィールなどなどは以下をご覧ください。
こんなイベントでしゃべったり、
こんなブログを書いたりしています。
今度、こんなイベントもやります。
まとめ
というわけで、まずは所信表明と自己紹介的なエントリということで。
次回以降、具体的なエントリを書いていきたいと思います。
では。