Table of Contents
因果推論リサーチの構成要素
構成要素 | 説明 |
---|---|
Research Question | the causal relationship of interestはなにか? |
Theory | 参考となる理論モデルはあるか?その理論モデルからどのような仮説が導き出されるか? |
Ideal Experiment | the causal effect of interestを推定するにあたって理想的な実験はなにか? |
Data Set | 使われているデータセットは何か? the causal relationship of interestを特定するのに役立つ特徴はなにか? データセットには欠点があるか? |
Descriptive Evidence | 対象となる変数の間に関係があることを示唆する記述的証拠(相関関係)は何か? |
Identification Strategy | An identification strategyとは研究者が観察データ(すなわち、無作為化試験によって生成されていないデータ)を実際の実験に近づけるために使用する方法のこと 説明変数の内生性の問題は、論文の中では議論されているか? regressorsのvariationはどのようにして発生しているのか? 推定式に含まれていない変数の影響はあるか? missing variableによって発生するバイアスの方向性はどのようなものか? 他の潜在的なバイアスの原因は考えられるか? 偏りの原因ごとに,データ生成プロセス、推定式、推定量を書く その推定量が偏っている理由を説明する |
Discussion | さらにどのようなロバストネスチェックを行うことができるか? |
Conclusion | なぜあなたの結果は重要なのか?どのようなpolicy implicationが考えられるか? |
リサーチヒアリングメモの原則
ルール
- リサーチヒアリングメモはstand alone documentとして成立することが望ましい
- 一文を短く,目安として一文が4行以上になっていない,長すぎるのは敵
- 口語調を調整する
- 文末に句読点はついていない
Template例
<企業名>_<プロジェクトテーマ>_<会議体>会議体>プロジェクトテーマ>企業名>
Research Question
- Research questionsとAnswerのイメージ
Research Context
- Business Issueはなんなのか?
- 現状わかっていることとわかっていないことはなにか?
- researchがどのように「わかっていること」と「わかっていないこと」のGapを埋めるのか
- researchがどのようにBusiness Issueの解決に寄与するのか?
Identification strategy
- データ収集方法はなにか?
- Dataにはどのようなlimitationが存在するのか?
- どのようなパラメーターを解き明かしたいのか?
- 推定にあたって統計学のどの分析方法を用いるのか
Action Plans
- データ分析環境スペック(言語,データ管理環境,コード管理体制,分析者体制)
- どのようなツールを利用するのか?
- Issue管理ないし分析チケット管理はどのような仕組みで実施するか?
- 分析者体制がプロジェクトリソース(金銭及び稼働時間)と整合的か?
- データ収集工程
- First Trialとしていつまでにどのようなデータを取得するか?
- 取得データのテーブルレイアウト等メタデータはどこで管理するか?
- データ前処理工程
- どのようなデータマートを作成するのか?
- 作成したデータマートのドキュメント資料はどこで管理するのか?
- データ可視化工程
- データ整合性(sanity check)はどのような観点で実施するか?
- どのような観点でEDA(Exploratory Data Analysis)を行うのか?
- estimation and inference工程
- 推定量構築スケジュール
- 推定実施スケジュール
- inference実施スケジュール
- robustness check工程
- 分析report作成工程
- 誰に対して,いつのタイミングで,どのようなトーンで共有するのか?
- 意思決定の場で使われるコミュニケーション様式と分析レポートは整合的か?
- Explanatory Data Analysis(説明的なデータ可視化)の方針はなにか?
上記の各ポイントをを踏まえ上でスケジュール概要について最後に整理
分析レポートにおけるトーンについて
ビジネスの意思決定場面においてInferenceを適切なコミュニケーションプロトコルで意思決定者に伝えるのは結構大変です.この問題は現実の場面場面で要因が異なるので一概に解決策は示すことはできないですが,自分が日々大事にしたいと思っている方針を以下箇条書きで列挙します.
- リサーチで取り扱う内容はあくまで意思決定プロセスの論点の一部分にすぎない限界を認識する
- 過去の意思決定を変更の提言をするときは,かつての意思決定の非を問うのではなく,環境の変化に原因をもとめるなど過去現在の意思決定者をリスペクトする
- 意思決定の場で使われるコミュニケーション様式を守る
References
統計
Python
math
Linux
Ubuntu 20.04 LTS
Shell
English
git
方法論
Ubuntu 22.04 LTS
統計検定
競技プログラミング
フーリエ解析
前処理
SQL
coding
コミュニケーション
Network
ssh
将棋
Data visualization
Docker
Econometrics
VSCode
statistical inference
GitHub Pages
apt
development
システム管理
Coffee
cloud
数値計算
素数
Book
Font
Metrics
Poetry
Ubuntu 24.04 LTS
architecture
aws
shell
systemctl
テンプレート
データ構造
ポワソン分布
会計分析
文字コード
環境構築
論文
App
Bayesian
Dynamic Programming
Keyboard
Processing
R
Steam
filesystem
regex
(注意:GitHub Accountが必要となります)