main.tex 12 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255
  1. %!TEX root = interventions.tex
  2. \section{Interventions}
  3. \subsection{Definition}
  4. \begin{frame}{Interventionen}
  5. \begin{block}{Interventionsverteilung}
  6. Sei $\mathbb{P}^\mathbf{X}$ die zu einer SEM
  7. $\mathcal{S} := (\mathcal{S}, \mathbb{P}^N)$ gehörende Verteilung. \onslide<2->{Dann
  8. kann eine (oder mehr) Strukturgleichungen aus $\mathcal{S}$ ersetzt
  9. werden ohne einen Zyklus im Graphen zu erzeugen.} \onslide<3->{Die Verteilung des
  10. neuen SEM $\tilde{\mathcal{S}}$ heißt dann
  11. \textit{Interventionsverteilung}.}
  12. \onslide<4->{Bei den Variablen, deren Strukturgleichungen ersetzt wurden, sagt man,
  13. wurde \textit{interveniert}.}
  14. \onslide<5->{Die neue Verteilung wird mit
  15. \[\mathbb{P}_{\tilde{\mathcal{S}}}^{\mathbf{X}} = \mathbb{P}_{\mathcal{S}, do(X_j:=\tilde{f}(\tilde{\mathbf{PA}}_j, \tilde{N}_j))}^{\mathbf{X}}\]
  16. beschrieben.}
  17. \onslide<6->{Die Menge der Rauschvariablen in $\mathcal{S}$ beinhaltet nun einige
  18. \enquote{neue} und einige \enquote{alte} $N$'s. $\mathcal{S}$ muss
  19. paarweise unabhängig sein.}
  20. \end{block}
  21. \end{frame}
  22. \begin{frame}{Nieren-Beispiel}
  23. \begin{table}
  24. \begin{tabular}{lrr}
  25. \toprule
  26. ~ & \multicolumn{2}{c}{\textbf{Behandlungserfolg}} \\
  27. \cmidrule{2-3}
  28. ~ & \multicolumn{1}{c}{\textbf{A}} & \multicolumn{1}{c}{\textbf{B}} \\ \midrule
  29. Kleine Nierensteine & \textbf{93\%} & 87\% \\
  30. Große Nierensteine & \textbf{73\%} & 69\% \\
  31. \textbf{Gesamt} & 78\% & \textbf{83\%} \\
  32. \bottomrule
  33. \end{tabular}
  34. \end{table}
  35. \begin{figure}[!h]
  36. \centering
  37. \begin{tikzpicture}[->,>=stealth',shorten >=1pt,auto,node distance=2.5cm,
  38. thick,main node/.style={circle,fill=blue!10,draw,font=\sffamily\Large\bfseries}]
  39. \node (Z) at (1,1) {Z};
  40. \node (T) at (0,0) {T};
  41. \node (R) at (2,0) {R};
  42. \foreach \from/\to in {Z/T,Z/R,T/R}
  43. \draw (\from) -> (\to);
  44. \end{tikzpicture}
  45. \end{figure}
  46. \begin{align*}
  47. Z &= N_Z, \;\;\;& N_Z &\sim Ber(\nicefrac{1}{4})\\
  48. T &= \lfloor 2 \cdot (1-Z+N_T) \rfloor \;\;\; & N_T &\sim \mathcal{N}(0, 1)\\
  49. R &= \lfloor 2 \cdot (0.6 \cdot (1-Z) + 0.4 \cdot (1-T) + N_R) \rfloor \;\;\; & N_R &\sim \mathcal{N}(0, 1)
  50. \end{align*}
  51. \end{frame}
  52. % \begin{frame}{Interventionen: Spezialfälle}
  53. % \begin{block}{Interventionsverteilung}
  54. % Wenn $\tilde{f}(\tilde{\mathbf{PA}_j}, \tilde{N}_j)$ eine Punktmasse
  55. % auf ein $a \in \mathbb{R}$ legt schreibt man
  56. % \[\mathbb{P}_\mathcal{S, do(X_j := \tilde{f}(\tilde{\mathbf{PA}_j}, \tilde{N}_j))}^{\mathbf{X}}\]
  57. % und nennt die Intervention
  58. % \textbf{perfekt}.\\
  59. % Eine Intervention mit $\tilde{\mathbf{PA}_j} = \mathbf{PA}_j$ wird
  60. % \textbf{mangelhaft} genannt.
  61. % \end{block}
  62. % \end{frame}
  63. \begin{frame}[t]{Beispiel 2.2.2: Ursache und Effekt}
  64. Es sei $\mathcal{S}$ gegeben durch
  65. \begin{align}
  66. X &= N_X\\
  67. Y &= 4 \cdot X + N_Y
  68. \end{align}
  69. mit $N_X, N_Y \overset{\text{iid}}{\sim} \mathcal{N}(0, 1)$ und den
  70. Graphen $X \rightarrow Y$.
  71. \only<2-9>{
  72. Dann gilt:
  73. \begin{align}
  74. \mathbb{P}_\mathcal{S}^Y = \mathcal{N}(0, 4^2 + 1) &\onslide<3->{\neq \mathcal{N}(8, 1)} \onslide<4->{= \mathbb{P}_{\mathcal{S}, do(X:=2)}^{Y}} \onslide<5->{= \mathbb{P}_\mathcal{S}^{Y|X=2}}\\
  75. &\onslide<6->{\neq \mathcal{N}(12, 1)} \onslide<7->{= \mathbb{P}_{\mathcal{S}, do(X:=3)}^{Y}} \onslide<8->{= \mathbb{P}_\mathcal{S}^{Y|X=3}}
  76. \end{align}
  77. \onslide<9->{$\Rightarrow$ Intervention auf $X$ beeinflusst die Verteilung von $Y$.}
  78. }
  79. \only<10-13>{
  80. Aber:
  81. \begin{align}
  82. \mathbb{P}_{\mathcal{S}, do(Y:=2)}^{X} &= \mathcal{N}(0, 1)\\
  83. \onslide<11->{&= \mathbb{P}_\mathcal{S}^X}\\
  84. \onslide<12->{&= \mathbb{P}_{\mathcal{S}, do(Y:=3.14159)}^{X}}\\
  85. \onslide<13->{&\neq \mathbb{P}_\mathcal{S}^{X|Y=2}}
  86. \end{align}
  87. }
  88. \only<14->{\\
  89. Beispiel: $X$ (rauchen) $\rightarrow Y$ (weiße Zähne)
  90. \begin{itemize}
  91. \item<15-> Es besteht eine Asymmetrie zwischen Ursache ($X$) und Effekt ($Y$).
  92. \item<16-> $\mathbb{P}_{\mathcal{S}, do(Y:=\tilde{N}_Y)}^{X,Y} \Rightarrow X \perp\!\!\!\perp Y$
  93. \item<17-> $\mathbb{P}_{\mathcal{S}, do(X:=\tilde{N}_X)}^{X,Y} \text{ und } Var(\tilde{N}_X) > 0 \Rightarrow X \not\perp\!\!\!\perp Y$
  94. \end{itemize}
  95. }
  96. \end{frame}
  97. \section{Totaler kausaler Effekt}
  98. \subsection{Totaler kausaler Effekt}
  99. \begin{frame}{Totaler kausaler Effekt}
  100. \begin{block}{Totaler kausaler Effekt}
  101. Gegeben sei ein SEM $\mathcal{S}$. Dann gibt es einen
  102. (totalen) kausalen Effekt von $X$ nach $Y$ genau dann wenn
  103. \[\exists \tilde{N}_X : X \not\!\perp\!\!\!\perp Y \text{ in } \mathbb{P}_{\mathcal{S}, do(X:=\tilde{N}_X)}^{\mathbf{X}}\]
  104. gilt.
  105. \end{block}
  106. \end{frame}
  107. \begin{frame}[t]{Totaler kausaler Effekt: Äquivalenzen}
  108. Folgende Aussagen sind äquivalent:
  109. \begin{enumerate}[label=(\roman*)]
  110. \item $\exists \tilde{N}_{X_1} \hphantom{\text{ mit vollem Support }}: X_1 \not\!\perp\!\!\!\perp X_2 \text{ in } \mathbb{P}_{\mathcal{S}, do(X_1:=\tilde{N}_{X_1})}^{\mathbf{X}}$
  111. \item $\exists x^\triangle \exists x^\square: \mathbb{P}_{\mathcal{S}, do(X_1:=x^\triangle)}^{X_2} \neq \mathbb{P}_{\mathcal{S}, do(X_1:=x^\square)}^{X_2}$
  112. \item $\exists x^\triangle \hphantom{\exists x^\square}: \mathbb{P}_{\mathcal{S}, do(X_1:=x^\triangle)}^{X_2} \neq \mathbb{P}_\mathcal{S}^{X_2}$.
  113. \item $\forall \tilde{N}_{X_1} \text{ mit vollem Support }: X_1 \not\!\perp\!\!\!\perp X_2 \text{ in } \mathbb{P}_{\mathcal{S}, do(X_1:=\tilde{N}_{X_1})}^{\mathbf{X}}$
  114. \end{enumerate}
  115. \only<2>{
  116. \textbf{Beweisplan:}\\
  117. (i) $\Rightarrow$ (ii) $\Rightarrow$ (iv) $\Rightarrow$ (i)\\
  118. $\neg$(i) $\Rightarrow$ $\neg$ (iii) äquivalent zu (iii) $\Rightarrow$ (i)\\
  119. (ii) $\Rightarrow$ (iii)
  120. }
  121. \only<3-5>{
  122. \begin{align}
  123. p_{\mathcal{S}, do(X_1:=x_1)}^{X_2}(x_2) &= \int \prod_{j \neq 1} p_j(x_j|x_{pa(j)}) \mathrm{d}x_3 \dots \mathrm{d}x_p \nonumber
  124. \only<4->{\\&= \int \prod_{j \neq 1} p_j(x_j|x_{pa(j)}) \frac{\tilde{p}(x_1)}{\tilde{p}(x_1)}\mathrm{d}x_3 \dots \mathrm{d}x_p \nonumber}
  125. \only<5->{\\&= p_{\mathcal{S}, do(X_1:=\tilde{N}_1)}^{X_2 | X_1=x_1}(x_2)\tag{A.1}\label{eq:A.1}}
  126. \end{align}
  127. \only<5->{mit $\tilde{p}(x_1) > 0$.}
  128. }
  129. \only<6>{
  130. \begin{align}
  131. X_2 \not\perp\!\!\!\perp X_1 \text{ in } \mathbb{Q} \Leftrightarrow &\exists x_1^\triangle, x_1^\square \nonumber\\
  132. &\text{mit } q(x_1^\triangle), q(x_1^\square) > 0\nonumber\\
  133. &\text{und } \mathbb{Q}^{X_2|X_1=x_1^\triangle} \neq \mathbb{Q}^{X_2 | X_1=x_1^\square}\tag{A.2}\label{eq:A.2}
  134. \end{align}
  135. }
  136. \only<7>{
  137. \begin{align}
  138. X_2 \not\perp\!\!\!\perp X_1 \text{ in } \mathbb{Q} \Leftrightarrow &\exists x_1^\triangle \nonumber\\
  139. &\text{mit } q(x_1^\triangle) > 0\nonumber\\
  140. &\text{und } \mathbb{Q}^{X_2|X_1=x_1^\triangle} \neq \mathbb{Q}^{X_2}\tag{A.3}\label{eq:A.3}
  141. \end{align}
  142. }
  143. \only<8-10>{
  144. \textbf{Beweisplan:} (i) $\Rightarrow$ (ii)\\
  145. \onslide<9->{(i) $\overset{A.2}{\Rightarrow} \exists x_1^\triangle, x_1^\square$ mit
  146. pos. Dichte unter $\tilde{N_1}$ sodass $\mathbb{P}_{\mathcal{S}, do(X_1:=\tilde{N_1})}^{X_2|X_1=x_1^\triangle} \neq \mathbb{P}_{\mathcal{S}, do(X_1:=\tilde{N_1})}^{X_2 | X_1=x^\square}$\\}
  147. \onslide<10->{$\overset{A.1}{\Rightarrow} (ii)$}
  148. }
  149. \only<11-13>{
  150. \textbf{Beweisplan:} (ii) $\Rightarrow$ (iv)\\
  151. \onslide<12->{(ii) $\overset{A.1}{\Rightarrow} \exists x_1^\triangle, x_1^\square$ mit pos. Dichte unter $\hat{N_1}$ sodass $\mathbb{P}_{\mathcal{S}, do(X_1:=\hat{N_1})}^{X_2|X_1=x_1^\triangle} \neq \mathbb{P}_{\mathcal{S}, do(X_1 := \hat{N_1})}^{X_2 | X_1 = x_1^\square}$}
  152. \onslide<13->{$\overset{A.2}{\Rightarrow} (iv)$}
  153. }
  154. \only<14>{
  155. \textbf{Beweisplan:} (iv) $\Rightarrow$ (i)\\
  156. Trivial
  157. }
  158. \only<15-17>{
  159. \textbf{Beweisplan:} $\neg$(i) $\Rightarrow$ $\neg$ (iii)\\
  160. \onslide<16->{Es gilt: $\mathbb{P}_\mathcal{S}^{X_2} = \mathbb{P}_{\mathcal{S}, do(X_1 := N_1^*)}^{X_2}$, wobei $N_1^*$ wie $\mathbb{P}_\mathcal{S}^{X_2}$ verteilt ist.\\}
  161. \onslide<17->{
  162. \begin{align}
  163. \neg (i) &\Rightarrow X_2 \perp\!\!\!\perp X_1 \text{ in } \mathbb{P}_{\mathcal{S}, do(X_1 := N_1^*)}^{\textbf{X}}\\
  164. &\overset{A.3}{\Rightarrow} \mathbb{P}_{\mathcal{S}, do(X_1 :=N_1^*)}^{X_2| X_1=x^\triangle} = \mathbb{P}_{\mathcal{S}, do(X_1 := N_1^*)}^{X_2} \;\;\;\forall x^\triangle \text{ mit } p_1(x^\triangle) > 0\\
  165. &\overset{A.1}{\Rightarrow} \mathbb{P}_{\mathcal{S}, do(X_1:=x^\triangle)}^{X_2} = \mathbb{P}_\mathcal{S}^{X_2} \;\;\; \forall x^\triangle \text{ mit } p_1(x^\triangle) > 0\\
  166. &\overset{\neg (ii)}{\Rightarrow} \neg (iii)
  167. \end{align}
  168. }
  169. }
  170. \only<18>{
  171. \textbf{Beweisplan:} (ii) $\Rightarrow$ (iii)\\
  172. Trivial (TODO: wirklich?)
  173. }
  174. \end{frame}
  175. \begin{frame}{Beispiel 2.2.6: Randomisierte Studie}
  176. \begin{itemize}
  177. \item<1-> Weise eine Behandlung $T$ zufällig (nach $\tilde{N_T}$) einem
  178. Patienten zu. Das könnte auch ein Placebo sein.
  179. \item<2-> Im SEM: Daten aus $\mathbb{P}_{\mathcal{S}, do(T:=\tilde{N_T})}^{\mathbf{X}}$
  180. \item<3-> Falls immer noch Abhängigkeit zw. Behandlung und Erfolg
  181. vorliegt $\Rightarrow T$ hat einen totalen kausalen Effekt auf
  182. den Behandlungserfolg.
  183. \end{itemize}
  184. \end{frame}
  185. \begin{frame}{Beispiel 2.2.7: Nicolai's running-and-health Beispiel}
  186. Das zugrundeliegende (\enquote{wahre}) SEM $\mathcal{S}$, welches die Daten
  187. generierte, hat die Form:
  188. \begin{align}
  189. A &= N_A &&\text{mit } N_A \sim Ber(\nicefrac{1}{2})\\
  190. H &= A + N_H \mod 2 &&\text{mit } N_H \sim Ber(\nicefrac{1}{3})\\
  191. B &= H + N_B \mod 2 &&\text{mit } N_B \sim Ber(\nicefrac{1}{20})
  192. \end{align}
  193. mit dem Graphen $A \rightarrow H \rightarrow B$ und\\
  194. $N_A, N_H, N_B$ unabhängig.
  195. \begin{itemize}
  196. \item<1-> $B$ ist hilfreicher für die Vorhersage von $H$ als $A$.
  197. \item<2-> Intervention von $A$ hat auf $H$ einen größeren Einfluss als Intervention von $B$.
  198. \end{itemize}
  199. \end{frame}
  200. \begin{frame}{Proposition 2.2.9}
  201. \begin{enumerate}[label=(\roman*)]
  202. \item<1-> Falls es keinen gerichteten Pfad von $X$ nach $Y$ gibt, dann
  203. gibt es keinen kausalen Effekt.
  204. \item<2-> Manchmal gibt es einen gerichteten Pfad, aber keinen kausalen
  205. Effekt.
  206. \end{enumerate}
  207. \onslide<3->{Beweis von (i): Folgt aus der Markov-Eigenschaft des
  208. interventierten SEMs. }\onslide<4->{Nach dem Entfernen der
  209. in $X$ eingehenden Kanten gilt: $X$ und $Y$ sind
  210. $d$-separiert, falls es keinen direkten Pfad von $X$ nach
  211. $Y$ gibt. \\}
  212. \onslide<5->{Beweis von (ii) durch Gegenbeispiel: Sei
  213. \begin{align}
  214. X &= N_X\\
  215. Z &= 2X + N_Z\\
  216. Y &= 4X - 2Z + N_Y
  217. \end{align}
  218. Dann gilt: $Y = - 2N_Z + N_Y$ und daher $X \perp\!\!\!\perp$ für alle $N_X$. $\square$
  219. }
  220. \end{frame}
  221. % \begin{frame}{Nierensteine}
  222. % \begin{columns}
  223. % \begin{column}{0.45\textwidth}
  224. % \begin{center}\textbf{Modell A}\end{center}
  225. % \end{column}
  226. % \begin{column}{0.45\textwidth}
  227. % \begin{center}\textbf{Modell B}\end{center}
  228. % \end{column}
  229. % \end{columns}
  230. % \end{frame}