RNN-T

主要问题就是和CTC一样有很多的alignment，采用类似的思想有forward和backward变量（这次看完李宏毅的推导对为什么一定要有两个理解更深刻了）
forward&backword variable
- 就是一动态规划，所有路径经过标签（t，u）并emit出s的概率 = 前半部分 α × 后半部分 β × 当前帧概率
  - 定义$\alpha (t,u) = P(到达(t,u))$，$\beta(t,u) = P(从(t,u)到终点)$
  - 递推的时候就两种情况（就是横着走和竖着走）初始值是(1,0) = 1
    - $α(t-1,u)*P_{t-1,u}(\phi)$
    - $\alpha(t,u-1)*P_{t,u-1}(token_u)$
- backward和forward是差不多的，只是方向相反（边界条件是beta(T,U)=1）
算loss的时候利用链式法则，LM部分的就是一般的那样子，另外一部分就是按照DP这样子算