奇思妙想

记录一些觉得有用的点子,公式推导等。当成便利贴来使用的。23333

条件联合分布的推导

首先搞清楚逗号是与的意思,把逗号去掉,加个括号就好理解了。

$P(S,A|T)$:事件T发生的条件下,事件S、A均发生的概率。直接把逗号给去掉,就是$P((SA)|T)$竖线的优先级别高。因此有:$P(S,A|T)=\frac{P(SAT)}{P(T)}$

$P(S|A,T)$ :事件A、T均发生的条件下,事件S发生的概率 。

上式的证明如下:

贝叶斯估计

根据现有的数据样本集D估计一个新的样本的分布$x$即$P(x|D)$.通过D引入$\theta$,然后通过$\theta$来估计x的分布$p(x|\theta)$

关于第一步$P(x|D)=\int P(x,\theta|D)d\theta$ 的理解在D条件下的联合分布对另一个变量求积分,就得到了一个边缘分布,不过这个边缘分布是在D条件下的。

点子

  1. 目标函数不可导的情况下优化:遗传算法
  2. 中文OCR:github上的开源项目:chinese_ocr
  3. 科研:深度学习前沿领域的bench ,NLP中:中文的Bench? GLUE:的冗余分析?
  4. 从指令的角度去研究能耗的情况?微观上的指令比例与宏观应用上的差别?去判断负载是否合理?
    1. 不同指令集上的常用指令的能效?
    2. 微观的负载与宏观上的应用的能效是否有差别?从二者的指令比例去分析。
    3. 量化之后通过分析指令比例就能推导出负载的能耗情况。
  5. C语言局部变量的数组(位于栈)在声明时就需要指定具体的大小值,用常量指定,而不能用变量指定。如果需要用变量指定,则只能使用malloc来分配在堆上。

待解决的问题

  1. 矩阵的特征值的个数怎么判断的?重根的情况。
  2. 算出来特征向量任意取的情况,KL变换的变换矩阵还有什么作用呢?
  3. Adaboost为什么要求迭代后的更新的权重使得上一轮的学习器在这轮的性能为随机猜测呢?
  4. 什么是浮点运算?加减乘除都各自算一次浮点运算吗?
    1. 都各自只算做一次浮点运算。

工具

sublime text 激活:

http://wordjian.com/2019/10/03/sublime/#%E6%90%9E%E8%B5%B7%EF%BC%8C%E6%90%9E%E8%B5%B7