Pengyu Chen

PLSA理论与实践

PLSA理论与实践 PLSA又称为概率潜在语义分析,是一种利用概率生成模型对文本集合进行话题分析的无监督学习方法。该模型最大的特点是加入了主题这一隐变量,文本生成主题,主题生成单词,从而得到单词-文本共现矩阵。本文将对包含物理学、计算机科学、统计学、数学四个领域的15000条文献摘要的数据集(保存在Task-Corpus.csv中)使用PLSA算法进行处理。 一、算法推导 1.1 E-...

实对称矩阵的同时对角化

学习凸优化的时候遇到了实对称矩阵的同时对角化的问题,发现自己线性代数忘得差不多了。查阅了一些资料之后整理一下有关的定理,有些比较繁琐的证明就不写了。注意,下面未经说明都是实矩阵。 如果存在可逆矩阵$P$,使得$P^{-1}AP = diag(\lambda_1,\cdots,\lambda_n)$,则称$A$可以相似对角化。 如果存在可逆矩阵$P$,使得$P^TAP = diag(\mu...