INDING Group 基于序列信息的特征 2.位置权重氨基酸组分(PWAA) 给定一个氨基酸残基a:(i=1,2,…,20),a:在长度为2L+1的序列P中的位置信 息可以表示为: G=m西名9=-00 其中,L表示蛋白质序列P的中心点上游或下游残基的数目;如果α是蛋白质序 列P中的第j个位置的残基,则x=1,否则x=0。据此,基于PWAA的特征 维度为20 10
10 基于序列信息的特征 2. 位置权重氨基酸组分 (PWAA) 给定一个氨基酸残基 𝑎𝑖 𝑖 = 1, 2, ⋯ , 20 , 𝑎𝑖在长度为 2𝐿 + 1 的序列 𝑃 中的位置信 息可以表示为: 𝐶𝑖 = 1 𝐿 𝐿 + 1 𝑗=−𝐿 𝐿 𝑥𝑖,𝑗 𝑗 + |𝑗| 𝐿 𝑗 = −𝐿, ⋯ , 0, ⋯ , 𝐿 其中, 𝐿 表示蛋白质序列 𝑃 的中心点上游或下游残基的数目;如果 𝑎𝑖是蛋白质序 列 𝑃 中的第 𝑗 个位置的残基,则𝑥𝑖,𝑗 = 1 ,否则𝑥𝑖,𝑗 = 0 。据此,基于PWAA的特征 维度为20
INDING Group 基于物化性质的特征 1.氨基酸索引(AAindex) AAindex database AAindex Alpha-螺旋的归一化频率 Amino acid indices,substitution matrices and pair-wise contact potentials 多跨膜蛋白的氨基酸组分 提取表现最佳的12种物化性质 结晶水体积 基于序列长度31bp,AAindexl的特征维度为31*12=372 11
11 基于物化性质的特征 1. 氨基酸索引(AAindex) AAindex database 提取表现最佳的12种物化性质 Alpha-螺旋的归一化频率 多跨膜蛋白的氨基酸组分 结晶水体积 . . . 基于序列长度31bp,AAindex的特征维度为31*12 = 372