国家知识产权局局长令
(第15号)
根据中国专利行业标准在制定中要为社会公众服务、为国家宏观决策服务、为行业管理部门管理服务的指导思想,依据 专利法实施细则第 18条第4款的规定,特制定《核苷酸和/或氨基酸序列表和序列表电子文件标准》,现予公布,自二00一年十一月一日起施行。附录1 核苷酸和氨基酸符号和特征关键词表
┌───┬──────────────────┬───────────┐
│ 符号 │ 含义 │ 名称的来源 │
├───┼──────────────────┼───────────┤
│ a │ A │ 腺嘌呤 │
├───┼──────────────────┼───────────┤
│ g │ G │ 鸟嘌呤 │
├───┼──────────────────┼───────────┤
│ c │ C │ 胞嘧啶 │
├───┼──────────────────┼───────────┤
│ t │ T │ 胸腺嘧啶 │
├───┼──────────────────┼───────────┤
│ r │ g或a │ 嘌呤 │
├───┼──────────────────┼───────────┤
│ y │ t/u或c │ 嘧啶 │
├───┼──────────────────┼───────────┤
│ m │ a或c │ 氨基 │
├───┼──────────────────┼───────────┤
│ k │ g或t/u │ 酮基 │
├───┼──────────────────┼───────────┤
│ s │ g或c │ 弱作用 │
│ │ │ 3H键 │
├───┼──────────────────┼───────────┤
│ w │ a或t/u │ 强作用 │
│ │ │ 2H键 │
├───┼──────────────────┼───────────┤
│ b │ g或c或t/u │ 非a │
├───┼──────────────────┼───────────┤
│ d │ a或g或t/u │ 非c │
├───┼──────────────────┼───────────┤
│ h │ a或c或t/u │ 非g │
├───┼──────────────────┼───────────┤
│ v │ a或g 或c │ 非t,非u │
├───┼──────────────────┼───────────┤
│ n │ a或g或c或t/u,未知,或其它 │ 任何 │
└───┴──────────────────┴───────────┘
┌────┬─────────────────────────────┐
│ 符号 │ 含义 │
├────┼─────────────────────────────┤
│ ac4c │4-乙酰胞苷 │
├────┼─────────────────────────────┤
│ chm5u │5-(羧羟甲基)尿苷 │
├────┼─────────────────────────────┤
│ cm │2'-O-甲基胞苷 │
├────┼─────────────────────────────┤
│cmnm5s2u│5-羧甲基氨甲基-2-硫代尿苷 │
├────┼─────────────────────────────┤
│ cmnm5u │5-羧甲基氨甲基尿苷 │
├────┼─────────────────────────────┤
│ d │二氢尿苷 │
├────┼─────────────────────────────┤
│ fm │2'-O-甲基假尿苷 │
├────┼─────────────────────────────┤
│ gal q │β,D-半乳糖Q核苷 │
├────┼─────────────────────────────┤
│ gm │2'-O-甲基鸟苷 │
├────┼─────────────────────────────┤
│ i │肌苷 │
├────┼─────────────────────────────┤
│ i6a │N6-异戊烯基腺苷 │
├────┼─────────────────────────────┤
│ mla │1-甲基腺苷 │
├────┼─────────────────────────────┤
│ mlf │1-甲基假尿苷 │
├────┼─────────────────────────────┤
│ mlg │1-甲基腺苷 │
├────┼─────────────────────────────┤
│ mli │1-甲基肌苷 │
├────┼─────────────────────────────┤
│ m22g │2'2-二甲基腺苷 │
├────┼─────────────────────────────┤
│ m2a │2-甲基腺苷 │
├────┼─────────────────────────────┤
│ m2g │2-甲基鸟苷 │
├────┼─────────────────────────────┤
│ m3c │3-甲基胞苷 │
├────┼─────────────────────────────┤
│ m5c │5-甲基胞苷 │
├────┼─────────────────────────────┤
│ m6a │N6-甲基腺苷 │
├────┼─────────────────────────────┤
│ m7g │7-甲基鸟苷 │
├────┼─────────────────────────────┤
│ mam5u │5-甲基氨基甲基尿苷 │
├────┼─────────────────────────────┤
│mam5s2u │5-甲氧基氨基甲基-2-硫代尿苷 │
├────┼─────────────────────────────┤
│ man q │β,D-甘露糖Q核苷 │
├────┼─────────────────────────────┤
│mcm5s2u │5-甲氧基羰基甲基-2-硫代尿苷 │
├────┼─────────────────────────────┤
│ mcm5u │5-甲氧基羰基甲基尿苷 │
├────┼─────────────────────────────┤
│ mo5u │5-甲氧基尿苷 │
├────┼─────────────────────────────┤
│ ms2i6a │2-硫代甲基-N6-异戊烯基腺苷 │
├────┼─────────────────────────────┤
│ ms2t6a │N-((9-β-D-呋喃核糖基-2-硫代甲基嘌呤-6-Y │
│ │Yl)氨基甲酰)苏氨酸 │
├────┼─────────────────────────────┤
│ mt6a │N-((9-β-D-呋喃核糖嘌呤-6-yl)N-甲基氨基甲酰 │
│ │)苏氨酸 │
├────┼─────────────────────────────┤
│ mv │尿苷-5-氧化乙酸-甲基酯 │
├────┼─────────────────────────────┤
│ o5u │尿苷-5-氧化乙酸 │
├────┼─────────────────────────────┤
│ osyw │Wybutoxosine │
├────┼─────────────────────────────┤
│ p │假尿苷 │
├────┼─────────────────────────────┤
│ q │Q核苷 │
├────┼─────────────────────────────┤
│ s2c │2-硫代胞苷 │
├────┼─────────────────────────────┤
│ s2t │5-甲基-2硫代尿苷 │
├────┼─────────────────────────────┤
│ s2u │2-硫代尿苷 │
├────┼─────────────────────────────┤
│ s4u │4-硫代尿苷 │
├────┼─────────────────────────────┤
│ t │5-甲基尿苷 │
├────┼─────────────────────────────┤
│ t6a │N-((9-β-D-呋喃核糖嘌呤-6-基)-氨基甲酰)苏氨│
│ │酸 │
├────┼─────────────────────────────┤
│ tm │2'-O-甲基-5-甲基尿苷 │
├────┼─────────────────────────────┤
│ um │2'-O-甲基尿苷 │
├────┼─────────────────────────────┤
│ yw │Wybutosine │
├────┼─────────────────────────────┤
│ x │3-(3-氨基-3-羧基-丙其)尿苷,(acp3)u │
└────┴─────────────────────────────┘
┌──────────────┬───────────────────┐
│ 符号 │ 含义 │
├──────────────┼───────────────────┤
│ Ala │ 丙氨酸 │
├──────────────┼───────────────────┤
│ Cys │ 半胱氨酸 │
├──────────────┼───────────────────┤
│ Asp │ 天冬氨酸 │
├──────────────┼───────────────────┤
│ Glu │ 谷氨酸 │
├──────────────┼───────────────────┤
│ Phe │ 苯丙氨酸 │
├──────────────┼───────────────────┤
│ Gly │ 甘氨酸 │
├──────────────┼───────────────────┤
│ His │ 组氨酸 │
├──────────────┼───────────────────┤
│ Ile │ 异亮氨酸 │
├──────────────┼───────────────────┤
│ Lys │ 赖氨酸 │
├──────────────┼───────────────────┤
│ Leu │ 亮氨酸 │
├──────────────┼───────────────────┤
│ Met │ 蛋氨酸 │
├──────────────┼───────────────────┤
│ Asn │ 天冬酰酸 │
├──────────────┼───────────────────┤
│ Pro │ 脯氨酸 │
├──────────────┼───────────────────┤
│ Gln │ 谷氨酰胺 │
├──────────────┼───────────────────┤
│ Arg │ 精氨酸 │
├──────────────┼───────────────────┤
│ Ser │ 丝氨酸 │
├──────────────┼───────────────────┤
│ Thr │ 苏氨酸 │
├──────────────┼───────────────────┤
│ Val │ 缬氨酸 │
├──────────────┼───────────────────┤
│ Trp │ 色氨酸 │
├──────────────┼───────────────────┤
│ Tyr │ 酪氨酸 │
├──────────────┼───────────────────┤
│ Asx │ 天冬氨酸或天冬酰胺 │
├──────────────┼───────────────────┤
│ Glx │ 谷氨酸或谷氨酰胺 │
├──────────────┼───────────────────┤
│ Xaa │ 未知或其它 │
└──────────────┴───────────────────┘
┌─────────────┬────────────────────┐
│ 符号 │ 含义 │
├─────────────┼────────────────────┤
│ Aad │2-氨基已二酸 │
├─────────────┼────────────────────┤
│ bAad │3-氨基已二酸 │
├─────────────┼────────────────────┤
│ bAla │β一丙氨酸,β一氨基丙酸 │
├─────────────┼────────────────────┤
│ Abu │2-氨基丁酸 │
├─────────────┼────────────────────┤
│ 4Abu │4-氨基丁酸,哌啶酸 │
├─────────────┼────────────────────┤
│ Acp │6-氨基已酸 │
├─────────────┼────────────────────┤
│ Ahe │2-氨基庚酸 │
├─────────────┼────────────────────┤
│ Aib │2-氨基异丁酸 │
├─────────────┼────────────────────┤
│ bAib │3-氨基异丁酸 │
├─────────────┼────────────────────┤
│ Apm │2-氨基庚二酸 │
├─────────────┼────────────────────┤
│ Dbu │2,4二氨基丁酸 │
├─────────────┼────────────────────┤
│ Des │赖氨素 │
├─────────────┼────────────────────┤
│ Dpm │2,2'-二氨基庚二酸 │
├─────────────┼────────────────────┤
│ Dpr │2,3-二氨基丙酸 │
├─────────────┼────────────────────┤
│ EtGly │N-乙基甘氨酸 │
├─────────────┼────────────────────┤
│ EtAsn │N-乙基天冬氨酸 │
├─────────────┼────────────────────┤
│ Hyl │羟基赖氨酸 │
├─────────────┼────────────────────┤
│ aHyl │别-羟基赖氨酸 │
├─────────────┼────────────────────┤
│ 3Hyp │3-羟基脯氨酸 │
├─────────────┼────────────────────┤
│ 4Hyp │4-羟基脯氨酸 │
├─────────────┼────────────────────┤
│ Ide │异赖氨素 │
├─────────────┼────────────────────┤
│ aIle │别-异亮氨酸 │
├─────────────┼────────────────────┤
│ MeGly │N-甲基甘氨酸,肌氨酸 │
├─────────────┼────────────────────┤
│ MeIle │N-甲基异亮氨酸 │
├─────────────┼────────────────────┤
│ MeLys │6-N-甲基赖氨酸 │
├─────────────┼────────────────────┤
│ MeVal │N-甲基缬氨酸 │
├─────────────┼────────────────────┤
│ Nva │正缬氨酸 │
├─────────────┼────────────────────┤
│ Nle │正亮氨酸 │
├─────────────┼────────────────────┤
│ Orn │鸟氨酸 │
└─────────────┴────────────────────┘
┌─────────┬───────────────────────────┐
│ 关键词 │ 说明 │
├─────────┼───────────────────────────┤
│ allele │相关的个体或菌株含有相同基因的稳定的其它形式,该形式区│
│ │别于这一位置的现有的序列(和或许其它序列) │
├─────────┼───────────────────────────┤
│ attenuator │存在调节转录的终止的DNA区域,它控制了一些细菌操纵子的 │
│ │表达; │
│ │(2)位于启动子和第一个结构基因之间,引起转录的部分终止 │
│ │的序列区段 │
├─────────┼───────────────────────────┤
│ C_region │免疫球蛋白轻和重链的恒定区,和T-细胞受体α,β,和γ链│
│ │;根据特定的链可包括一个或多个外显子 │
├─────────┼───────────────────────────┤
│ CAAT_signal │CAAT盒;位于可能参与RNA聚合酶结合的真核生物转录单位的 │
│ │起始点的75bp上游的保守序列的一部分;共有序列=GG(C或T) │
│ │CAATCT │
├─────────┼───────────────────────────┤
│ CDS │编码序列;对应于蛋白质中的氨基酸序列的核苷酸的序列(位 │
│ │置包括终止密码子);特征包括氨基酸概念上的翻译 │
├─────────┼───────────────────────────┤
│ Conflict │在这一位点或区域,单独确定的“相同”序列有所不同 │
├─────────┼───────────────────────────┤
│ D-loop │置换环;线粒体DNA内的一个区域,其中RNA的短的序列与DNA │
│ │的一条链配对,代替了这一区域的原始配对DNA链;也用于说 │
│ │明在RecA蛋白质催化的反应中,侵入的单链替代双链DNA的一 │
│ │条链的区域 │
├─────────┼───────────────────────────┤
│ D-segment │免疫球蛋白重链的多变区,和T-细胞受体的β链 │
├─────────┼───────────────────────────┤
│ Enhancer │顺式-作用序列,它增强了(一些)真核生物启动子的作用并能 │
│ │在任一方向和与启动子相关的任何位置处(上游或下游)起作用│
├─────────┼───────────────────────────┤
│ Exon │编码剪接mRNA部分的基因组区域;可以含有5'UTR,所有CDS,│
│ │和3'UTR │
├─────────┼───────────────────────────┤
│ GC_signal │GC盒;位于真核生物转录单位起始点上游的保守的富含GC区域│
│ │,可以以多重拷贝或任一方向存在;共有序列=GGGCGG │
├─────────┼───────────────────────────┤
│ gene │鉴定为基因的生物学意义的区域,并已经指定名称始点上游的│
│ │保守的富含GC区域,可以以多重拷贝或任一方向存在;共有序│
│ │列=GGGCGG │
├─────────┼───────────────────────────┤
│ iDNA │间插DNA;通过几种重组中的任何一种能被消除的DNA │
├─────────┼───────────────────────────┤
│ intron │被转录的DNA区段,但通过同时剪接位于其两侧的序列(外显子│
│ │)即可从转录本内部将其除去 │
├─────────┼───────────────────────────┤
│ J_segment │免疫球蛋白轻链和重链的连接区段,和T-细胞受体α,β和γ│
│ │链 │
├─────────┼───────────────────────────┤
│ LTR │长的末端重复,在确定序列的两端直接重复的序列,类型典型│
│ │地见于逆转录病毒中 │
├─────────┼───────────────────────────┤
│ mat_peptide │成熟的肽或蛋白质的编码序列;翻译后修饰之后成熟的或最终│
│ │的肽或蛋白质产物的编码序列;位置不包括终止密码子(与相 │
│ │应的CDS不同) │
├─────────┼───────────────────────────┤
│ misc_binding │不能用任何其它Binding关键词(primer_bind或protein_bind)│
│ │表述的与另一个组成成分共价或非-共价结合的核酸中的位点 │
├─────────┼───────────────────────────┤
│ misc_difference │特征序列与记载中存在的有所不同,并且不能用任何其它不同│
│ │关键词(conflict,unsure,old_sequence,mutation, │
│ │variation,allele或modified_base)表述 │
├─────────┼───────────────────────────┤
│ misc_feature │不能用任何其它的特征关键词表述的具有生物学意义的区域;│
│ │新的或少见的特征 │
├─────────┼───────────────────────────┤
│ misc_recomb │任何一般性的,位点特异性的或复制的重组事件的位点,该位│
│ │点中有不能用其它重组关键词(iDNA和virion)或来源关键词的│
│ │修饰词(/transposon,/proviral)表述的双螺旋DNA的断裂和 │
│ │愈合 │
├─────────┼───────────────────────────┤
│ misc_RNA │不能用其他RNA关键词(prim_transcript,precursor_RNA, │
│ │mRNA,5'clip,3'clip,5'UTR,3'UTR,exon,CDS,sig_ │
│ │peptide,transit__ __peptide,mat_peptide,intron, │
│ │polyA_site,rRNA,tRNA,scRNA和snRNA)限定的任何转录本 │
│ │或RNA产物 │
├─────────┼───────────────────────────┤
│ misc_signal │含有控制或改变基因功能或表达之信号的任何区域,所述信号│
│ │不能用其他Signal关键词(promoter,CAAT_signal,TATA_ │
│ │signal,-35_signal,10_signal,GC_signal,RBS,polyA_ │
│ │signal,enhancer,attenuator,terminator,和rep_ │
│ │origin)表述 │
├─────────┼───────────────────────────┤
│ misc_structure │不能用其他Structure关键词(stem_loop和D-loop)表述的任何│
│ │二级或三级结构或构象 │
├─────────┼───────────────────────────┤
│ modified_base │被指示的核苷酸是经修饰的核苷酸,并应由被指示的分子(在 │
│ │mod_base修饰词意义中给出)所取代 │
├─────────┼───────────────────────────┤
│ mRNA │信使RNA;包括5'非翻译区(5'UTR),编码序列(CDS,外显子) │
│ │和3'非翻译区(3'UTR) │
├─────────┼───────────────────────────┤
│ mutation │在此位置处,相关品系的序列中具有突然的,可遗传的变化 │
├─────────┼───────────────────────────┤
│ N_region │在重排的免疫球蛋白区段之间插入的额外的核苷酸 │
├─────────┼───────────────────────────┤
│ Old_sequence │在此位置处,所表述的序列修改了此序列以前的版本 │
├─────────┼───────────────────────────┤
│ PolyA_signal │聚腺苷酸化之后内切核酸酶裂解RNA转录本所必需的识别区域 │
│ │;共有序列=AATAAA │
├─────────┼───────────────────────────┤
│ PolyA_site │RNA转录本上的位点,通过转录后聚腺苷酸化该位点将被加上 │
│ │腺嘌呤残基 │
├─────────┼───────────────────────────┤
│ Precursor_RNA │仍不是成熟的RNA产物的任何RNA种类;可包括5'剪切区(5' │
│ │clip),5'非翻译区(5'UTR),编码序列(CDS,外显子),间插 │
│ │序列(内含子),3'非翻译区(3'UTR),和3'剪切区(3'clip) │
├─────────┼───────────────────────────┤
│ prim_transcript │初级(最初的,未加工的)转录本;包括5'剪切区(5'clip),│
│ │5'非翻译区(5'UTR),编码序列(CDS,外显子),间插序列 │
│ │(内含子),3'非翻译区(3'UTR)和3'剪切区(3'clip) │
├─────────┼───────────────────────────┤
│ prim_bind │起始复制,转录或逆转录的非-共价的引物结合位点;包括合│
│ │成的例如PCR引物元件的位点 │
├─────────┼───────────────────────────┤
│ Promoter │参与RNA聚合酶的结合以启动转录的DNA分子区域 │
├─────────┼───────────────────────────┤
│ protein_bind │核酸上非-共价的蛋白质结合位点 │
├─────────┼───────────────────────────┤
│ RBS │核糖体结合位点 │
├─────────┼───────────────────────────┤
│ repeat_region │含有重复单位的基因组区域 │
├─────────┼───────────────────────────┤
│ repeat_unit │单个重复元件 │
├─────────┼───────────────────────────┤
│ rep_origin │复制起点;复制核酸以得到两个相同拷贝的起始位点 │
├─────────┼───────────────────────────┤
│ RRNA │成熟的核糖体RNA;将氨基酸装配成蛋白质的核糖核蛋白颗粒 │
│ │(核糖体)中的RNA成份 │
├─────────┼───────────────────────────┤
│ S_region │免疫球蛋白重链的开关区;它参与重链DNA的重排,导致来自 │
│ │相同B-细胞的不同免疫球蛋白类的表达 │
├─────────┼───────────────────────────┤
│ Satellite │短的基本重复单位的很多串联重复(相同或相关的);大多数具│
│ │有的碱基组成或其它性质与基因组的一般水平不同,这使得它│
│ │们与大部分(主带)的基因组DNA分离开来 │
├─────────┼───────────────────────────┤
│ ScRNA │小的细胞质RNA;几个小的细胞质RNA分子中的任何一个存 │
│ │在于真核生物的细胞质和(有时)核中 │
├─────────┼───────────────────────────┤
│ sig_peptide │信号肽编码序列;被分泌的蛋白质的N-末端结构域的编码序│
│ │列;此结构域涉及新生多肽与膜的结合;前导序列 │
├─────────┼───────────────────────────┤
│ SnRNA │小的核RNA;很多小的RNA种类中的任何一个都被局限于核中;│
│ │几个snRNA参与剪接或其它RNA加工反应 │
├─────────┼───────────────────────────┤
│ source │鉴定序列中特定范围的生物来源;此关键词是强制性的;每一│
│ │项至少要有一个跨越整个序列的单一来源关键词;每个序列可│
│ │允许有一个以上的来源关键词 │
├─────────┼───────────────────────────┤
│ stem_loop │发卡结构;由RNA或DNA单链的相邻(反向)互补序列之间的碱基│
│ │一配对形成的双螺旋区域 │
├─────────┼───────────────────────────┤
│ STS │序列标记位点:表述基因组上作图界标并能通过PCR检测的短 │
│ │的,单拷贝DNA序列;通过测定STS系列的次序即可作出图谱的│
│ │基因组区域 │
├─────────┼───────────────────────────┤
│ TATA_signal │TATA盒;Goldberg-Hogness盒;在每个真核生物RNA聚合酶Ⅱ │
│ │转录单位起点前约25bp处发现的保守的富含AT的七聚体,它可│
│ │能涉及使酶定位以正确地起始;共有序列=TATA(A或T)A( │
│ │A或T) │
├─────────┼───────────────────────────┤
│ terminator │或者位于转录本的末端或者与启动子区域相邻的DNA序列,该 │
│ │序列可导致RNA聚合酶终止转录;也可以是阻抑蛋白的结合位 │
│ │点 │
├─────────┼───────────────────────────┤
│ transit_peptide │转运肽编码序列;核编码的细胞器蛋白质N-末端结构域的编│
│ │码序列;此结构域参与将蛋白质翻译后运送到细胞器中 │
├─────────┼───────────────────────────┤
│ tRNA │成熟的转移RNA,小的RNA分子(75-85个碱基长),介导核酸序│
│ │列翻译成氨基酸序列 │
├─────────┼───────────────────────────┤
│ unsure │作者不能确定此区域的准确序列 │
├─────────┼───────────────────────────┤
│ V_region │免疫球蛋白轻链和重链的可变区,和T-细胞受体α,β和γ│
│ │链;编码可变的氨基末端部分;可由V_segment,D_segment │
│ │N_region和J_segment组成 │
├─────────┼───────────────────────────┤
│ V_segment │免疫球蛋白轻链和重链的可变区段,和T -细胞受体α,β和│
│ │γ链;编码大多数可变区(v_region)和前导肽的最后几个氨基│
│ │酸 │
├─────────┼───────────────────────────┤
│ variation │含有来自相同基因的稳定突变的相关系列(例如RFLP,多态性 │
│ │等),在此(和可能其它)位置处所述相同基因与被表述的不同 │
├─────────┼───────────────────────────┤
│ 3’clip │在加工过程中被切下的前体转录本3'端大部分区域 │
├─────────┼───────────────────────────┤
│ 3’UTP │不被翻译成蛋白质的成熟转录本的3'末端区域(终止密码子之│
│ │后) │
├─────────┼───────────────────────────┤
│ 5’clip │在加工过程中被切下的前体转录本5'端大部分区域 │
├─────────┼───────────────────────────┤
│ 5’UTP │不被翻译成蛋白质的成熟转录本的5'末端区域(起始密码子之│
│ │前) │
├─────────┼───────────────────────────┤
│ _ 10 _signal │Pribnow盒;细菌转录单位起点上游约10bp处的保守区域,它 │
│ │可能参与结合RNA聚合酶;共有序列=TatAaT │
├─────────┼───────────────────────────┤
│ _ 35 _signal │细菌转录单位起点上游约35bp处的保守六聚体;共有序列 │
│ │=TTGACa[]或TGTTGACA[] │
└─────────┴───────────────────────────┘
┌────────┬─────────────────────────┐
│ 关键词 │ 说明 │
├────────┼─────────────────────────┤
│CONFLICT │不同的论文报道了不同的序列 │
├────────┼─────────────────────────┤
│VARIANT │作者报道存在序列变体 │
├────────┼─────────────────────────┤
│VARSLIC │由可选择的剪接产生的序列变体的表述 │
├────────┼─────────────────────────┤
│MUTAGEN │经实验操作已改变的位点 │
├────────┼─────────────────────────┤
│MOD_RES │残基的翻译后修饰 │
├────────┼─────────────────────────┤
│ACETYLATION │N-末端或其它 │
├────────┼─────────────────────────┤
│AMIDATION │通常位于成熟的活性肽的C-末端 │
├────────┼─────────────────────────┤
│BLOCKED │不能被测定的N-或C-末端封闭基团 │
├────────┼─────────────────────────┤
│FORMYLATION │N-末端甲硫氨酸的 │
├────────┼─────────────────────────┤
│GAMMA-CARBOXY- │天冬酰胺,天冬氨酸,脯氨酸或赖氨酸的 │
│GLUTAMIC ACID │ │
│HYDROXYLATION │ │
├────────┼─────────────────────────┤
│METHYLATION │通常为赖氨酸或精氨酸的 │
├────────┼─────────────────────────┤
│PHOSPHORYLATION │丝氨酸,苏氨酸,酪氨酸,天冬氨酸或组氨酸的 │
├────────┼─────────────────────────┤
│PYRROLIDONE │已形成内部环内酰胺的N-末端谷氨酸 │
│CARBOXYLICACID │ │
├────────┼─────────────────────────┤
│SULFATATION │通常为酪氨酸的 │
├────────┼─────────────────────────┤
│LIPID │脂质组成成分的共价结合 │
├────────┼─────────────────────────┤
│MYRISTATE │通过酰胺键与蛋白质成熟形式的N-末端甘氨酸残基或内 │
│ │部的赖氨酸残基结合的豆蔻酸基团 │
├────────┼─────────────────────────┤
│PALMITATE │通过硫酯键与半胱氨酸残基或通过酯键与丝氨酸或苏氨酸│
│ │残基结合的棕榈酸基团 │
├────────┼─────────────────────────┤
│FARNESYL │通过硫酯键与半胱氨酸残基结合的法尼基 │
├────────┼─────────────────────────┤
│GERANYL-GERANYL │通过硫酯键与半胱氨酸残基结合的香叶基-香叶基基团 │
├────────┼─────────────────────────┤
│GPI_ANCHOR │与蛋白质成熟形式C-末端残基的α-羧基相连的糖基-│
│ │磷脂酰肌醇(GPI)基团 │
├────────┼─────────────────────────┤
│N_ACYL │原核生物脂蛋白成熟形式的N-末端半胱氨酸,所述脂蛋 │
│DIGLYCERIDE │白具有酰胺-键联的脂肪酸和通过酯键连接了两个脂肪酸│
│ │的甘油基 │
├────────┼─────────────────────────┤
│DISULFID │二硫键;“FROM”和“TO”终点表示通过一个链-内二硫│
│ │键连接的两个残基;如果“FROM”和“TO”终点是完全相│
│ │同的,则二硫键是链-间键,而说明书领域示出交联的性│
│ │质 │
├────────┼─────────────────────────┤
│THIOLEST │硫醇酯键;“FROM”和“TO”终点表示通过硫醇酯键连接│
│ │的两个残基 │
├────────┼─────────────────────────┤
│THIOETH │硫醚键;“FROM”和“TO”终点表示通过硫醚键连接的两│
│ │个残基 │
├────────┼─────────────────────────┤
│CARBOHYD │糖基化位点;碳水化物(如果已知)的性质在说明书领域│
│ │给出 │
├────────┼─────────────────────────┤
│METAL │金属离子的结合位点;说明书领域示出金属的性质 │
├────────┼─────────────────────────┤
│BINDING │任何化学基团(辅酶,辅基,等等)的结合位点;基团的│
│ │化学性质在说明书领域给出 │
├────────┼─────────────────────────┤
│SIGNAL │信号序列的范围(前肽) │
├────────┼─────────────────────────┤
│TRANSIT │运转肽的范围(线粒体,叶绿体或微体) │
├────────┼─────────────────────────┤
│PROPEP │前肽的范围 │
├────────┼─────────────────────────┤
│CHAIN │成熟蛋白质中多肽链的范围 │
├────────┼─────────────────────────┤
│PEPTIDE │被释放的活性肽的范围 │
├────────┼─────────────────────────┤
│DOMAIN │序列中感兴趣的区域的范围;所述区域的特征在说明书领│
│ │域给出 │
├────────┼─────────────────────────┤
│CA_BIND │钙-结合区域的范围 │
├────────┼─────────────────────────┤
│DNA_BIND │DNA--结合区域的范围 │
├────────┼─────────────────────────┤
│NP_BIND │核苷酸磷酸酯结合区域;核苷酸磷酸酯的特征示于说明书│
│ │领域 │
├────────┼─────────────────────────┤
│TRANSMEM │转膜区域的范围 │
├────────┼─────────────────────────┤
│ZN_FING │锌指区域的范围 │
├────────┼─────────────────────────┤
│SIMILAR │与另一个蛋白质序列具有相似性的区域;与那个序列有关│
│ │的精确的资料在说明书领域给出 │
├────────┼─────────────────────────┤
│REPEAT │内部序列重复的范围 │
├────────┼─────────────────────────┤
│HELIX │二级结构;螺旋,例如α-螺旋,3(10)螺旋,或Pi- │
│ │螺旋 │
├────────┼─────────────────────────┤
│STRAND │二级结构;β-链,例如氢键连接的β-链,或分离的β│
│ │-桥中的残基 │
├────────┼─────────────────────────┤
│TURN │二级结构转角,例如H-键连的转角(3-转角,4-转│
│ │角或5-转角) │
├────────┼─────────────────────────┤
│ACT_SITE │涉及酶活性的氨基酸 │
├────────┼─────────────────────────┤
│SITE │序列中任何其它感兴趣的位点 │
├────────┼─────────────────────────┤
│INIT_MET │已知序列以起始密码子甲硫氨酸开始 │
├────────┼─────────────────────────┤
│NON_TER │序列末端的残基不是末端残基;如果应用于位置1,这表│
│ │示第一个位置不是完整分子的N-末端;如果应用于最后│
│ │一个位置,这表示此位置不是完整分子的C-末端;对此│
│ │关键词没有说明书领域 │
├────────┼─────────────────────────┤
│NON_CONS │非连串残基;表示序列中的两个残基不是连串的,在它们│
│ │之间有很多末测序的残基 │
├────────┼─────────────────────────┤
│UNSURE │序列的不确定性;用于表述不能确定序列排列的序列区域│
└────────┴─────────────────────────┘
附录2: 序列表样例