专利分析
针对目前已有的治疗性抗体专利多个数据库进行整合,得到与治疗性抗体的序列保护主题靶点相关的目标专利,最终确认的目标专利的抗体序列进行人工提取和整理,建立治疗性抗体专利数据库,并在此基础上进行了专利分析。
由于抗体结构的特殊性,我们分析专利时只需要考虑CDR部分是否侵犯了其它专利,因此我们分析结果的数据都是CDR部分的数据。 目前的搜集的专利所包含的靶点有:PD1、TIGIT、OX40、BCMA、CLDN18、CD123、CD3、HER3、PDL1、CD47、CD40、DLL3、TIM3、TROP2、LAG3、SIGLEC15等,所有专利均包含这些靶点的所有抗体序列,包含已上市、临床阶段、在研等等,目前涵盖了如LENS、SOOPAT、ESPACENET等数据库收集的专利。
结果解读:
如下图所示,通常我们会得到如下表格,从左至右每列分别为:
Name:抗体的名字。
AverageDiff:此平均数是重链和轻链总的与专利CDR不同氨基酸所占百分比的平均值,即假设CDR重链与轻链的总长度为20个氨基酸,其中只有2个氨基酸与专利的CDR的氨基酸不一样,则此值为2/20=10%。
HchainDiff:单独分析重链与专利不同氨基酸所占百分比。
LchainDiff:单独分析轻链与专利不同氨基酸所占百分比。
由此结果我们可以得出,数值越大、与专利就越不一样、其专利空间就越多!
点击每个抗体的链接后,我们会进入到更加细节的部分。从左至右每列依次为:
AverageDiff:此平均数是重链和轻链与专利不同氨基酸所占百分比的平均值。
Name:即为输入的抗体名称。
HchainDiff:单独分析重链与专利不同氨基酸所占百分比。
LchainDiff:单独分析轻链与专利不同氨基酸所占百分比。
Hcdr1Diff:其中百分数是重链CDR1部分比对中不同氨基酸的比例,括号中(1\10)带表此CDR1部分一共有10个氨基酸,与专利不同的氨基酸个数为1个。
Hcdr2Diff:同上。
Hcdr3Diff:同上。
Lcdr1Diff:其中百分数是轻链CDR1部分比对中不同氨基酸的比例,括号中(1\10)带表此CDR1部分一共有10个氨基酸,与专利不同的氨基酸个数为1个。
Lcdr2Diff:同上。
Lcdr3Diff:同上。
Hsimilar:此列写着重链最相似的专利号与序列号,比如US20150190506A1_12,其中US20150190506A1为专利号,12为此专利的序列号即第12条序列。
Lsimilar:此列写着轻链最相似的专利号与序列号。
点击重链或轻链相似专利链接后,我们会进入到序列比对部分。如下图所示:
在与专利中最相似的序列的比对结果中:标红颜色的是CDR1部分,蓝颜色是CDR2部分,绿颜色是CDR3部分。重链与轻链都是相同的标注方式。