2015年6月12日星期五

​药品注册数据纵横分析---数据间内在关联与多层次信息的挖掘(上)

为了便于追踪药品在注册申报以及上市后的各种动态,非常有必要确定一个唯一的标识。目前为止,暂没有一个标识可以涵盖所有的环节。现在比较理想的标识是申报阶段的受理号和上市以后的批准文号,通过这两者联合来实现整个过程的信息追踪。那么这两者之间如何关联呢?咸达数据已经解决了这个难题,在我们的数据库中,用户可以自由的在申报和上市数据间穿梭。


我们首先看下受理号,受理号本身就蕴藏着非常丰富的信息,读懂受理号中隐含的信息是做药品注册入门功夫。这就是受理号中每位字母和数字隐含的信息,我就不细讲了。截止到今年5月份,咸达数据监控的受理号达到了35.8万。最早的受理号可追溯到1996年“HZ96001”,这是百合医药申报的一个中药进口品种,不过最终被毙掉了。

近两年,我们监测到一种新的受理号类型,即第4个字母为T。下面我们看下这类受理号的特点。



这种受理号在14年有13个,15年至今已经有33个了。这类受理号的审评特点是,一、不经过CDE技术审评;二、审评速度快,6-8个月就会给新的批准文号。从目前所批准的文号看,这类品种肯定不是新药,从起批准文号的构成也可以看出来,年份后以3开头。我们以其中一个品种为例,利用咸达的“文号生命历程探秘”数据库检索这个文号。结果如下:



这是沈阳双鹤药业的大输液品种,在下方我们看到这个品种有“前生”,点击就可以看到这个品种是由哪个品种变来的。



原来这个品种来自武汉湖滨双鹤药业,是2002年批准的一个老品种。需要提一点,文号生命历程中的“上市日期”指的是当前这个文号的批准日期,其真正的上市日期,要从其前生里面去找,一直找到没有结果为止,那个最早的批准日期才是这个品种的上市日期。

在这里呢,我们可以看到这个品种随时间发生的一些重要变化,比如生产地址变更、包装变更备案、再注册等等。在最下方,我们看到这个品种还有前生,所以这个2002年的日期不是他的上市日期,仍要向前再去追溯。有兴趣的话,可以到我们的数据库中去查看。



说完了受理号的规律,我们看下批准文号中隐藏着什么信息。这些字母和数字相信大家都是知道的,需要强调的这里的第5位数字,即4位顺序号的第1位。这里除了0以外,还有可能是3或者8,带3的文号比较多,多是仿制药或者换发的文号,前面提到的CYHT类型的受理号对应的文号都是带3的文号,所以当时说它们不是新药;而带8的只是近几年,13年,14年才出现,每年也就5-6个。

截至今年5月份咸达监控的文号有34.2万,其中活着的文号17.4万,包含国产和进口。目前仍存活的最早文号是安康正大的绞股蓝总苷。



接下来,我们再看下这类顺序号以8开头的文号。2014年这类文号,化药有5个,中药有1个。通过在文号生命历程中查询这些文号的前世,可查到这些文号原来都属于其他企业。从这个结果,我们可以推测此处的8代表技术转让。



药检所CDE老师提及05年的时候我们经历过一次比较疯狂的突击申报。06年以后就跌到低谷,包括我们网上说的9·11核查风暴,随着申报能力的提升,报批临床的数据也越来越多了。08年以后报生产的数据维持非常低的一个低谷,如果把05年到07年的这个受理号有多少是退审,有国家局强制毙了的,还有多少通过复审起死回生的,统计一下发现复审的话活过来的确实也没多少个。

下面这张PPT中的图,是2005年至今十年间所有文号的整体分布。这个横坐标是受理号的类型,一共有78种,我们按受理号中第4个字母,将这些受理号分成了申请临床、申请生产、再注册等5个区域;纵坐标是年份,从2005年到2014年,2015年的数据还没有完,看趋势的话,不用考虑2015年的数据;竖坐标是受理号的数量,我们可以看到每年最高的数量在历史上达到了1.6万。

从数量上来看,最多是中药和化药仿制药的补充申请,从2008年开始,每年的申请数量都在10000件以上。这些补充申请多数不需要CDE技术申请,一般是上市以后的品种提交的补充申请备案,涉及药品说明书的修改,包装规格的更改,原料药供应商的更改等等。

对于搞注册的人来说,比较关心的是申请生产和临床的受理号。对于申请生产和临床这两个块区域来说,大部分在2005年以后出现锐减的趋势,同时我们也看到少数几个类别在跌倒低谷以后,数量在逐年增多。下面我们来具体看一下。



这是我国近10年新药的申报情况,左边是申请临床的趋势,右边是申请生产的趋势。图中三种颜色的线分别代表化药、中药和生物制品。首先,我们可以看到,化药的临床申请从2005年的2551件快速下降到2007年的498件,两年间申报数量锐减80%。其后申报临床的数量缓慢上升,直到2012年后才出现快速增长,2014年达到2291件,非常接近历史最高水平。2015年也已经有900多件了,估计今年的申报数量将达到历史最高水平。

再看化药的申报生产情况,在2005年时,有3295件,比当时报临床的数量多50%左右。随后其在2007年降到冰点,这些年来每年的申报数量在300-400件之间,相对平稳。

对于中药的申报情况来说,情况很不乐观,尤其是中药申报生产的情况,从2005年的7790件,一路下降到2014年的38件,下降了200倍。这主要由于政策要求越来越严格,中药新药几乎无法完成上市。

生物制品申报临床的数量没有大的波动,每年平均在几十件左右。近年来显示有微弱的上升趋势。这可能是大家在放弃了中药,又不想与化药扎堆以后,一个比较好的新增长点吧。





看完了新药的申报情况,我们再看下近10年国内仿制药的申报情况。总体的趋势与新药的趋势差不多。化药仿制药在从2005年跌到低谷后,近几年略有上升,但与历史最高水平还差很远。

而对于中药和生物制品的仿制几乎绝迹,有的年份竟然申报数量为0。FDA今年才出台生物仿制药指导原则,因此国内的生物仿制药标准没有那么完善,也可以说不够正规。



咸达数据经过近10年的累积,收集了目前最全的药品身份证信息,可以让您快速全面的分析整个领域的趋势,为您的新药研发决策提供数据支撑。

当然我们不仅是收集数据,更重要的是我们将散乱的数据进行关联与深加工,让其成为一个整体,再加上我们提供的强大检索接口,可以满足大家各种各样变态的检索需求。

比如,对于国内上市的品种来说,除了CFDA国产药品和进口药品中的基本字段以外,我们对属于医保、基药、OTC等品种进行了标记,也增加了每个品种的厂家数、剂型厂家数、规格厂家数,以及企业的文号数量,中药保护品种的数量等,这些字段不仅可以按具体的数量检索,比如输入1就是独家,还可以按范围进行检索,比如1-5,就是检索1至5家以内的品种。不仅我们有强大的检索功能,我们的“随心汇”系列数据库,还提供了强大的汇总功能。任意选择汇总依据,那么后台就会为您把数据汇总好,这个数据是根据我们后台强大的数据库实时统计的,所以您看到的结果永远是最新的统计数字。有了这些统计结果,再加上一些作图技巧,您就可以做出非常出色的图表。

下面我来举例说明一下,如何利用我们数据库的这些特性来帮助大家的工作,给大家提供一点思路,更多的还需要大家到数据库里面去挖掘。

CFDA国产药品中是不含其所在省份的信息的,我们通过大量的人工确认了每个文号所在的省份。根据这一特性,我们就可以方面的实现各省文号数量的实时统计。我们的公众微信号“咸达数据”在去年春节期间出了一系列的各省文号分析文章,数据即来自这里。这里每个圆圈的大小代表文号数量的多少,相同颜色的指文号数量在相同的区间。我们可以看到粉红色的吉林、山东、江苏和广东属于第一梯队,文号数量都在1万左右。筛选出了各省的文号以后,再结合文号的其他特性,就可以实现对各省文号分布的进一步分析。这里我就不再详细展开,大家可以到我们微信号的历史文章中查看我们随心汇的系列文章。



除了标记文号的省份信息,我们还按国际上通用的“解剖学治疗学及化学分类系统”,即ATC治疗领域分类系统,对所有国内上市的品种,进行了标记。因为这个分类方法是针对化药的,中药我们把它当作单独的一类,可进一步结合中药的适应症或功能主治对其进一步分析。

我们来看看化药,在目前有效的16.9万个文号中,有20%属于抗感染类药物,其次是消化道及代谢、神经系统、心血管系统等。这样可让我们对我国的药品形成一个快速直观的认识。这么多抗生素,不滥用那些厂家怎么活啊。





上一张片子是上市后品种的治疗领域分类,如果您想进行项目调研的话,比如想选择哪一类品种进行开发,最接近的是看下目前申报中的品种有哪些,毕竟药品上市以后已经经过了太长的时间。

为了反应研究的热度我们采用药品的通用名(即化学成分)来进行治疗领域分析,这样可以排除不同的剂型数量造成的影响。对于那些中文名字不同的药品,我们都统一为一个唯一的名字,比如“司坦夫定”都统一为“司他夫定”,卡格列净统一为坎格列净。这样保证每一个成份只出现一次。最终我们得到了5000多个通用名。然后根据这些通用名的ATC治疗领域构建了这个网络。这个图中绿色背景的大圆圈代表治疗领域,总共有14个,每个圈中的字母的含义可以看作左边的图例。与打圆圈相连的每个小点代表一个药品通用名,由于有个药品同时属于多个治疗领域,所以就把这14个领域都相互关联起来。绿色圆圈的大小与连在上面的通用名数量有关,数量越多圆圈越大。

这里最大的仍是抗感染类药物,其次是消化道与代谢药物,这个结果与以上市的化药品种差不多。在构建这个网络的时候,我们没有考虑申报的类型,无论是新药还是仿制药,都全部统计在一起,申报的多,自然上市的也多,可以理解。如果,我们把申报的药品限制在某个注册分类,比如3.1类,或1.1类,那么结果又会怎样呢?



这张片子里,我们将申报的品种限定为化药新药临床、3.1类,最终我们筛选了687个药品通用名。

从这张网络看,消化道及代谢领域申报的品种最多,这一块是投入相对少,而适应人群又非常广的一个领域。其次是抗肿瘤药物,这块也是大家抢仿的热点。



当我们把数据限定为化药新药临床1.1类时,这张网络与前面的就有明显不同了。截至目前为止,1.1类临床申请涉及的通用名有279个,其中抗肿瘤药物有109个,占了近2/5。所以大家可以看到,我国的新药研发,即便创新也是扎堆创新。



前面讲的是我们数据库的第二个特点,不是对现有数据的简单罗列,而是对数据进行了深加工,这些新的数据特性将会拓宽药品注册人员的思路,以便在激烈竞争的环境中找到适合本公司发展的产品策略。

接下来,我们简单讲下数据库另一个特点,即咸达数据库涵盖了药品在申报和上市以后所有关键节点的变化,这个应该是注册人员最关心的内容。在日常工作用,注册人员不仅要关心自己品种的进度,还要时刻关心对手品种的进度。利用咸达数据,您的工作将会变得轻松如意。





咸达数据分别按受理号和文号追踪药品申报过程和上市后与该品种相关的信息。

前面我们已经给出了文号生命周期变化的例子,我们按时间轴非常直观的将品种上市后,生产地址变更,说明书变更备案,企业名称变更,技术转让等信息展现出来。下面我们举一个药品申报过程中重要节点变化的例子。

这个品种是深圳微芯生物的西达本胺片,它同时属于特殊审评和重大专项品种,由于其特殊身份,不到两年就获批生产。



这个品种在2013年2月7日申报生产,然后在2013年3月21日资料进入CDE。这段时间我们一般成为承办时间,这个大家都差不多。CDE承办以后到开始技术审评的时间成为“排队时间”,我们看到这个品种的排队时间超级短,仅4个多月。而对于一般的品种,排队几年是非常正常的,这也是大家抱怨的焦点所在。

一旦开始技术审评,后面几个月内就会审完。这个品种在审评过程中有两次补充资料的过程,可能是因为属于小问题吧,厂家邮寄好资料后,马上又开始技术审评,而不是被转到补充序列去重新排队。

因为这个品种属于报生产,通过现场检查利用了约半年时间。总的来说,想这么顺利的品种并不多见,业界听到更多声音还是抱怨审评速度太慢。那么这个速度有多慢呢?我们下面根据咸达数据统计的结果给大家看几张片子。

没有评论:

发表评论