欧洲PMC最近开始对预印本进行索引,这很棒,因为我2年前制作PrePubMed的原因是,尽管这些东西正经历指数级增长,但似乎没有人跟踪这些东西,并且一些最好的作品被发布为预印本。
在欧洲PMC的帖子中引起我注意的是这张图片:

此图显示了在bioRxiv和PeerJ Preprints的期刊中预印物发布和发布之间的时间。 引起我注意的部分是消极时期-bioRxiv似乎对此有明确的政策:
- 使YouTube为新闻服务
- 我很焦虑-但我不是唯一的一个
- Blogger成为作者时发生的五件事
- 谢丽尔·克拉克(Cheryl Clarke)的散文,修订本,黑白女性之间的亲密感以及她的新书《我的……》
- 深红出版商视频文章

这项政策似乎很明确,但是我以前曾通过Twitter收到一篇看似违反该政策的文章的警报,我通知了bioRxiv并将其发布在PubPeer。 有人告诉我,由于发布到bioRxiv上的版本不是该期刊上可接受的版本,所以还可以,这似乎没有道理,但我暂时将其保留。
最近,我在Twitter上看到了一个讨论,似乎在重申这一政策:

理查德(Richard)回应某人询问为什么他不能使用最终的,可接受的版本更新其预印本。 理查德的回应似乎没有意义,因为对预印本的更新不会影响与DOI相关的日期,但他至少清楚地表明bioRxiv不需要印本,这就是我解释其政策的方式。
因此,我们回到了欧洲PMC发现的负面时刻。 如果他们的分析正确,那么似乎有许多预印本违反了bioRxiv的政策。
为了进行分析,欧洲PMC使用了Crossref的数据,因此一种可能性是Crossref中的日期不正确。 例如,Crossref中的日期可能是对预印本的修订,而负数时间仅表示发布后发生的修订。 我很感兴趣,自己看看。
我查询了我拥有的所有bioRxiv DOI的Crossref API,并对照我的日期检查了日期。 在大多数情况下,一旦开始每日索引编制,我便拥有第一个版本的日期。 这些也是Crossref拥有的日期。
***我做了一个有趣的观察:bioRxiv允许每个预修订版更改预印本的标题,而Crossref具有第一个版本的日期,而它们似乎具有较新版本的名称。***
因此,Crossref具有bioRxiv预印本的正确日期,但是发布版本的日期可能不正确。 我继续阅读了bioRxiv预印本的发行日期,并手动检查了其中一些。 这个数据看起来也不错。
纵观这些负面时刻,很难不笑一笑。 例如,该预印本是在发布后的两年内发布的(是的,我知道版本的标题和文本是不同的,但是数字基本相同–我不确定版本必须与它们相似被认为是相同的手稿并被链接起来,或者发生这种情况)。

BioRxiv显然已经发现了时间旅行。 有人打电话给《自然》编辑。
更新20180717:
在我的bioRxiv发布更新后的链接的第二天。 如上面的屏幕快照所示,它以前曾到 本文 ,但现在到了 这里 。 Crossref API 尚未反映此更改:

由bioRxiv链接的2017年新文章实际上是一篇引用其2014年文章的评论。 评论的一些数字与2014年的文章相同。 审查指出,他们已获得重新使用这些数字的许可。
该预印本实际上犯下了双重违法行为。 BioRxiv建议仅在一个预印本服务器上过帐,并且该预印本也几乎同时在arXiv上过帐。

那么这有什么大不了的吗? 有一种观点认为,允许在bioRxiv上进行后期打印会为作者提供一种使他们的封闭访问文章成为开放访问的方法。 实际上,OSF预印本似乎不仅允许,而且实际上包含大量印后本。
作为预印本的索引器,尽管我确实感到烦恼,但我正在索引的某些预印本实际上不是预印本。 当人们在PrePubMed上订阅RSS时,他们期望看到的是新的,尚未发表的研究,而不是2、5、10年前发表的著作。 如果预印服务器上充斥着未标记为印后的印后,我不确定人们将如何专门搜索预印。 这就是为什么我不得不放弃索引Figshare预印本的原因-标记为预印本的文章不是预印本。
关于这些印记,还有另一件事令我感到困扰。 从发布时间来看,实际上有很多日期不是负数,但还不到一个月。 似乎人们正在做的事情是,一经接受文件,他们便在多台服务器上发布预印本。 这不仅违反了bioRxiv的政策,而且还是一种对系统的游戏。 预印本应该是要尽早进行研究,但这些研究人员基本上是在发表论文的同时发布预印本,因为我怀疑这会增加观看次数,引文和开放科学业力。
我可以理解为什么很多作者都这样做。 在生物学领域,研究人员害怕被sc窃,一旦一篇文章在期刊上被接受,他们现在就可以安全地被sc窃,因此不妨张贴预印本。
无论如何,我很好奇bioRxiv打算如何违反这些预印本的规定进行处理。 如果他们什么都不做,那似乎就像是公开邀请张贴后印。 尽管他们可能不在乎我是否抱怨索引实际上不是预印本的预印本,但他们可能会在意欧洲PMC是否将其视为问题。
***就其价值而言,不执行其政策的期刊并不是什么新鲜事。 许多期刊都有数据共享政策,作者将其视为加利福尼亚的限速政策。 期刊大概有打击窃的政策,但是一旦发现窃,似乎就无法回复电子邮件了。***
而且,现在预印本已进入大联盟,应该添加一些其他质量控制步骤。 例如,所有这些bioRxiv DOI不在Crossref中,也没有解决(它们都以“ 10.1101 /”开头):
324533、357814、066480、355040、357152、357327、353508、340091、357376、363317、109900、361592、357681、135814、118836、357285、338376、357301、357871、299925、358010、357673、279323、357350、356 121137、342568、358036、357897、365700、165415、358085、351593、086702、347146、357889、356816、363150、357343、357731、357004、357772、341297、357806、356824、355628、357707、361345、357665、355665 358101
PS:PrePubMed中的数据并不完美,有时预印会漏掉裂缝(而这些只是我所知道的)。