在ChemRxiv上度过了一年的艰辛-撰写本文时,我们已经有近1,000张预印本,并且正在迅速地完成100万篇文章的阅读。 本着似乎正在崛起的年度回顾文章的精神,让我们看一下2018年阅读最多的一些预印本!
注意:由于我们在2017年的大部分时间里都不在,所以我将这些预印本包括在此列表中,但仅基于它们在2018日历年内产生的观点。


由Kim Jelfs及其同事撰写(发表于《计算化学杂志》上)
提出了一种用于超分子材料的自动组装,分子优化和性能计算的工具。 stk是一个模块化,可扩展的开源Python库,提供了简单的Python API并与第三方计算代码集成。 stk当前支持线性聚合物,小型线性低聚物,多种拓扑结构中的有机骨架以及多种框架拓扑结构中的共价有机框架(COF)的构建,但旨在易于扩展到新的,无关的,超分子或新的拓扑结构。 扩展到金属有机框架(MOF),金属环或超分子(如链烷)很简单。 通过与第三方代码集成,stk为用户提供了探索组装的超分子的势能态势,然后计算超分子的结构特征和特性的机会。 stk可一次支持对大批超分子的高通量筛选。 该程序的源代码可以在https://github.com/supramolecular-toolkit/stk找到。


彼得·肯尼(Peter Kenny)
配体效率是药物发现中广泛使用的设计参数。 它是通过按分子大小缩放亲和力来计算的,并且对用于表达亲和力的浓度单位具有非平凡的依赖性,这是由于对数函数无法采用已确定尺寸的参数所致。 因此,对效率的认识随浓度单位的选择而变化,并且认为配体效率度量在物理上没有意义,也不应被视为度量。 通过根据亲和力对分子大小的敏感性来定义效率,可以消除配体效率对浓度单位的依赖性,这可以参考片段到最优化来说明。 提出了用于相对于分子大小归一化亲和力的配体效率的替代方案。 还从理化角度详细检查了小组效率和配合质量。 在整个研究过程中,强调了直接检查亲和力和分子大小之间关系的重要性。


菲尔·巴兰(Phil Baran)及其同事(在美国国家科学院院刊上发表)
基于DNA编码文库(DEL)的发现平台最近已在制药行业广泛采用,这主要是由于其强大的多样性和令人难以置信的分子数量。 自公开以来的过去二十年中,在扩展与该系统的特异含水,稀化和DNA敏感参数兼容的反应模式工具箱方面取得了长足的进步。 但是,通过交叉耦合在DNA上构建高度重要的C(sp3)-C(sp3)链接的方式仍未探索。 在本文中,我们描述了一种通过动力学分析和经验筛选以及从数据挖掘中获取的信息的战术组合将标准有机反应转化为DEL设置的系统方法。 为了举例说明该模型,研究了Giese加成法在DNA上形成高价C–C键的实现,这是DEL中第一个基于自由基的合成。


津田康治及其同事(在ACS中央科学中出版)
这项工作提出了一种在人工智能(AI辅助)化学中进行概念验证的研究,其中基于机器学习的分子生成器与密度泛函理论(DFT)的计算,合成和测量相结合。 尽管基于深度学习的分子生成器已显示出希望,但尚不清楚它们在实际材料开发中的有用程度。 为了评估AI辅助化学的可靠性,我们使用ChemTS分子生成器和DFT仿真器准备了一个平台,并尝试生成其最低激发态处于所需高能级的新型光功能分子。 在12个核上进行的为期10天的测试发现了目标最低激发能级附近的86个潜在光功能分子,分别指定为200、300、400、500和600 nm。 在发现的分子中,合成了六个分子,并确认了五个可以在紫外可见吸收测量中重现DFT预测。 该结果显示了AI辅助化学发现具有适度计算资源的易于合成的新型分子的潜力。


由Ryan Shenvi及其同事(在ACS中央科学中出版)
Salvinorin A(SalA)是一种植物代谢产物,与mu和delta类阿片受体相比,具有高亲和力和高选择性,可激动人的kappa类阿片受体(κ-OR)。 它的治疗潜力激发了广泛的半合成研究和全合成运动。 但是,SalA的结构修饰因其不稳定性而变得复杂,而有效的总合成因其致密,复杂的结构而受挫。 SalA中策略键的动态处理以及依赖于结构微扰的处理使得能够确定有效的逆合成途径。 在这里,我们显示C20的缺失同时稳定了SalA骨架,简化了其合成,并保留了其对κ-OR的高亲和力和选择性。 现在,最终的10步合成打开了SalA支架的深层特性修饰。


通过AlánAspuru-Guzik和同事
自主或“自动驾驶”实验室将机器人平台与人工智能相结合,以提高科学发现的速度。 它们有可能改变我们传统的实验方法。 尽管自治实验室最近受到了越来越多的关注,但通过对软件包进行工程设计而提出的要求通常会阻止其开发。 确实,自治实验室在设计和编写高级而强大的软件包时需要付出大量的努力,以控制,协调和同步自动化仪器,处理数据库并与各种人工智能算法进行交互。 为克服此限制,我们引入了ChemOS,这是一种便携式,模块化且用途广泛的软件包,它提供了运行自主实验室必不可少的结构化层。 此外,它还可以对实验室进行远程控制,提供对分布式计算资源的访问,并包括最新的机器学习方法。 我们相信,ChemOS将减少从自动发现到自动发现的部署时间,并将为科学界提供易于使用的软件包,以更快的速度促进新颖的发现。


大卫·麦克米兰(David MacMillan)及其同事(在《自然》上发表)
在过去的三十年中,在使用钯,铜或镍催化构建sp2 C–N键的方法的开发方面取得了重大进展。 但是,结合烷基底物以形成sp3 C–N键仍然是交叉偶联化学领域的主要挑战之一。 在这里,我们证明铜催化和光氧化还原催化的协同结合可以为解决这一长期挑战提供一个通用平台。 该新颖的交叉偶联系统采用天然丰富的烷基羧酸和可商购的N-亲核试剂作为偶联伙伴,并且适用于多种伯,仲和叔烷基羧酸(通过原位碘鎓活化)。 同时,各种各样的N-亲核试剂,包括N-杂环,酰胺,磺酰胺和苯胺,可以进行C–N偶联,从而在室温和短期内提供良好至优异效率的N-烷基产物( 5分钟到1小时)。 我们还证明了这种C–N偶联方案可应用于具有高区域选择性的带有多种胺的底物以及复杂的药物分子,从而使分子复杂性的快速构建和生物活性药物的后期功能化成为可能。


菲尔·巴兰(Phil Baran)及其同事(《科学》发表)
交叉偶联化学包括用于合成药物,农用化学品和其他功能材料的绝大多数反应。 对单电子诱导的耦合化学的兴趣源于这些方法促进形成具有挑战性的C(sp2)–C(sp3)键的独特能力。 这项工作引入了一个新的官能团PT砜,用于自由基交叉偶联,从而能够以有序,实用的方式简化复杂结构的模块化组装。 对该方法的范围进行了广泛的探索,其战略应用通过简化以前需要多个步骤的药物定向含氟支架的制备,有毒试剂和非模块化逆向合成设计图得以举例说明。 这项工作还导致开发了五种用于快速组装大量结构的试剂,其中许多结构都具有挑战性的氟化模式。


通过AlánAspuru-Guzik和同事
分子发现试图产生针对非常特定需求的化学物种。 在本文中,我们介绍了ORGANIC,这是一个基于目标增强型生成对抗网络(ORGAN)的框架,能够在分子空间上产生与一组所需度量匹配的分布。 这种方法论结合了机器学习社区的两项成功技术:生成对抗性敏感分子的生殖对抗网络(GAN)和将学习生成偏向某些属性的强化学习(RL)。 我们探索了几种应用,从随机理化性质的优化到药物发现和有机光伏材料设计的候选物。


由Hosea Nelson,Brian Stoltz,Jose Rodriguez,Tamir Gonen及其同事(发表于ACS Central Science)
在有机化学推动的许多科学努力中,对小分子的明确鉴定至关重要。 在过去的50年中,已经开发出NMR和其他强大的光谱技术来应对这一挑战。 尽管几乎所有这些技术都依赖于连通性的推断,但是要明确确定小分子的结构,需要进行X射线和/或中子衍射研究。 然而,实际上,由于分析物和技术的固有局限性,x射线晶体学很少用于常规有机化学中。 在这里,我们报告了使用CryoEM方法MicroED来提供常规和明确的有机小分子结构测定的方法。 从简单的粉末中,只需最少的样品制备,我们就可以在几分钟内从纳米晶体(〜100x100x100 nm,〜10-15g)中收集高质量的MicroED数据,从而获得原子分辨率(<1Å)的晶体结构。