MusicNet是古典音乐的新数据集,旨在向机器传授作曲,以提高机器的学习,理解和作曲能力。
MusicNet是由华盛顿大学(UW)研究人员创建的大型数据集,用于教授机器古典音乐的结构,旋律和细微差别。 这不是我们第一次向计算机教授音乐,但是希望借助MusicNet,他们可以通过更复杂的学习以新的方式改进技术。
MusicNet的古典音乐数据集是公开可用的,并带有精选的精细注释,使机器可以更深入地了解音乐的创建和播放方式。 研究人员希望借助MusicNet,他们可以推动机器学习的各种要素,例如音符预测,自动音乐转录以及基于音频而不是相关标签的最令人兴奋的建议(在我看来)。
威斯康星大学计算机科学,工程学和统计学副教授Sham Kakade说:“在高层次上,我们对使音乐吸引人的是什么感兴趣,我们如何更好地理解构图,或使巴赫听起来具有本质的本质像巴赫 它还可以帮助实现仍然具有挑战性的实际应用,例如将现场表演自动转录为书面乐谱。”
MusicNet的330个免费许可的古典唱片带有超过一百万个带注释的标签,可精确指示每个音符的时间,精确到毫秒。 标签还可以帮助机器理解使用不同乐器创作歌曲的方式,以及每个音符与其在歌曲结构中位置的关系。

所有标签均已由训练有素的音乐家进行验证,以确保它们准确无误,并为机器提供最精确的信息,以使您获得最佳学习效果。 该数据集的工作方式与ImageNet类似,ImageNet是类似的大型图像数据库,已帮助导致我们今天拥有的计算机算法可以检测人脸,物体,甚至到现在我们拥有可以检测每个物体的自动驾驶汽车他们周围和他们是什么。
威斯康星大学统计助理教授Zaid Harchaoui说:“音乐研究界数十年来一直致力于手工制作复杂的音频功能以进行音乐分析。 我们构建了MusicNet,为研究人员提供了一个带有标签的大型数据集,可自动学习更多富有表现力的音频功能,这些功能具有从根本上改变各种音乐分析任务的最新技术的潜力。”
使用一种称为动态时间扭曲的技术,该技术可以以不同的速度检测相似的音频,从而使机器可以比任何音乐家都更深入地研究音乐。 该项目的主要作者John Thickstun说:“您需要能够在3秒50毫秒至78毫秒之间说出这种乐器正在演奏A。但是,即使是专业音乐家也无法做到这一点,这是不切实际或不可能的。准确性。
“我真的对艺术机会感兴趣。 任何在包括许多现代音乐家在内的计算机的帮助下进行艺术创作的作曲家都可以使用这些工具。 如果机器对他们要做什么有更高的了解,那只会赋予艺术家更多的力量。”
您可以通过访问其网站,找到更多信息,并亲自使用MusicNet的大型古典数据库:homes.cs.washington.edu/~thickstn/musicnet.html