美文网首页MIR和音频算法
Paper Note|10.1016/j.sigpro.2009

Paper Note|10.1016/j.sigpro.2009

作者: shanyi15 | 来源:发表于2021-10-24 23:55 被阅读0次

Info

Event based transcription system for polyphonic piano music

Summary

写完笔记之后最后填,概述文章的内容,以后查阅笔记的时候先看这一段。
注:写文章summary切记需要通过自己的思考,用自己的语言描述。忌讳直接Ctrl + c原文。

Research Objective(s)

主要还是改进复调音频transcript的算法

Background / Problem Statement

研究的背景以及问题陈述:作者需要解决的问题是什么?

本文工作灵感来自于G. Poliner等于2007年发表的a discriminative model for polyphonic piano transcription,在G. Poliner的文章中提出了一种用支持向量机来做transcript的方法。
但本文作者认为这种方法存在缺陷,因为这种方法在逐帧采样时没有考虑起始点采样,会导致在定义起始点的位置时出现问题。此外,基于窗采样的分类,其准确度没有参考价值。

注:

  • onset是指每个音的attack,不是一段音乐的开端

Method(s)

作者提出的算法

作者提出了一种新的复调音乐的transcript技术,或者认为是一种系统,该系统由

  • 开始检测算法(可以高精度的检测起始音)
  • 识别和起始音相对应的每个music event
  • 音符偏移检测:note offset detection

这三个子模块实现,具体的过程是先用开始检测算法定位音乐开始的地方,再基于SVM和CQT进行特征提取,然后再对SVM的输出结果进行逐帧的检查,就完成了note offset detection。

没看懂的地方

  • note offset detection的意义是什么?

Evaluation

作者如何评估自己的方法?实验的setup是什么样的?感兴趣实验数据和结果有哪些?有没有问题或者可以借鉴的地方?

和作者参考的文章使用相同的数据集,但是由于二者对“准确度”的定义不太一样,所以在本文中使用的是“以事件为基础的评估”(an event basis)。

Conclusion

作者给出了哪些结论?哪些是strong conclusions, 哪些又是weak的conclusions(即作者并没有通过实验提供evidence,只在discussion中提到;或实验的数据并没有给出充分的evidence)?

本文中所提出的算法得到了不错的效果,但缺点是耗时比较大

Notes(optional)

不在以上列表中,但需要特别记录的笔记。

References(optional)

列出相关性高的文献,以便之后可以继续track下去。

相关文章

网友评论

    本文标题:Paper Note|10.1016/j.sigpro.2009

    本文链接:https://www.haomeiwen.com/subject/eqcraltx.html