关于数据集的制作,我决定去掉很多不必要的东西,比如和弦,于是我选择了melody部分的旋律。 有了midi文件,我现在要abc序列,所以我要通过midi2abc转换一下文件。 批处理程序效果如下: 文件代码如下: ...
分类:
编程语言 时间:
2017-07-17 12:32:31
阅读次数:
230
总体思想 1 利用符合压缩感知RIP条件的随机感知矩阵对多尺度图像进行降维 2 然后对降维的特征採用简单的朴素贝叶斯进行分类 算法主要流程 1 在t帧的时候,我们採样得到若干张目标(正样本)和背景(负样本)的图像片,然后对他们进行多尺度变换,再通过一个稀疏測量矩阵对多尺度图像特征进行降维,然后通过降 ...
分类:
其他好文 时间:
2017-07-15 19:04:37
阅读次数:
245
ABC格式,是一个音乐标准,ABC Plus Project最新的标准是2.x。 ABC格式的音乐长成这样: 对应的五线谱是这样的: 我找到了一个自动转换的网址(http://colinhume.com/music.aspx),可以图形化地将ABC转成MIDI和五线谱,这证明轮子是存在的,那么我们能 ...
分类:
编程语言 时间:
2017-07-13 18:54:57
阅读次数:
169
在前几天的讨论会上,有师兄指出原来的方法实在是很难训练,所以我改进了音乐生成的思路。 首先,我用LSTM生成的一定是一段音乐的序列化表达,那么我就可以用成型的一些数据集去训练LSTM。为了避免生成的音乐与现有的音乐有大量重复,我们可以考虑更改LSTM使其更加“健忘”,这样应该能解决一部分问题。接下来 ...
分类:
编程语言 时间:
2017-07-12 23:05:35
阅读次数:
305
这个项目主要涉及到两个网络,其中卷积神经网络用来提取图片表达的情绪,提取出一个二维向量。 网络结构如图: 词向量采用预训练的glove模型,d=50,其他信息包括了图片的“空旷程度”、亮度、对比度等信息,用来更好地描述图片特征。 对于图中的卷积神经网络,需要讲解的地方是:卷积核是一个一维卷积核,每一 ...
分类:
编程语言 时间:
2017-07-10 20:46:06
阅读次数:
242
mingus在输出midi文件的时候,使用这样的函数: 在输出时会报错: 解决办法是找到这个文件: ...\Anaconda3\Lib\site-packages\mingus-0.5.2-py3.6.egg 用7-Zip打开这个文件,直接编辑里面的midi_track.py文件: 找到230行,将 ...
分类:
编程语言 时间:
2017-07-10 14:33:17
阅读次数:
814
我之前就注意到,深度学习和音乐结合,尤其是从乐理出发进行结合(而不是纯粹的进行音乐生成),是一个尚未被深度挖掘的全新领域。可想而知,这个方向符合我要求的数据肯定是要自己搜集了。 自己搜集的数据,在量上就已经输了,只是考虑到我们要做的任务并不复杂,准确的说只是一个分类器,再加一个LSTM而已。对于这个 ...
分类:
编程语言 时间:
2017-07-07 13:17:54
阅读次数:
341
今天连看三篇论文,不是很细致地看,也没有具体去实现,只是大概明白了一些新思路。这三篇论文,一篇概述了Decoder-Encoder模型,一篇延伸这个模型,首次提出了Attention机制,最后一篇详细阐述了LSTM和GRU的工作机理。读完之后,我对机器翻译这个领域,还有LSTM的应用,有了更深的认识 ...
分类:
编程语言 时间:
2017-07-07 13:05:50
阅读次数:
291
目前我能想到的办法是这样的: 1,提取照片中的实体特征,借用某个pre-trained model进行tag标记。 2,将特征组合起来,形成一个bag-of-word model,然后将这个向量作为输入。进入CNN。 3,手动对照片贴标签,主要是对情感进行分类(如:安静、快乐,这样可以直观调节旋律) ...
分类:
编程语言 时间:
2017-07-04 13:27:26
阅读次数:
244
角点检测是计算机视觉系统中用来获取图像特征的一种方法。我们都常说,这幅图像很有特点,但是一问他到底有哪些特点,或者这幅图有哪些特征可以让你一下子就识别出该物体,你可能就说不出来了。其实说图像的特征,你可以尝试说一下这幅图有几个矩形啊几个圆形啊,有几条直线啊,当然啦,你也可以说一下有几个角点。 什么是 ...
分类:
其他好文 时间:
2017-06-21 18:24:30
阅读次数:
240