多媒体课(上)

作者: 谢小帅 | 来源:发表于2017-04-10 22:44 被阅读56次

    8周的多媒体课就很快就接近尾声了,今天周一,老师让我们展示自己的成果,春奕姐姐很耐心,把我们的分组信息整理地很好并且打印出来了,然后我们就开始展示了O(∩_∩)O哈哈1-~

    1-Prisma+

    佳泽崔哥组定的题目是《基于深度学习的图片风格迁移系统》,科研味十足,但是成果相当好玩。他们基于简单的Prisma源码,调查了很多论文资料,对源码进行了改进,用前向传播的方式代替了后向传播,大大提高了图片的转化速率,几秒钟就生成了新风格的图片。而且,崔哥做了精美的网站,展示效果非常好。

    我们的图书馆和各种图片风格

    这款神奇的系统几秒钟就能把我们的图书馆转成右边的这些风格。

    波浪风格 美国女孩风格 树叶风格 彩色玻璃风格

    佳泽的演讲非常出色,大家都听得心潮澎湃,津津有味。

    佳泽耐心演讲

    崔哥的网页也做得很有意思,本来系统的根本功能就是图片融合,崔哥就想到了PPAP里面的Apple Pen,非常形象地表达了系统的功能。

    An Apple + A Pen = Apple Pen

    最后佳泽鼓励我们大家热爱计算机,热爱多媒体这个学科,也提醒我们不要把自己局限到码农这个角色,要发扬计算机界的创新精神,去探索这个拥有无限可能的世界。

    2-五线谱生成小乐章

    春奕姐姐的作品很有文艺气息,五线谱生成小乐章,对照曲谱添加音符,然后Play就可以播放了,应用中存储了钢琴音符的声音,只要创造好了乐谱,就可以用这个应用播放出来。

    界面一角

    春奕姐姐自己一个人完成了所有的功能,对项目的每个细节都了如指掌。她展示的时候为我们耐心地讲解了项目的实现原理和难点解决。

    春奕姐姐耐心讲解

    当然,这种模拟与真实场景还是有差距的,黄老师也提到了这个问题。区别在于人弹钢琴的时候可以自由控制两个音符之间的时间间隔,而程序中两个音符的播放时间间隔是由线程睡眠决定的,而这个时间常常是确定的。

    我的提问

    但是这种确定的时间间隔如果处理的好也有用武之地,因为音乐播放的快慢与这个时间间隔密切相关,通过设置不同的时间间隔就可以实现音乐不同流派的转变。间隔小,欢快风;间隔大,轻音乐风。一曲Fade被大家改成了好多版本,这个应用如果加入更多的乐器声音,再可以动态调节声音之间的间隔,就和GarageBand很相似了。

    3-手势识别播放器

    接下来就是我们组的手势播放器了,说来惭愧,整个项目都是天一同学一个人完成的。演示前,我只用了一次,大概了解了项目的功能。我们的应用可以识别人的肤色,通过手势变换完成音乐播放器的简单功能。我们将识别区域分为3*3的九宫格,应用最先识别九宫格中心区域,也就是5号方格,从5左右挪动(5 -> 4,6)实现切歌,从5上下移动(5 -> 2,8)实现音量变大变小。

    课前10min我写了个简短的底稿,关于项目功能和应用场景。

    思路来源于体感游戏

    基于动作识别的切水果小游戏在玩游戏的同时健身

    把动作识别用到音乐做成简单的手势音乐播放器

    目前只做了一点微小的工作

    可以通过动作完成简单的音乐播放器功能

    逐步完善之后,希望可以加到智能家居的范畴中

    当我们工作下班回家往沙发上一躺

    不用任何遥控器就像是施展魔法一样控制我们的智能音乐播放器

    仅仅一个动作就可以完成音乐播放器的操作

    打个响指,音乐就开始播放

    切歌,音量调节啊

    都可以用简单的动作实现

    后期,我们希望这个播放器可以更加智能,可以做到智能创造

    比如  跳一支舞

    我们识别人的舞姿,来根据你的动作 搭配各种乐器

    达到不用任何乐器,只用简单的动作 完成音乐创造

    如果能把人的动作中体现的感情和音乐创造结合起来,就像是自导自演的简单MV一样

    你就是你创造的音乐的主角,在创造音乐的同时完成了自己的MV

    项目展示的时候效果还不错,过了一把发布会的瘾,被大家做成了好多表情包(*≧∪≦)

    场景1 场景2 场景3

    在和天一一起展示项目的时候,操作上的体验还很不好,显得十分滑稽和搞笑,不过功能是实现了的,黄老师也肯定了我们的工程,提的问题天一也都回答上来了,感激不尽。

    4-图片转字符画

    这组的同学将阿笠博士变成了下面的样子。

    字符画阿笠博士

    这场景让我想起了《小林家的龙女仆》OP中的一段情节,字符画格式的康娜酱从小林的Python编译器中飞了出来,然后所有的角色就“螺旋升天”了。

    这组同学说将图片转成字符画的txt文件后,对这些字符进行RC4处理,可以做到图像加密,也是很不错的。但是由于显示的时候一个字符占据的空间要比原图像素点占据的空间大很多,图像做了压缩处理,很多的信息已经丢失了,所以不能完全复原,除非保存了每个像素点的信息,但是又有这样的问题,RGB值范围是0~255,ASCII码中的符号又是有限的,这又涉及到了编码问题,可能要用到双字节编码,总之用不同的符号将RGB值表现出来。

    5-桌面小动画

    这位同学的应用能边放音乐边在桌面撒下雪花或樱花,当飘樱花的时候响起了熟悉的团子大家族,大家都听得很开心。更有意思的是,飘樱花的速度能随着音乐节奏变化,当音乐进行到高潮部分时,桌面的樱花飘落加快,数量也增加了,体验非常好。而且,这位同学提高了桌面应用的优先级,在播放动画的同时还可以点击桌面的图标,不影响操作。

    飘樱花的桌面

    尾声

    这节项目展示课,同学们展示了很多精彩的idea,我觉得这才是大学课堂应该有的样子,同学们有自己的想法并用自己的双手实现出来,并将自己的项目联系到实际场景中去,将知识成果转化为实实在在的生产力,期待在下节课看到更多有趣的东西。

    相关文章

      网友评论

      本文标题:多媒体课(上)

      本文链接:https://www.haomeiwen.com/subject/xyleattx.html