标签:bit 作者 汽车 ras 地方 分享 htm 转换 line
1.过滤音频中的广告
作者通过机器学习和音频,识别出音频里面的广告,从而可以过滤广播里面的广告,只听节目的部分。也可以分辨谈话和音乐,做到只听音乐。 项目地址在这里:https://github.com/adblockradio/adblockradio
如何进行过滤广告呢?一种方法是监测音频的响度,因为广告通常依赖于声学压缩。这种方法提出了一种有意思的测定标准,在甄别古典音乐与广告中是有效的,但是在流行音乐中就不是非常有效;况且广告现在目的性非常的强,一般不会被这种方式轻易探测到。另一种方法是广告总是关于相同的主题和词汇领域:购买汽车,获得超市优惠券,订阅保险,等等。如果音频可以转换为文字,则可以使用对抗电子邮件垃圾邮件的工具来检测不需要的内容。在语音识别上需要一定的技术,所以这个方法可行但是还得等待考证。第三种方法是将所有听到的广告存到一个数据库中,检测音频流的时候会在数据库中进行相似性查找,从而判断是否为广告,但是这样需要实时更新数据库;所以这里可以利用音频指纹的方法,音频指纹是关于将一些音频特征转换成一系列数字,称为指纹。当实时音频和数据库中的广告样本之间有许多指纹匹配时,我们可以猜到收音机在播放广告。需要进行一些调整才能获得最佳的分辨率和时间和频率范围。必须正确区分不同的音频样本。但几乎相同的音频应该匹配,即使音频编码是不同的,或者如果无线电应用不同的均衡器设置。最后,指纹数量应该保持较小,以免耗尽计算资源。
作者最后使用了机器学习工具,更准确地说是连接到TensorFlow的Keras库。在计算资源较少的情况下,取得了很好的效果。作者把声音转换成一张2d的地图,给出声音的强度随频率和时间的变化(约为4秒)。这张地图在概念上与指纹段落中的红色地图相似。主要的不同之处在于,使用的不是经典的傅立叶谱,而是使用了语音识别上下文中常见的梅尔-频率倒谱系数。在不同的时间戳下,对连续的地图进行分析,就像电影中的图片一样,使用LSTM(长时记忆)递归神经网络。每个映射独立于另一个(无状态RNN)进行分析,但映射相互重叠。地图长达4秒,每秒钟就有一张新地图。每个地图的最终输出是一个Softmax矢量,如广告:72%,Talk:11%,音乐17%。然后对这些预测进行后处理,其方式与以前用声学指纹技术描述的相似。
总结一下是利用机器学习进行判断,再结合数据库的声学指纹进行判断。是一个非常好的思路。
2.电子的轨道
Most popular pictures of the atom are wrong!
电子的运动其实不存在图中那种轨道,所谓电子轨道实际上是电子的能量级,至于电子真正的运行方式,我们并不知道。可以参看这篇文章
3.地球时间线
利用网页展示地球演化的46亿年,如下图所示:
网址在这里:http://timelineofearth.com/
4.Facebook
新闻媒体发现,Facebook 为了找出人与人之间的关系,已经申请了一系列令人意想不到的专利。一个专利是,Facebook 如果检测到两部智能手机在同一个时间同一个地方出现,通过比较每部手机的加速度计和陀螺仪读数,可以确定两个人是面对面还是一起散步。这样的话,Facebook 可能就会推荐给你昨晚在酒吧与你交谈的朋友,而不是没有交谈过的人。
另一个专利是通过用户上传的照片元数据连接两个人。如果不同用户上传的图像,看起来像是同一系列的照片,比如文件名是IMG_4605739.jpg 和 IMG_4605742.jpg,或者如果在照片上的相同位置可以检测到镜头划痕或灰尘,那么可能会假设两个人彼此认识,因为他们使用了同一台相机拍照。
5.利用正弦函数画圣诞树
结果图如下:
原理图如下:
项目地址为https://github.com/anvaka/atree
6.会"爬行"的汽车
为了达到"爬行"这一水平的移动自主,利用如轴和悬挂链条的装置取代原先的车轮,将其安装在机器人的腿。每条腿包括通过综合垂直和水平髋关节的五度运动,一个膝关节,一个踝关节和一个旋转转向关节,旋转方向盘360度围绕一个垂直轴。轮毂电机在轮组中提供推进动力可以实现升降和爬坡 。
在正常的公路驾驶中,腿向内紧贴身体,允许电梯像任何电动汽车一样向前行驶。在这种模式下,采用被动悬架系统来代替缓冲,降低了腿部关节执行器的功率,提高了减震范围和效率。
当遇到超级颠簸的岩石或瓦砾时,改汽车可以用腿的高度和力量做出反应,高高地站着,清除巨大的障碍物,像爬行动物一样爬行,爬到5英尺(1.5米)高的墙壁上,跨过5英尺宽的洞,或将其轨道延伸至15英尺(4.6米)。
标签:bit 作者 汽车 ras 地方 分享 htm 转换 line
原文地址:https://www.cnblogs.com/yunlambert/p/10327120.html