码迷,mamicode.com
首页 >  
搜索关键字:多模态    ( 29个结果
AI云服务
多模态特征提取:目前尤其是90后,在对话当中经常使用表情图、动态图等方式来表达情感,而将这些非语言信息的语义提取并翻译出来,就是多模态提取的任务了。比如今年KDD Cup的一道赛题就是“多模态商品推荐”, 其中多模态商品推荐指的是关联融合视频、图片、文本等多模态用户数据,并结合用户的购买习惯、浏览序 ...
分类:其他好文   时间:2020-07-26 00:19:13    阅读次数:77
2020智源-京东多模态对话挑战赛开战 产学研联合推动AI技术发展
人机对话系统是自然语言理解领域重要的研究方向之一,图灵测试的核心就是人机多轮交互。目前的人机对话系统局限于语音和文本的交互方式,然而近些年随着语音助手、虚拟数字人、智能服务机器人的普及应用,兼备“视听说”的多模态对话系统,已在零售、客服、金融、媒体、教育、旅游等诸多领域变得越来越重要。 为推动跨模态 ...
分类:其他好文   时间:2020-05-31 10:47:06    阅读次数:131
多模态 图像压缩 相关文献综述
相关文献综述 Liu J, Wang S, Urtasun R. DSIC: Deep Stereo Image Compression[C]//Proceedings of the IEEE International Conference on Computer Vision. 2019: 31 ...
分类:其他好文   时间:2020-05-01 01:26:01    阅读次数:105
【华为云技术分享】云图说|华为HiLens:端云协同多模态AI开发应用平台
在场景智能化背景下,端侧自身算力有限、开发技能困难,从云侧下发技能到端侧,端侧兼容性差,部署技能困难。 华为云提供端云协同多模态AI开发应用平台——华为HiLens,提供简单易用的开发框架,、开箱即用的开发环境、丰富的AI技能市场和云上管理平台,对接多种端侧计算设备,支持视觉及听觉AI应用开发、AI ...
分类:其他好文   时间:2020-03-19 13:58:11    阅读次数:89
【华为云技术分享】多模态融合算法——Multimodal Compact Bilinear Pooling
【摘要】 很多多模态任务,都需要融合两个模态的特征。特征融合即输入两个模态的特征向量,输出融合后的向量。最常用的方法是拼接(concatenation)、按位乘(element-wise product)、按位加(element-wise sum)。MCB的作者认为这些简单的操作效果不如外积(out ...
分类:编程语言   时间:2020-03-19 13:41:04    阅读次数:108
多模态智能信息检索技术设计及分类模型设计
一、多模态智能信息检索技术设计1.设计检索的框架流程,设计检索评估方法完成的任务:用户搜索“苹果”,在限定性语境中,如何做到用户是需要找“苹果手机”,而不是水果“苹果”系统输入:一个关键词 输出:同输入词相关的若干词汇(可能是用户需要的敏感词汇)预计出现的问题: 1)输出相似或相关词汇由于模型的误判 ...
分类:其他好文   时间:2020-02-14 18:53:47    阅读次数:102
MUNIT:Multimodal Unsupervised Image-to-Image Translation - 1 - 论文学习,不成对数据
摘要:无监督图像转换是计算机视觉领域中一个重要而又具有挑战性的问题。给定源域中的一幅图像,目标是学习目标域中对应图像的条件分布,而不需要看到任何对应图像对的例子。虽然这种条件分布本质上是多模态的,但现有的方法做了过度简化的假设,将其建模为确定性的一对一映射。因此,它们无法从给定的源域映像生成不同的输 ...
分类:其他好文   时间:2019-11-28 18:59:02    阅读次数:285
2019年,该怎样去系统学习大数据,知识+内容+教程
大数据作为2019年比较热门的技术,受到越来越多的关注,那么对于一个想进入大数据的朋友来说,最想知道的是:大数据学什么?今天科多大数据就和你们一起来分享一篇关于大数据学习内容体系介绍的文章。大数据技术体系太庞杂了,基础技术覆盖数据采集、数据预处理、分布式存储、NOSQL数据库、多模式计算(批处理、在线处理、实时流处理、内存处理)、多模态计算(图像、文本、视频、音频)、数据仓库、数据挖掘、机器学习、
分类:其他好文   时间:2019-09-16 16:18:53    阅读次数:103
Deep Captioning with Multimodal Recurrent Neural Networks ( m-RNN )
作者提出了一种多模态循环神经网络(AlexNet / VGGNet +多模式层+ RNN),用CNN提取图像特征,单词经过两层词输入到RNN中,最后将单词特征,图像特征,以及RNN的hidden一起输入到多模态层,经过Softmax生成下一个词的概率分布。RNN主要是为了保存句子前面的特征。 加入两 ...
分类:Web程序   时间:2019-08-18 19:56:35    阅读次数:161
Face-anti-spoofing实验记录
https://sites.google.com/qq.com/chalearnfacespoofingattackdete/contest-details 数据集官方获取网站 网友总结 https://blog.csdn.net/baidu_40840693/article/details/890 ...
分类:其他好文   时间:2019-07-23 12:51:50    阅读次数:429
29条   上一页 1 2 3 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!