标签:正是 模态 合作 编码 auto 多模态 功能 多层 获得
在智能家居中应用人工智能技术,需要构建承载人工智能算法的家庭AI系统。家庭AI系统用以实现两类家庭任务:
(1)家庭设备的控制任务。
这类任务需要系统通过分析用户使用数据,按照用户习惯自动控制家庭内部设备、或调整家庭内环境状态。例如Nest温控器,按照用户习惯控制房间温度,并且兼顾节能。
(2)家庭状态的监测任务。
这类任务需要系统通过分析家庭数据、推理家庭事件,并自动做出评估、匹配相关的家庭外部服务。例如分析空巢老人的健康数据,判断老人的健康状态等。
家庭AI系统为人们提供更为舒适的家庭环境和良好的城市服务。但是,如何分配人和系统的功能是个有趣的问题。目前,智能家居的控制可以分为:人工控制和监督控制。人工控制是通过人在控制终端上操作完成的,例如在平板上操作空调,通过墙上的触摸开关控制背景音乐的播放等。监督控制是智能家居系统自动完成某项操作,并把该部分告知他的主人。
【例6-1】 某智能家居系统的监督控制。早上定时打开电动窗帘,布防之后有人闯入短信报警等。 |
监督控制又可分为设定条件控制和自动学习控制。设定条件控制动作的触发是事先设定好的。自动学习控制是控制器利用人工智能技术根据主人的习惯或者喜好,自动学习设备的运行模式,并在适当的条件下自动发出控制指令。
【例6-2】 某智能家居系统的监督控制自动学习控制。知道主人晚上七点准时收看新闻联播,则在主人在的时候准时打开电视。检测到主人每天早上7点起床,这一习惯很规律,如果哪天7点没有起床,则向相关人员发送信息等。 |
那么在智能家居系统设计中,人工控制和监督控制如何分配,即自动化程度需要多高?目前人工智能的伦理正在建立,还没有形成体系,但按照人因工程的理论,分配可参照以下策略:
(3)强制分配。
有些控制必须是人要参与的,例如取消安防设备报警、利用可视对讲为楼下的访客开门等。这些动作的执行必须由使用者发出。另外强制分配还应考虑系统设计者和使用者之间的法律层面的问题。有些操作从法律层面,动作的发出者必须是人,例如自动拨打报警电话等。
(4)价值平衡。
在家庭中有些任务人完成更有优势,有些机器完成更具有优势。那么任务的分配就发挥各自的优势。例如,做饭,当前阶段肯定是人的水平要高于设备,那么就由人来完成;洗衣服,洗衣机的工作大部分能够令人满意,因此由洗衣机来完成。
(5)情感和认知支持分配。
这一条准则意识到了人类的独特需求。情感支持指人们的情感需要,例如,在某些情况下,人们时常能感觉到做家务的乐趣,这也是人们家庭生活的组成。认知支持指人员对信息的需要,以便为行动做好准备或做出可能的决策。例如,在检测到燃气泄漏时,不仅应该立即关闭阀门,而且应该及时告知主人,并由主人检查处理。
以上分配不是绝对的,随着家庭AI系统知识库越来越丰富,实现某些功能的成本和效果比人更好,人工控制则有可能转换为监督控制。
1)深度学习
深度学习最早由Hinton等人于2006年提出,深度学习的本质就是人工神经网络,指多层神经网络上运用各种机器学习算法解决图像、文本等各种问题的算法集合。深度学习的核心是特征学习,旨在通过分层网络获取分层次的特征信息,从而解决以往需要人工设计特征的重要难题。深度学习是一个框架,包含多个重要算法:
l Convolutional Neural Networks(CNN)卷积神经网络
l AutoEncoder自动编码器
l Sparse Coding稀疏编码
l Restricted Boltzmann Machine(RBM)限制波尔兹曼机
l Deep Belief Networks(DBN)深信度网络
l Recurrent neural Network(RNN)多层反馈循环神经网络
对于不同问题(图像、语音、文本),需要选用不同网络模型才能达到最好效果。此外,最近几年增强学习(Reinforcement Learning)与深度学习的结合也创造了许多了不起的成果,AlphaGo就是其中之一。深度学习从概念提出到现在,也已经有14年了,已经应用于诸多领域。
(1)人脸识别。
图像识别是深度学习领域最受青睐的应用方向,无论是深度学习,还是其他机器学习方法(如VM即向量机),都非常喜欢用图像识别来进行研究。正是因为如此,ImageNet大赛应运而生,ImageNet通过建立强大的图片库,来邀请各大人工智能研究者前来检验其算法的效果,促进了这一领域的蓬勃发展,也导致今天人工智能领域,人脸识别几乎是最为成熟的应用。
(2)语音识别。
从2009年深度学习被引入语音识别领域,短短几年时间内,其在TIMIT数据集上基于传统的混合高斯模型(GMM)的错误率就从21.7%下降到17.9%,引起业界的广泛关注。谷歌的GoogleNow、苹果的Siri、微软的Skype Translator、科大讯飞等都是基于深度学习的算法。语音识别目前发展得很好,在国内有些方言都可以非常精准的识别了,属于成熟应用。
(3)自然语言处理。
自然语言处理(NLP)是通过构建计算算法自动分析、表征人类自然语言的一个学科领域。自然语言处理有五大主要任务,分别是分类、匹配、翻译、结构预测和序贯决策过程。自然语言处理中的大多数问题都可以形式化地归到这五个任务中。在这些任务中,单词、短语、句子、段落甚至文档通常被视为一系列标记(字符串)进行处理,尽管它们的复杂性不尽相同。但是实际上,句子是使用最广泛的处理单元。最近研究表明,深度学习可以提高前四项任务的性能,并成为了解决这些任务的最先进技术。如今,基于NLP的系统已经实现广泛应用,例如Google强大的搜索引擎、亚马逊的语音助手Alexa。此外,NLP还可以帮助机器执行和复杂的自然语言有关的任务,例如机器翻译和对话生成。
2) 智能空间
智能空间(Smart Space)理论用来计算家庭内部用户需求,用以匹配家庭外部服务。智能空间是嵌入了计算、信息设备和多模态的传感装置的工作或生活空间,具有自然便捷的交互接口,以帮助人们方便地获得计算机系统(或智能家居系统)的服务。NIST(美国国家技术标准研究院)给出的智能空间具备的功能和为用户提供的服务包括:
(1)能识别和感知用户以及他们的动作和目的,理解和预测用户在完成任务过程中的需求;
(2)用户能方便地与各种信息源(包括设备和数据)进行交互;
(3)用户携带的移动设备可以无缝地与智能空间的基础设施进行交互;
(4)提供丰富的信息显示;
(5)提供对发生在智能空间中的经历的记录,以便在以后检索回放;
(6)支持空间中多人的协同工作以及与远程用户的沉浸式的协同工作。
智能空间的发展经历了以下几个阶段:
首先,处于计算环境中的计算设备不再像在桌面计算模式下一样,要求用户端坐在计算机前或者处于某个固定位置才能完成计算任务。大量的计算设备、多模态交互技术模块、情景感知(context awareness)模块被嵌入并隐藏在实际的物理环境中,这些模块需要能互相协作并能主动为用户提供服务,使得智能空间能拥有立体、连续的交互通道。例如,一个智能书房能检测到用户在其内阅读书籍,它可能会打开窗帘来为用户提供足够的照明;随着时间的推移,夜幕降临,智能书房还可能根据当前的光照条件,逐渐加强房间中的灯光照明。
其次,智能空间的一个重要特性称为游牧服务(cyber foraging)。它是指用户携带入空间的无线手持设备可以充分利用其周围基础设施中的相对较强的设备的能力,同时其上运行的模块也可以与空间中的其他模块进行交互和协作,以共同为用户提供增强的服务。这也是信息空间与物理空间融合的一个体现。这种融合使得空间距离对计算的含义与传统分布式计算中正好相反。传统的分布式计算是试图用网络消灭空间距离,而智能空间是强调找到离用户最近的各种资源和服务。反过来,基础设施也应该能够利用用户所携带的移动设备的功能,为用户提供个性化或者增强的服务。例如,当用户甲在一个智能会议室开会时,系统检查到乙给甲发了一个重要的E-mail,并希望甲马上能阅读其内容。智能会议室则应该根据当前的情景(在开会)以及甲所携带的移动设备(手机或者PDA)做出判断,将此E-mail转发到手机上,并通过震动提醒甲,而不是通过会议室的大屏幕显示出来。而如果只是甲单独待在智能会议室,该E-mail则可经由声音提示,显示在大屏幕上。
3 家庭智能化模型
3.1 Agent技术
Agent和多Agent技术起源于分布式人工智能研究,自20 世纪70年代出现以来得到迅速发展,目前已经成为一种进行复杂系统分析与模拟的思想方法与工具。Agent是指驻留在某一环境下,能持续自主地发挥作用,具备驻留性、反应性、社会性、主动性等特征的计算实体。
多Agent系统是一种全新的分布式计算技术,由在一个环境中交互的多个Agent组成。多Agent系统也能被用在解决分离的Agent以及单层系统难以解决的问题上。智能可以由一些方法、函数、过程、搜索算法或加强学习来实现。多主体系统的研究课题可以提供一个合适的视角去观察网络贸易,灾害应对以及社会结构建模。多Agent具有下列基本特性:
(1)自治性(Autonomy):Agent能根据外界环境的变化,自动地对自己的行为和状态进行调整,而不是仅仅被动地接受外界的刺激,具有自我管理自我调节的能力。
(2)反应性(Reactive):能对外界的刺激做出反应的能力。
(3)主动性(Proactive):对于外界环境的改变,Agent能主动采取行动的能力。
(4)社会性(Social):Agent具有与其他Agent或人进行合作的能力,不同的Agent可根据各自的意图与其他Agent进行交互,以达到解决问题的目的。
(5)进化性:Agent能积累经验或学习知识,并修改自己的行为以适应新环境。
标签:正是 模态 合作 编码 auto 多模态 功能 多层 获得
原文地址:https://www.cnblogs.com/z3286586/p/14837662.html