人工智能的技术方向一共有三种
企服解答
目前人工智能的技术方向有:1、计算机视觉——计算机视觉(CV)是指机器感知环境的能力;2、语音识别——语音识别是指识别语音(说出的语言)并将其转换成对应文本的技术;3、机器学习——机器学习(ML)是计算机系统为了有效地执行特定任务,不使用明确的指令,而依赖模式和推理使用的算法和统计模型的科学研究。
1、计算机视觉
计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。物体检测和人脸识别是其比较成功的研究领域。
计算机视觉现已有很多应用,这表明了这类技术的成就,也让我们将其归入到应用阶段。随着深度学习的发展,机器甚至能在特定的案例中实现超越人类的表现。但是,这项技术离社会影响阶段还有一定距离,那要等到机器能在所有场景中都达到人类的同等水平才行(感知其环境的所有相关方面)。
2、语音识别
语音识别是指识别语音(说出的语言)并将其转换成对应文本的技术。相反的任务(文本转语音/TTS)也是这一领域内一个类似的研究主题。
语音识别已经处于应用阶段很长时间了。最近几年,随着大数据和深度学习技术的发展,语音识别进展颇丰,现在已经非常接近社会影响阶段了。
语音识别领域仍然面临着声纹识别和「鸡尾酒会效应」等一些特殊情况的难题。现代语音识别系统严重依赖于云,在离线时可能就无法取得理想的工作效果。
3、机器学习
机器学习(ML)是计算机系统为了有效地执行特定任务,不使用明确的指令,而依赖模式和推理使用的算法和统计模型的科学研究。它被视为人工智能的一个子集。机器学习算法构建一个基于样本数据的数学模型,称为“训练数据”,以便在没有明确编程来执行任务的情况下进行预测或决策。
机器学习算法用于各种应用,例如电子邮件过滤和计算机视觉,在这些应用中,开发用于执行任务的特定指令的算法是不可行的。机器学习与计算统计学密切相关,计算统计学侧重于使用计算机进行预测。算法优化的研究为机器学习领域提供了方法、理论和应用领域。数据挖掘是机器学习中的一个研究领域,侧重于探索性数据分析到无监督学习。在跨业务问题的应用中,机器学习也被称为预测分析。
相关信息
36氪2019年8月22日讯,语音识别自半个世纪前诞生以来,一直处于不温不火的状态,直到 2009 年深度学习技术的长足发展才使得语音识别的精度大大提高,虽然还无法进行无限制领域、无限制人群的应用,但也在大多数场景中提供了一种便利高效的沟通方式。 本篇文章将从技术和产业两个角度来回顾一下语音识别发展的历程和现状,并分析一些未来趋势,希望能帮助更多年轻技术人员了解语音行业,并能产生兴趣投身于这个行业。
36氪2018年10月29日讯,2018年10月,云从科技发布全新Pyramidal-FSMN语音识别模型,错词率(Worderrorrate,WER)降低至2.97%,较之前提升了25%,将全球语音识别准确率纪录提高至97.03%,超过受过严格训练的专业人类速记员。
36氪2021年9月3日讯,人类生产力发展已经进入算力时期,计算能力成为这个时期最强大的新型生产力。在语音识别行业,随着AI技术的不断渗透,技术价值中心也逐渐由软件算法层向核心算力转移。近年来许多人工智能企业也逐渐意识到在数据、算法层的领先无法完全覆盖产业竞争的现实需要,算力大战随之拉开帷幕。某人工智能企业致力于人工智能语音大数据分析,自主研发了声纹识别、语音识别等全栈智能语音技术,为公安、金融、政府、互联网及 IoT 等行业提供“以用户为中心”的语音智能化解决方案。
拓展阅读
渔民之友:Google X 新项目,用计算机视觉养鱼_详细解读_最新资讯_热点事件_36氪 (36kr.com)
什么是胶囊网络,它如何让计算机视觉变得更“灵敏”?_详细解读_最新资讯_热点事件_36氪 (36kr.com)
OpenAI惊现大漏洞,一张手写纸条竟瞒过计算机视觉系统_详细解读_最新资讯_热点事件_36氪 (36kr.com)