跨模态人工智能:融合视觉与语言的新趋势
岳泽宇 ( 微软(中国)有限公司 )
https://doi.org/10.37155/2717-5170-0608-57Abstract
随着人工智能技术的飞速发展,单一模态的智能系统已难以满足复杂多变的应用需求。跨模态人工智 能,尤其是视觉与语言的融合,成为当前研究的热点与前沿方向。本文旨在探讨跨模态人工智能中视觉与语言融合的 新趋势,分析其理论基础、关键技术、应用场景及未来发展方向,以期为相关领域的研究与实践提供参考。
Keywords
人工智能;多模态;视觉;语言Full Text
PDFReferences
[1]廖俊淇,魏昕,周亮.人工智能驱动的跨模态语义通信
系统[J/OL].中兴通讯技术,1-12[2024-07-25].
[2]唐昆,李白杨,张心源.基于主客观融合的人工智能跨
模态生成内容质量及效能测度研究[J/OL].情报理论与实
践,1-15[2024-07-25].
[3]吴岸雄,赵嘉凌,黄少伟,等.多模态人工智能数据分
析实验服务平台建设[J].实验室研究与探索,2023,42(04):
188-193.
[4]多模态人工智能正大步走向场景应用新阶段[J].机
床与液压,2022,50(19):147.
系统[J/OL].中兴通讯技术,1-12[2024-07-25].
[2]唐昆,李白杨,张心源.基于主客观融合的人工智能跨
模态生成内容质量及效能测度研究[J/OL].情报理论与实
践,1-15[2024-07-25].
[3]吴岸雄,赵嘉凌,黄少伟,等.多模态人工智能数据分
析实验服务平台建设[J].实验室研究与探索,2023,42(04):
188-193.
[4]多模态人工智能正大步走向场景应用新阶段[J].机
床与液压,2022,50(19):147.
Copyright © 2024 岳泽宇 Publishing time:2024-08-31
This work is licensed under a Creative Commons Attribution 4.0 International License