日前百度网盘方面宣布,在原有图搜功能的基础上推出基于AI的高级图搜功能。据官方公布的相关信息显示,为克服以往采用的标签搜索的方法无法全面描述图片内容和特征的局限,百度网盘高级图搜功能采用了基于向量的语义搜索技术。具体而言,通过基于向量的语义搜索,百度网盘当下能够理解包含时间、地点、人物、事件等多个要素的组合搜索语句,因此可以提供相对更准确、更全面的搜索结果,帮助用户快速找到上万张照片和视频。
据了解,这种搜索方式的机制是百度网盘中的所有照片会被编码为一组特征向量,同时用户在搜索时输入的文本信息也会被转换为一组特征向量。随后,这两组向量会被映射到同一语义向量空间进行比较,如果图片向量和文本向量之间的距离越近,图片和文本的相似度就越高,该图片就越可能是用户想找的那张。
同时得益于采用了百度自研的融合了场景图知识的多模态预训练文心・CV大模型VIMER-ViLP,来解决语义匹配问题,百度网盘高级图搜功能可以搜索的内容也非常广,覆盖人物、风景、动物、地标建筑等类别。目前通过百度网盘高级图搜功能,用户输入“带有形容词的名词”、“地名”、“物体名称”、“图片中包含的文字”等信息,即可快速查找到需要的图片。
为了提高搜索速度,百度网盘方面还从三个方面进行了优化。其一是充分利用“云上算力大、本地设备延时小”的特征,让云端服务器和用户手机各自承担自己擅长的任务;其二是尽可能压缩本地索引大小,进一步减少用户设备需要承载的计算量,减少电量消耗和手机发热的情况;其三是开发了一套异构算力调度系统,以便统一管理CPU、GPU等异构资源的调度,充分利用闲置资源,从而尽可能快地覆盖更多搜索人群。
此外值得一提的是,除文本搜图外,百度网盘方面还宣布,已支持OCR识图和以图搜图功能,并可自动关联百度百科信息和全网信息,从而“大大扩展了信息检索的维度”,以及“让用户能够更深入地了解图片背后的故事”。
【以上内容转自“三易生活网”,不代表本网站观点。如需转载请取得三易生活网许可,如有侵权请联系删除。】
延伸阅读:
- 百度网盘“云一朵”启动内测,基于文心大模型打造
- 百度发布AI大底座,在自动驾驶、生命科学领域实现技术创新
未经允许不得转载:头条今日_全国热点资讯网(头条才是今日你关心的) » 百度网盘近日宣布,推出基于AI的高级图搜功能