Florence-2 - 微软 Azure AI 团队推出的多功能视觉语言模型

2025-04-10 12:02:26

11人浏览

Florence-2是什么

Florence-2 是微软 Azure AI 团队推出的多功能视觉模型，能执行图像描述、目标检测、视觉定位和图像分割等多种计算机视觉任务。Florence-2 基于 Transformer 架构，用序列到序列学习方法，编码器将图像转换为序列表示，解码器再将表示转换为文本输出。Florence-2 训练使用包含1.26亿张图像和54亿个标注的超大数据集 FLD-5B，结合自动化图像标注技术和模型迭代，确保数据的高质量和多样性。

Florence-2的主要功能

免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，可联系本站进行审核删除。

上一篇：Audio Decomposition - 开源音乐转谱工具，一键将音乐转换为五线谱

下一篇：k0-math - 月之暗面Kimi推出的数学推理模型，对标o1