小互: 阿里巴巴推出QVQ-72B
一个基于Qwen2-VL-72B的新型多模态推理模型,结合了语言和视觉能力,能进行复杂问题的推理和分析。
QVQ-72B在视觉推理、数学和科学问题上表现出显著提升,特别是在多步推理任务中。
可在物理问题中结合文字和视觉信息推导因果关系。
在数学推理任务(如代数、微积分)中,模型通过分步推理显著减少错误率。
在技术报告、复杂图表分析中提取关键信息的准确率和效率较高。
在精准识别图片中的细节,例如物体位置、颜色、空间关系,以及复杂情景。
----------------------
Wed Dec 25 2024 10:57:38 GMT+0800 (China Standard Time)
via Twitter @小互
一个基于Qwen2-VL-72B的新型多模态推理模型,结合了语言和视觉能力,能进行复杂问题的推理和分析。
QVQ-72B在视觉推理、数学和科学问题上表现出显著提升,特别是在多步推理任务中。
可在物理问题中结合文字和视觉信息推导因果关系。
在数学推理任务(如代数、微积分)中,模型通过分步推理显著减少错误率。
在技术报告、复杂图表分析中提取关键信息的准确率和效率较高。
在精准识别图片中的细节,例如物体位置、颜色、空间关系,以及复杂情景。
----------------------
Wed Dec 25 2024 10:57:38 GMT+0800 (China Standard Time)
via Twitter @小互